HOME > 상세정보

상세정보

R 시뮬레이션 : 빅데이터와 샘플 데이터를 연결하다 (15회 대출)

자료유형
단행본
개인저자
Templ, Matthias 김재민, 역
서명 / 저자사항
R 시뮬레이션 : 빅데이터와 샘플 데이터를 연결하다 / 마티아스 템플 지음 ; 김재민 옮김
발행사항
서울 :   에이콘,   2019  
형태사항
489 p. : 삽화, 도표 ; 24 cm
총서사항
에이콘 데이터 과학 시리즈
원표제
Simulation for data science with R : harness actionable insights from your data with computational statistics and simulations using R
ISBN
9791161753362
서지주기
참고문헌과 색인수록
일반주제명
R (Computer program language) Data mining Information visualization
000 00000cam c2200205 c 4500
001 000046006810
005 20191122115357
007 ta
008 191119s2019 ulkad b 000c kor
020 ▼a 9791161753362 ▼g 93000
035 ▼a (KERIS)BIB000015397363
040 ▼a 241026 ▼c 241026 ▼d 211009
041 1 ▼a kor ▼h eng
082 0 4 ▼a 519.50285536 ▼2 23
085 ▼a 519.50285 ▼2 DDCK
090 ▼a 519.50285 ▼b 2019z16
100 1 ▼a Templ, Matthias
245 1 0 ▼a R 시뮬레이션 : ▼b 빅데이터와 샘플 데이터를 연결하다 / ▼d 마티아스 템플 지음 ; ▼e 김재민 옮김
246 1 9 ▼a Simulation for data science with R : ▼b harness actionable insights from your data with computational statistics and simulations using R
260 ▼a 서울 : ▼b 에이콘, ▼c 2019
300 ▼a 489 p. : ▼b 삽화, 도표 ; ▼c 24 cm
440 0 0 ▼a 에이콘 데이터 과학 시리즈
504 ▼a 참고문헌과 색인수록
650 0 ▼a R (Computer program language)
650 0 ▼a Data mining
650 0 ▼a Information visualization
700 1 ▼a 김재민, ▼e
900 1 0 ▼a 템플, 마티아스, ▼e
945 ▼a KLPA

소장정보

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 519.50285 2019z16 등록번호 121251037 도서상태 대출가능 반납예정일 예약 서비스 B M

컨텐츠정보

책소개

수학공식을 최소화해서 시뮬레이션 기초 이론을 설명하고 다양한 시뮬레이션 방법을 책에서 제시된 R 코딩을 따라 하면서 이해할 수 있도록 구성됐다. 책을 다 읽고 난 후에는 여러분이 진행하는 프로젝트에서 높은 신뢰성을 가진 결과를 제시하도록 어떻게 시뮬레이션을 적용할 것인지 흥미롭게 고민하고 R에서 과감히 실현해 볼 수 있을 것이다.

석사 또는 박사 과정에서 공부한 경험이 있다면 대게 샘플 데이터를 이용해서 모집단을 추정하고 예측하는 전통적 연구 방법에 익숙할 것이다. 샘플 데이터로 분석한다는 것은 많은 가정이 요구되는 작업이기도 하며 샘플 데이터의 질에 따라 예측 결과가 달라지기도 하지만, 시간과 돈이라는 현실적인 한계 앞에서 계속해서 데이터만 모을 수도 없는 노릇이다. 전통적 샘플링-추론 방식에 익숙한 분들에게 시뮬레이션이라는 용어는 어쩌면 항공기 모의실험실이나 기상관측 연구소에서나 사용되는 것으로 자신과는 동떨어진 작업이라고 생각할 수도 있다. 하지만 학위과정에서 해결해야 하는 연구과제, 시장분석이나 정치환경과 같은 사회조사, 그리고 샘플이 부족한 연구 환경에서 시뮬레이션 기법은 훌륭한 해결책이 될 수 있다. 이 책은 수학공식을 최소화해서 시뮬레이션 기초 이론을 설명하고 다양한 시뮬레이션 방법을 책에서 제시된 R 코딩을 따라 하면서 이해할 수 있도록 구성됐다. 책을 다 읽고 난 후에는 여러분이 진행하는 프로젝트에서 높은 신뢰성을 가진 결과를 제시하도록 어떻게 시뮬레이션을 적용할 것인지 흥미롭게 고민하고 R에서 과감히 실현해 볼 수 있을 것이다.

★ 이 책에서 다루는 내용 ★

■ 데이터에서 통찰력을 이끌어 내기 위한 데이터 시뮬레이션과 리샘플링
■ 고성능 컴퓨팅과 고도의 데이터 처리 방법 등 R의 고급 기능
■ 분포, 데이터, 집단 시뮬레이션에 사용하는 난수 시뮬레이션
■ 에이전트 기반 마이크로시뮬레이션과 모델 및 디자인 기반 시뮬레이션을 기준으로 현실과 가까운 데이터 시뮬레이션
■ 과학적이며 현실적인 문제를 해결할 수 있도록 R을 사용한 통계 솔루션
■ boot, simPop, VIM, data.table, dplyr, cvTools, deSolve 등 다양한 R 패키지 이해
■ R만을 사용한 난수 생성 방법 및 시뮬레이션 예제와 실행 방법

★ 이 책의 대상 독자 ★

전산 방법론과 R에 익숙한 사용자를 위한 책이다. 컴퓨터 기반 몬테카를로 방법과 통계 시뮬레이션 도구로 R의 고급 기능을 배워보고 싶다면 이 책은 여러분의 것이다.

★ 이 책의 구성 ★

1장 '서론'에서는 데이터 과학과 통계 분야에서 사용되는 시뮬레이션 실험의 일반적인 목적인 "시뮬레이션은 왜 필요하며, 어디에 적용되는가?"라는 질문에 답을 하고, 빅데이터를 다루는 특별한 케이스를 논의한다.
2장 'R과 고성능 컴퓨팅'에서는 R을 이용해 할 수 있는 고급 컴퓨팅, 데이터 전처리, 시각화 작업을 종합적으로 다룬다.
3장 '연필 기반 이론과 데이터 기반 전산 솔루션의 불일치'에서는 결정론적 환경에서 발생할 수 있는 수치 정확성, 반올림, 수렴과 관련된 이슈를 다룬다.
4장 '난수 시뮬레이션'에서는 균등 난수 시뮬레이션과 여러 종류의 분산으로 전환하기 위한 변형 방법으로 시작해 다양한 종류의 마르코프 체인 몬테카를로 난수 생성 방법을 논의한다.
5장 '최적화 문제를 위한 몬테카를로 기법'에서는 결정론적 최적화 방법과 확률론적 최적화 방법을 소개한다.
6장 '시뮬레이션으로 보는 확률 이론'에서는 통계학에서 필요한 기본 이론에 집중한다. 예로는 대수의 법칙 그리고 중심극한정리가 시뮬레이션을 통해 소개된다.
7장 '리샘플링 방법'에서는 부트스트랩, 잭나이프, 교차 타당성 검증을 종합적으로 설명한다.
8장 '리샘플링 방법과 몬테카를로 테스트의 적용'에서는 회귀 분석, 대체(imputation), 시계열 분석 등 다양한 분야에서 사용할 수 있는 적용 방법을 제시한다. 추가로, 몬테카를로 테스트와 함께 순열 테스트 및 부트스트랩 같은 변형된 형태를 소개한다.
9장 'EM 알고리즘'에서는 반복을 통해 최적값을 얻는 기대 극대화법을 소개한다. 누락값을 묶고 대체하는 애플리케이션을 제시한다.
10장 '복합 데이터로 하는 시뮬레이션'에서는 일반적으로 방법 간 비교를 위해 사용되고 에이전트 기반 마이크로시뮬레이션의 투입 데이터로 활용될 인구 데이터와 합성 데이터를 시뮬레이션하는 방법을 소개한다.
11장 '시스템 다이내믹스와 에이전트 기반 모델'에서는 에이전트 기반 마이크로시뮬레이션 모델을 논의하고 복잡한 변화 시스템을 공부하기 위해 시스템 다이내믹스에서 사용되는 기본 모델을 제시한다.


정보제공 : Aladin

저자소개

마티아스 템플(지은이)

오스트리아 비엔나 공과대학교 경제학과 소속 통계수학 방법론 연구소 부교수로 재직 중이다. 오스트리아 통계국의 방법론 학자로 활동하고 있으며, 두 명의 동료 연구자와 함께 파트너십 형태로 데이터 분석data-analysis OG를 운영 중이다. 주요 연구 분야는 대체(imputation), 응답자 정보의 통계적 노출 통제, 시각화, 구성 데이터 분석, 전산통계, 통계적 강건성, 다변량 방법론 등이다. 유명 과학저널에 45편 이상의 논문을 게재했으며, 누락값 시각화와 대체를 위한 패키지인 VIM, 합성 집단 시뮬레이션 패키지 simPop, 구성 데이터 강건 분석 패키지 robCompositions 등 여러 패키지의 저자이자 관리자로도 활동하고 있다. 대중들이 무료로 볼 수 있는 「Austrian Journal of Statistics」의 편집장이기도 하다. 여가시간에는 산 정상에서 그를 만날 가능성이 매우 크다.

김재민(옮긴이)

미국 미시건주 오클랜드대학교 비즈니스스쿨 경영학과 조교수로 재직 중이다. 학부생과 MBA 학생들을 대상으로 경영전략을 강의하고 있으며 경영전략과 데이터 분석의 교집합을 다루는 마케팅과 비즈니스 전략을 위한 데이터 분석도 강의하고 있다. 경영전략 및 기업의 사회적 책임과 관련된 연구로 「Journal of Business Research」, 「Entrepreneurship Theory & Practice」, 「Journal of Business Ethics」, 「Organization & Environment」 등에 다수의 논문을 실었다. 최근 연구에 자연어 처리를 위한 머신러닝을 분석 방법으로 활용하고 있으며, 10년 이상 개인 블로그(https//blog.naver.com/ibuyworld)에서 연구와 영어 강의에 관한 생각을 공유하고 있다.

정보제공 : Aladin

목차

1장. 서론
__시뮬레이션이란 무엇이며, 어디에 적용되는가?
__왜 시뮬레이션을 사용하는가?
__시뮬레이션과 빅데이터
__올바른 시뮬레이션 방법 선택하기
__요약
__참고문헌

2장. R과 고성능 컴퓨팅
__R 통계 환경
____R 기초
____R에 대한 아주 기본적인 내용들
____설치 및 업데이트
____help
____R 작업공간 및 작업 디렉토리
____데이터 유형
____누락값
__일반 함수, 메소드, 클래스
__R에서의 데이터 전처리
____apply와 기본 R의 친구들
____패키지 dplyr로 하는 기본 데이터 전처리
____패키지 data.table을 이용한 데이터 전처리
__고성능 컴퓨팅
____코딩에서 계산 속도가 느린 함수를 찾기 위한 분석법
____병렬 컴퓨팅
____C++ 인터페이스
__정보 시각화
____R의 그래픽 시스템
____graphics 패키지
____ggplot2 패키지
__참고문헌

3장. 연필 기반 이론과 데이터 기반 전산 솔루션의 불일치
__기계 수 반올림 문제
____예제: 수를 64비트 형식으로 나타내기
____결정론적 케이스에서 수렴
____예제: 수렴
__문제의 상태
__요약
__참고문헌

4장. 난수 시뮬레이션
__진성난수
__의사난수 시뮬레이션
____합동 생성기
____선형 합동 생성기 및 승산 합동 생성기
____지연 피보나치 수열 생성기
____그 밖의 의사난수 생성기
__비균등하게 분포되는 임의 변수 시뮬레이션
____역함수 변환 방법
____에일리어스 방법 또는 대체법
____로그 선형 모델을 이용한 테이블상의 빈도수 추정
____기각 샘플링
____절단 분포
____메트로폴리스-헤이스팅스 알고리즘
____깁스 샘플링
____MCMC 샘플 진단
__난수 테스트
____난수 평가: 테스트 예제
__요약
__참고문헌

5장. 최적화 문제를 위한 몬테카를로 기법
__수치 최적화
____경사 상승/하강 탐색 방법
____뉴턴-라프슨 방법
____범용성을 가진 최적화 방법들
__확률적 최적화 다루기
____간편한 절차(스타트렉, 스페이스볼, 스페이스볼 프린세스)
____메트로폴리스-헤이스팅스 분석 기법 다시 보기
____경사 기반 확률 최적화
__요약
__참고문헌

6장. 시뮬레이션으로 보는 확률 이론
__확률 이론에 대한 기본 내용
__확률 분포
____이산 확률 분포
____연속 확률 분포
__복권 당첨
__대수의 약법칙
____황제펭귄과 여러분의 상사
__중심극한정리
__추정량의 속성
____추정량의 속성
____신뢰구간
____강건 추정량에 대한 고찰
__요약
__참고문헌

7장. 리샘플링 방법
__부트스트랩
____오즈비에 대한 흥미로운 예제
____부트스트랩이 작동하는 이유
____부트스트랩 자세히 살펴보기
____플러그인 원칙
__부트스트랩으로 표준오차 추정
____부트스트랩을 이용한 복잡 추정의 예
__모수 부트스트랩
__부트스트랩으로 편향 추정하기
____부트스트랩으로 구하는 신뢰구간
__잭나이프
____잭나이프의 단점
____관측치 d개가 제거된 잭나이프
____부트스트랩 후 잭나이프
__교차 검증
____고전 선형 회귀 모델
____교차 검증의 기본 개념
____고전적 교차 검증: 70/30 방법
____LOO 교차 검증
____k배 교차 검증
__요약
__참고문헌

8장. 리샘플링 방법과 몬테카를로 테스트의 적용
__회귀 분석에서의 부트스트랩
____부트스트랩을 사용해야 하는 동기
__누락값을 포함한 적절한 분산 추정
__시계열 분석에서 부트스트랩하기
__복합 샘플링 디자인에서 사용되는 부트스트랩
__몬테카를로 테스트
____흥미로운 예제
____몬테카를로 테스트의 특별한 종류인 순열 테스트
____복수의 그룹에 대한 몬테카를로 테스트
____부트스트랩을 사용한 가설 테스트
____다변량 정규성 테스트
____몬테카를로 테스트 크기의 적합성
____검증력 비교
__요약
__참고문헌

9장. EM 알고리즘 381
__기본 EM 알고리즘
____전제 조건
____EM 알고리즘의 공식적 정의
____EM 알고리즘을 이해하기 위한 간단한 예
__k 평균 클러스터링 예로 보는 EM 알고리즘
__누락값 대체를 위한 EM 알고리즘
__요약
__참고문헌

10장. 복합 데이터로 하는 시뮬레이션
__다양한 종류의 시뮬레이션 및 소프트웨어
__복합 모델을 사용해 데이터 시뮬레이션하기
____모델 기반의 간단한 예제
____혼합 데이터를 가진 모델 기반 예제
____데이터를 시뮬레이션하기 위한 모델 기반 접근법
____고차원 데이터를 시뮬레이션하는 예제
____클러스터 또는 계층구조의 유한 모집단 시뮬레이션하기
__모델 기반 시뮬레이션 연구
____잠재 모델 예제
____모델 기반 시뮬레이션의 간단한 예제
____모델 기반 시뮬레이션 연구
__디자인 기반 시뮬레이션
____복합 설문조사 데이터의 예
____합성 모집단 시뮬레이션
____관심 있는 추정량
____샘플링 디자인 정의하기
____층화 샘플링 사용하기
____오염 추가
____다른 영역에 대해 별도의 시뮬레이션 실행
__누락값 삽입
__요약
__참고문헌

11장. 시스템 다이내믹스와 에이전트 기반 모델
__에이전트 기반 모델
__사랑과 증오의 역동성
__생태 모델링의 다이내믹 시스템
__요약
__참고문헌

관련분야 신착자료

박진호 (2023)
민인식 (2023)