000 | 00000cam c2200205 c 4500 | |
001 | 000046006810 | |
005 | 20191122115357 | |
007 | ta | |
008 | 191119s2019 ulkad b 000c kor | |
020 | ▼a 9791161753362 ▼g 93000 | |
035 | ▼a (KERIS)BIB000015397363 | |
040 | ▼a 241026 ▼c 241026 ▼d 211009 | |
041 | 1 | ▼a kor ▼h eng |
082 | 0 4 | ▼a 519.50285536 ▼2 23 |
085 | ▼a 519.50285 ▼2 DDCK | |
090 | ▼a 519.50285 ▼b 2019z16 | |
100 | 1 | ▼a Templ, Matthias |
245 | 1 0 | ▼a R 시뮬레이션 : ▼b 빅데이터와 샘플 데이터를 연결하다 / ▼d 마티아스 템플 지음 ; ▼e 김재민 옮김 |
246 | 1 9 | ▼a Simulation for data science with R : ▼b harness actionable insights from your data with computational statistics and simulations using R |
260 | ▼a 서울 : ▼b 에이콘, ▼c 2019 | |
300 | ▼a 489 p. : ▼b 삽화, 도표 ; ▼c 24 cm | |
440 | 0 0 | ▼a 에이콘 데이터 과학 시리즈 |
504 | ▼a 참고문헌과 색인수록 | |
650 | 0 | ▼a R (Computer program language) |
650 | 0 | ▼a Data mining |
650 | 0 | ▼a Information visualization |
700 | 1 | ▼a 김재민, ▼e 역 |
900 | 1 0 | ▼a 템플, 마티아스, ▼e 저 |
945 | ▼a KLPA |
소장정보
No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
---|---|---|---|---|---|---|---|
No. 1 | 소장처 과학도서관/Sci-Info(1층서고)/ | 청구기호 519.50285 2019z16 | 등록번호 121251037 | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
컨텐츠정보
책소개
수학공식을 최소화해서 시뮬레이션 기초 이론을 설명하고 다양한 시뮬레이션 방법을 책에서 제시된 R 코딩을 따라 하면서 이해할 수 있도록 구성됐다. 책을 다 읽고 난 후에는 여러분이 진행하는 프로젝트에서 높은 신뢰성을 가진 결과를 제시하도록 어떻게 시뮬레이션을 적용할 것인지 흥미롭게 고민하고 R에서 과감히 실현해 볼 수 있을 것이다.
석사 또는 박사 과정에서 공부한 경험이 있다면 대게 샘플 데이터를 이용해서 모집단을 추정하고 예측하는 전통적 연구 방법에 익숙할 것이다. 샘플 데이터로 분석한다는 것은 많은 가정이 요구되는 작업이기도 하며 샘플 데이터의 질에 따라 예측 결과가 달라지기도 하지만, 시간과 돈이라는 현실적인 한계 앞에서 계속해서 데이터만 모을 수도 없는 노릇이다. 전통적 샘플링-추론 방식에 익숙한 분들에게 시뮬레이션이라는 용어는 어쩌면 항공기 모의실험실이나 기상관측 연구소에서나 사용되는 것으로 자신과는 동떨어진 작업이라고 생각할 수도 있다. 하지만 학위과정에서 해결해야 하는 연구과제, 시장분석이나 정치환경과 같은 사회조사, 그리고 샘플이 부족한 연구 환경에서 시뮬레이션 기법은 훌륭한 해결책이 될 수 있다. 이 책은 수학공식을 최소화해서 시뮬레이션 기초 이론을 설명하고 다양한 시뮬레이션 방법을 책에서 제시된 R 코딩을 따라 하면서 이해할 수 있도록 구성됐다. 책을 다 읽고 난 후에는 여러분이 진행하는 프로젝트에서 높은 신뢰성을 가진 결과를 제시하도록 어떻게 시뮬레이션을 적용할 것인지 흥미롭게 고민하고 R에서 과감히 실현해 볼 수 있을 것이다.
★ 이 책에서 다루는 내용 ★
■ 데이터에서 통찰력을 이끌어 내기 위한 데이터 시뮬레이션과 리샘플링
■ 고성능 컴퓨팅과 고도의 데이터 처리 방법 등 R의 고급 기능
■ 분포, 데이터, 집단 시뮬레이션에 사용하는 난수 시뮬레이션
■ 에이전트 기반 마이크로시뮬레이션과 모델 및 디자인 기반 시뮬레이션을 기준으로 현실과 가까운 데이터 시뮬레이션
■ 과학적이며 현실적인 문제를 해결할 수 있도록 R을 사용한 통계 솔루션
■ boot, simPop, VIM, data.table, dplyr, cvTools, deSolve 등 다양한 R 패키지 이해
■ R만을 사용한 난수 생성 방법 및 시뮬레이션 예제와 실행 방법
★ 이 책의 대상 독자 ★
전산 방법론과 R에 익숙한 사용자를 위한 책이다. 컴퓨터 기반 몬테카를로 방법과 통계 시뮬레이션 도구로 R의 고급 기능을 배워보고 싶다면 이 책은 여러분의 것이다.
★ 이 책의 구성 ★
1장 '서론'에서는 데이터 과학과 통계 분야에서 사용되는 시뮬레이션 실험의 일반적인 목적인 "시뮬레이션은 왜 필요하며, 어디에 적용되는가?"라는 질문에 답을 하고, 빅데이터를 다루는 특별한 케이스를 논의한다.
2장 'R과 고성능 컴퓨팅'에서는 R을 이용해 할 수 있는 고급 컴퓨팅, 데이터 전처리, 시각화 작업을 종합적으로 다룬다.
3장 '연필 기반 이론과 데이터 기반 전산 솔루션의 불일치'에서는 결정론적 환경에서 발생할 수 있는 수치 정확성, 반올림, 수렴과 관련된 이슈를 다룬다.
4장 '난수 시뮬레이션'에서는 균등 난수 시뮬레이션과 여러 종류의 분산으로 전환하기 위한 변형 방법으로 시작해 다양한 종류의 마르코프 체인 몬테카를로 난수 생성 방법을 논의한다.
5장 '최적화 문제를 위한 몬테카를로 기법'에서는 결정론적 최적화 방법과 확률론적 최적화 방법을 소개한다.
6장 '시뮬레이션으로 보는 확률 이론'에서는 통계학에서 필요한 기본 이론에 집중한다. 예로는 대수의 법칙 그리고 중심극한정리가 시뮬레이션을 통해 소개된다.
7장 '리샘플링 방법'에서는 부트스트랩, 잭나이프, 교차 타당성 검증을 종합적으로 설명한다.
8장 '리샘플링 방법과 몬테카를로 테스트의 적용'에서는 회귀 분석, 대체(imputation), 시계열 분석 등 다양한 분야에서 사용할 수 있는 적용 방법을 제시한다. 추가로, 몬테카를로 테스트와 함께 순열 테스트 및 부트스트랩 같은 변형된 형태를 소개한다.
9장 'EM 알고리즘'에서는 반복을 통해 최적값을 얻는 기대 극대화법을 소개한다. 누락값을 묶고 대체하는 애플리케이션을 제시한다.
10장 '복합 데이터로 하는 시뮬레이션'에서는 일반적으로 방법 간 비교를 위해 사용되고 에이전트 기반 마이크로시뮬레이션의 투입 데이터로 활용될 인구 데이터와 합성 데이터를 시뮬레이션하는 방법을 소개한다.
11장 '시스템 다이내믹스와 에이전트 기반 모델'에서는 에이전트 기반 마이크로시뮬레이션 모델을 논의하고 복잡한 변화 시스템을 공부하기 위해 시스템 다이내믹스에서 사용되는 기본 모델을 제시한다.
정보제공 :

저자소개
마티아스 템플(지은이)
오스트리아 비엔나 공과대학교 경제학과 소속 통계수학 방법론 연구소 부교수로 재직 중이다. 오스트리아 통계국의 방법론 학자로 활동하고 있으며, 두 명의 동료 연구자와 함께 파트너십 형태로 데이터 분석data-analysis OG를 운영 중이다. 주요 연구 분야는 대체(imputation), 응답자 정보의 통계적 노출 통제, 시각화, 구성 데이터 분석, 전산통계, 통계적 강건성, 다변량 방법론 등이다. 유명 과학저널에 45편 이상의 논문을 게재했으며, 누락값 시각화와 대체를 위한 패키지인 VIM, 합성 집단 시뮬레이션 패키지 simPop, 구성 데이터 강건 분석 패키지 robCompositions 등 여러 패키지의 저자이자 관리자로도 활동하고 있다. 대중들이 무료로 볼 수 있는 「Austrian Journal of Statistics」의 편집장이기도 하다. 여가시간에는 산 정상에서 그를 만날 가능성이 매우 크다.
김재민(옮긴이)
미국 미시건주 오클랜드대학교 비즈니스스쿨 경영학과 조교수로 재직 중이다. 학부생과 MBA 학생들을 대상으로 경영전략을 강의하고 있으며 경영전략과 데이터 분석의 교집합을 다루는 마케팅과 비즈니스 전략을 위한 데이터 분석도 강의하고 있다. 경영전략 및 기업의 사회적 책임과 관련된 연구로 「Journal of Business Research」, 「Entrepreneurship Theory & Practice」, 「Journal of Business Ethics」, 「Organization & Environment」 등에 다수의 논문을 실었다. 최근 연구에 자연어 처리를 위한 머신러닝을 분석 방법으로 활용하고 있으며, 10년 이상 개인 블로그(https//blog.naver.com/ibuyworld)에서 연구와 영어 강의에 관한 생각을 공유하고 있다.

목차
1장. 서론 __시뮬레이션이란 무엇이며, 어디에 적용되는가? __왜 시뮬레이션을 사용하는가? __시뮬레이션과 빅데이터 __올바른 시뮬레이션 방법 선택하기 __요약 __참고문헌 2장. R과 고성능 컴퓨팅 __R 통계 환경 ____R 기초 ____R에 대한 아주 기본적인 내용들 ____설치 및 업데이트 ____help ____R 작업공간 및 작업 디렉토리 ____데이터 유형 ____누락값 __일반 함수, 메소드, 클래스 __R에서의 데이터 전처리 ____apply와 기본 R의 친구들 ____패키지 dplyr로 하는 기본 데이터 전처리 ____패키지 data.table을 이용한 데이터 전처리 __고성능 컴퓨팅 ____코딩에서 계산 속도가 느린 함수를 찾기 위한 분석법 ____병렬 컴퓨팅 ____C++ 인터페이스 __정보 시각화 ____R의 그래픽 시스템 ____graphics 패키지 ____ggplot2 패키지 __참고문헌 3장. 연필 기반 이론과 데이터 기반 전산 솔루션의 불일치 __기계 수 반올림 문제 ____예제: 수를 64비트 형식으로 나타내기 ____결정론적 케이스에서 수렴 ____예제: 수렴 __문제의 상태 __요약 __참고문헌 4장. 난수 시뮬레이션 __진성난수 __의사난수 시뮬레이션 ____합동 생성기 ____선형 합동 생성기 및 승산 합동 생성기 ____지연 피보나치 수열 생성기 ____그 밖의 의사난수 생성기 __비균등하게 분포되는 임의 변수 시뮬레이션 ____역함수 변환 방법 ____에일리어스 방법 또는 대체법 ____로그 선형 모델을 이용한 테이블상의 빈도수 추정 ____기각 샘플링 ____절단 분포 ____메트로폴리스-헤이스팅스 알고리즘 ____깁스 샘플링 ____MCMC 샘플 진단 __난수 테스트 ____난수 평가: 테스트 예제 __요약 __참고문헌 5장. 최적화 문제를 위한 몬테카를로 기법 __수치 최적화 ____경사 상승/하강 탐색 방법 ____뉴턴-라프슨 방법 ____범용성을 가진 최적화 방법들 __확률적 최적화 다루기 ____간편한 절차(스타트렉, 스페이스볼, 스페이스볼 프린세스) ____메트로폴리스-헤이스팅스 분석 기법 다시 보기 ____경사 기반 확률 최적화 __요약 __참고문헌 6장. 시뮬레이션으로 보는 확률 이론 __확률 이론에 대한 기본 내용 __확률 분포 ____이산 확률 분포 ____연속 확률 분포 __복권 당첨 __대수의 약법칙 ____황제펭귄과 여러분의 상사 __중심극한정리 __추정량의 속성 ____추정량의 속성 ____신뢰구간 ____강건 추정량에 대한 고찰 __요약 __참고문헌 7장. 리샘플링 방법 __부트스트랩 ____오즈비에 대한 흥미로운 예제 ____부트스트랩이 작동하는 이유 ____부트스트랩 자세히 살펴보기 ____플러그인 원칙 __부트스트랩으로 표준오차 추정 ____부트스트랩을 이용한 복잡 추정의 예 __모수 부트스트랩 __부트스트랩으로 편향 추정하기 ____부트스트랩으로 구하는 신뢰구간 __잭나이프 ____잭나이프의 단점 ____관측치 d개가 제거된 잭나이프 ____부트스트랩 후 잭나이프 __교차 검증 ____고전 선형 회귀 모델 ____교차 검증의 기본 개념 ____고전적 교차 검증: 70/30 방법 ____LOO 교차 검증 ____k배 교차 검증 __요약 __참고문헌 8장. 리샘플링 방법과 몬테카를로 테스트의 적용 __회귀 분석에서의 부트스트랩 ____부트스트랩을 사용해야 하는 동기 __누락값을 포함한 적절한 분산 추정 __시계열 분석에서 부트스트랩하기 __복합 샘플링 디자인에서 사용되는 부트스트랩 __몬테카를로 테스트 ____흥미로운 예제 ____몬테카를로 테스트의 특별한 종류인 순열 테스트 ____복수의 그룹에 대한 몬테카를로 테스트 ____부트스트랩을 사용한 가설 테스트 ____다변량 정규성 테스트 ____몬테카를로 테스트 크기의 적합성 ____검증력 비교 __요약 __참고문헌 9장. EM 알고리즘 381 __기본 EM 알고리즘 ____전제 조건 ____EM 알고리즘의 공식적 정의 ____EM 알고리즘을 이해하기 위한 간단한 예 __k 평균 클러스터링 예로 보는 EM 알고리즘 __누락값 대체를 위한 EM 알고리즘 __요약 __참고문헌 10장. 복합 데이터로 하는 시뮬레이션 __다양한 종류의 시뮬레이션 및 소프트웨어 __복합 모델을 사용해 데이터 시뮬레이션하기 ____모델 기반의 간단한 예제 ____혼합 데이터를 가진 모델 기반 예제 ____데이터를 시뮬레이션하기 위한 모델 기반 접근법 ____고차원 데이터를 시뮬레이션하는 예제 ____클러스터 또는 계층구조의 유한 모집단 시뮬레이션하기 __모델 기반 시뮬레이션 연구 ____잠재 모델 예제 ____모델 기반 시뮬레이션의 간단한 예제 ____모델 기반 시뮬레이션 연구 __디자인 기반 시뮬레이션 ____복합 설문조사 데이터의 예 ____합성 모집단 시뮬레이션 ____관심 있는 추정량 ____샘플링 디자인 정의하기 ____층화 샘플링 사용하기 ____오염 추가 ____다른 영역에 대해 별도의 시뮬레이션 실행 __누락값 삽입 __요약 __참고문헌 11장. 시스템 다이내믹스와 에이전트 기반 모델 __에이전트 기반 모델 __사랑과 증오의 역동성 __생태 모델링의 다이내믹 시스템 __요약 __참고문헌