
000 | 00000cam c2200205 c 4500 | |
001 | 000045956829 | |
005 | 20181010134502 | |
007 | ta | |
008 | 181008s2018 ggkd b 001c kor | |
020 | ▼a 9791158081898 ▼g 93310 | |
035 | ▼a (KERIS)BIB000014831107 | |
040 | ▼a 222001 ▼c 222001 ▼d 211009 | |
082 | 0 4 | ▼a 519.50285 ▼2 23 |
085 | ▼a 519.50285 ▼2 DDCK | |
090 | ▼a 519.50285 ▼b 2018z7 | |
100 | 1 | ▼a 허명회 ▼g 許明會 |
245 | 1 0 | ▼a 데이터 과학 입문과 토픽 = ▼x Data science : introduction and topics / ▼d 허명회 지음 |
260 | ▼a 파주 : ▼b 자유아카데미, ▼c 2018 | |
300 | ▼a v, 200 p. : ▼b 도표 ; ▼c 26 cm | |
504 | ▼a 참고문헌과 색인수록 | |
945 | ▼a KLPA |
Holdings Information
No. | Location | Call Number | Accession No. | Availability | Due Date | Make a Reservation | Service |
---|---|---|---|---|---|---|---|
No. 1 | Location Science & Engineering Library/Sci-Info(Stacks1)/ | Call Number 519.50285 2018z7 | Accession No. 121246144 | Availability Available | Due Date | Make a Reservation | Service |
Contents information
Book Introduction
입문 편에서는 데이터 탐색과 통계적 추론의 기초, 회귀 와 분류의 선형모형, 나무 모형과 랜덤 포레스트, 군집화를 다루었다. 입문편을 학습하기 위해선 별다른 통계학적 준비가 필요하진 않다. 걸리는 부분이 있는 곳은 살짝 건너뛰어도 지장이 없을 것이다. 다만, R 프로그래밍에 대한 준비가 어느 정도 되어 있음을 전제하였다.
2부 토픽 편은 저자의 응용데이터분석 (Applied Data Analysis Using R; 자유아카데미, 2014)의 증보분이다. 신경망 neuralnet, 일반화선형모형의 정형화 glmnet, 변수군집화 ClustOfVar, 가우스 혼합모형 mclust, 사회네트워크의 중심인물 key player, G 부스팅 XGBoost 등의 새 토픽을 넣었다. 따라서 토픽 편은 정규학습서라기보다는 필요한 경우 찾아 공부하는 참고서다.
이 책은 통계학 이외 전공자들을 위한 《데이터 과학》 학습서입니다.
데이터 과학을 제대로 학습하기 위해서는 시작점인 통계학 기초부터 최종 응용인 통계적 모형에 이르기까지를 단계별로 밟는 것이 원칙적이긴 한데 많은 시간과 큰 노력이 요구됩니다. 새로운 학습자들은 타 분야 전공자들이기 쉽기에 그런 정통 경로를 요구하는 것은 무리입니다. 이에 100쪽으로 전체를 훑어볼 수 있도록 1부 입문 편을 썼습니다. 입문 편에서는 데이터 탐색과 통계적 추론의 기초, 회귀 와 분류의 선형모형, 나무 모형과 랜덤 포레스트, 군집화를 다루었습니다. 입문편을 학습하기 위해선 별다른 통계학적 준비가 필요하진 않습니다. 걸리는 부분이 있는 곳은 살짝 건너뛰어도 지장이 없을 것입니다. 다만, R 프로그래밍에 대한 준비가 어느 정도 되어 있음을 전제하였습니다. 필요하다면 저자의 R 프로그래밍(자유아카데미, 2017)을 공부하세요.
2부 토픽 편은 저자의 응용데이터분석 (Applied Data Analysis Using R; 자유아카데미, 2014)의 증보분입니다. 신경망 neuralnet, 일반화선형모형의 정형화 glmnet, 변수군집화 ClustOfVar, 가우스 혼합모형 mclust, 사회네트워크의 중심인물 key player, G 부스팅 XGBoost 등의 새 토픽을 넣었습니다. 따라서 토픽 편은 정규학습서라기보다는 필요한 경우 찾아 공부하는 참고서입니다. 1부와 2부는 문체도 다릅니다. 기술적 난도가 어느 정도 있으니 1부 학습을 마치고 곧바로 2부에 가는 것은 무리입니다. 시일을 묵힌 뒤에 필요한 경우 골라서 공부하세요.
데이터 과학에 뛰어든 여러분들이 아무쪼록 이 책으로 도움을 얻기를 바랍니다.
이 책에 쓰인 R 스크립트와 데이터 파일은 출판사 사이트에서 내려 받을 수 있습니다(http://www.freeaca.com/). 문제가 있는 경우 제게 e-메일로 요청하세요.
Information Provided By: :

Author Introduction
Table of Contents
1부 입문 편 1장 수치형 데이터의 탐색 2장 변수변환 3장 범주형 데이터의 탐색 4장 통계적 추론 5장 회귀모형 6장 분류모형 7장 나무 분류 및 회귀 8장 군집화 2부 토픽 편 9장 신경망 “neuralnet” 10장 일반화선형모형의 정형화 “glmnet” 11장 변수 군집화 “ClustOfVar”과 “ClustVarLV” 12장 가우스 혼합모형 “mclust” 13장 사회네트워크에서 중심인물 “keyplayer” 14장 G 부스팅 “xgboost”