HOME > 상세정보

상세정보

데이터 과학을 위한 통계 : 데이터 분석에서 머신러닝까지 50가지 핵심 개념 (33회 대출)

자료유형
단행본
개인저자
Bruce, Peter C., 1953- Bruce, Andrew, 1958-, 저 이준용, 역
서명 / 저자사항
데이터 과학을 위한 통계 : 데이터 분석에서 머신러닝까지 50가지 핵심 개념 / 피터 브루스, 앤드루 브루스 지음 ; 이준용 옮김
발행사항
서울 :   한빛미디어,   2018  
형태사항
327 p. : 도표 ; 24 cm
원표제
Practical statistics for data scientists : 50 essential concepts
ISBN
9791162240984
일반주기
색인수록  
일반주제명
Mathematical analysis --Statistical methods Quantitative research --Statistical methods Big data --Mathematics
000 00000cam c2200205 c 4500
001 000045957501
005 20181018134810
007 ta
008 181018s2018 ulkd 001c kor
020 ▼a 9791162240984 ▼g 93000
035 ▼a (KERIS)BIB000014949046
040 ▼a 241047 ▼c 211009 ▼d 211009
041 1 ▼a kor ▼h eng
082 0 4 ▼a 001.4/22 ▼2 23
085 ▼a 001.422 ▼2 DDCK
090 ▼a 001.422 ▼b 2018
100 1 ▼a Bruce, Peter C., ▼d 1953-
245 1 0 ▼a 데이터 과학을 위한 통계 : ▼b 데이터 분석에서 머신러닝까지 50가지 핵심 개념 / ▼d 피터 브루스, ▼e 앤드루 브루스 지음 ; ▼e 이준용 옮김
246 1 9 ▼a Practical statistics for data scientists : ▼b 50 essential concepts
260 ▼a 서울 : ▼b 한빛미디어, ▼c 2018
300 ▼a 327 p. : ▼b 도표 ; ▼c 24 cm
500 ▼a 색인수록
650 0 ▼a Mathematical analysis ▼x Statistical methods
650 0 ▼a Quantitative research ▼x Statistical methods
650 0 ▼a Big data ▼x Mathematics
700 1 ▼a Bruce, Andrew, ▼d 1958-, ▼e
700 1 ▼a 이준용, ▼e
900 1 0 ▼a 브루스, 피터, ▼e
900 1 0 ▼a 브루스, 앤드루, ▼e
945 ▼a KLPA

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 001.422 2018 등록번호 121246224 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 2 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 001.422 2018 등록번호 121246605 도서상태 대출중 반납예정일 2022-01-10 예약 서비스 M
No. 3 소장처 세종학술정보원/인문자료실1/ 청구기호 001.422 2018 등록번호 151342922 도서상태 대출가능 반납예정일 예약 서비스
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 001.422 2018 등록번호 121246224 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 2 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 001.422 2018 등록번호 121246605 도서상태 대출중 반납예정일 2022-01-10 예약 서비스 M
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 세종학술정보원/인문자료실1/ 청구기호 001.422 2018 등록번호 151342922 도서상태 대출가능 반납예정일 예약 서비스

컨텐츠정보

책소개

통계 기법을 데이터 과학에 적용해보며, 중요한 것과 중요하지 않은 것을 구분하는 실용적인 방법을 알려준다. EDA, 표본분포, 유의성 검정, 회귀분석, 분류, 통계적 머신러닝, 비지도 학습 등 오늘날 데이터 분석과 머신러닝 분야에서 널리 사용하는 주제로 구성되었으며, 주요 절마다 '용어 정리'를 제공해 학습 편의를 높였다.

데이터 과학에 필요한 만큼만 배우는 실용주의 통계학

데이터 과학자가 고전 통계를 낱낱이 알아야 하는 것은 아니다. 이 책은 다양한 통계 기법을 데이터 과학에 적용해보며, 중요한 것과 중요하지 않은 것을 구분하는 실용적인 방법을 알려준다. EDA, 회귀분석, 분류 등 오늘날 데이터 분석과 머신러닝에서 사용하는 기법들의 근본이 되는 통계 개념을 확실하게 이해할 수 있다.

데이터 분석에서 머신러닝까지 50가지 핵심 개념
데이터 과학에 필요한 만큼만 배우는 족집게 통계학

통계 기법은 데이터 과학의 핵심이지만, 전공자가 아닌 이상 정식으로 통계를 공부하고 데이터 과학에 입문하는 사람은 찾기 어렵다. 데이터 과학자가 고전 통계를 낱낱이 알아야 하는 것은 아니다. 자유도, p 값, 상관계수 등 고전 통계에서 중요하게 생각하는 개념 중에는 빅데이터를 다루는 데이터 과학자가 세부 사항까지 자세히 알 필요가 없는 것들도 있다.
이 책은 통계 기법을 데이터 과학에 적용해보며, 중요한 것과 중요하지 않은 것을 구분하는 실용적인 방법을 알려준다. EDA, 표본분포, 유의성 검정, 회귀분석, 분류, 통계적 머신러닝, 비지도 학습 등 오늘날 데이터 분석과 머신러닝 분야에서 널리 사용하는 주제로 구성되었으며, 주요 절마다 '용어 정리'를 제공해 학습 편의를 높였다.
많은 데이터 과학자가 머신러닝 및 통계 기법을 사용하면서도 그 근본이 되는 통계 개념을 이해하지 못해 한계에 부딪히곤 한다. R 언어와 약간의 통계 지식만 있다면, 이 책이 건널 수 없었던 그 강을 건너게 해줄 것이다.

주요 내용
● 탐색적 데이터 분석이 핵심 단계인 이유
● 임의표집으로 편향을 줄이고 고품질 데이터셋 얻는 법
● 실험계획법 원칙을 적용해 질문에 명확히 답하기
● 회귀분석으로 결과를 추정하고 이상 검출하기
● 속한 범주를 찾아내는 주요 분류 기법
● 데이터로 '학습'하는 통계적 머신러닝 기법
● 정답 없는 데이터에서 의미를 추출하는 비지도 학습 기법


정보제공 : Aladin

저자소개

피터 브루스(지은이)

통계 교육기관 Statistics.com 설립자. Statistics.com은 100여 개 통계 강의를 제공하며 그중 3할은 데이터 과학자가 대상이다. 치밀한 마케팅 전략을 수립해 최고 수준의 전문 데이터 과학자들을 강사로 모집해왔다. 이 과정에서 데이터 과학자를 위한 통계라는 주제에 대해 폭넓은 시야와 전문적 식견을 쌓았다.

앤드루 브루스(지은이)

데이터 과학 실무 전문가. 30년 이상 학계, 정부, 기업계에서 통계학과 데이터 과학을 연구했다. 워싱턴 대학교에서 통계학 박사학위를 땄고 학술지에 여러 논문을 발표했다. 저명한 금융회사부터 인터넷 스타트업에 이르기까지 업계에서 발생하는 폭넓은 문제에 대해 통계 기반 솔루션을 개발했고, 데이터 과학의 실무 활용 측면에서 전문가로 인정받고 있다.

이준용(옮긴이)

인공지능과 빅데이터 기술에 관심이 많은 연구원. 한국과학기술원(KAIST)에서 전자공학 박사학위를 받고, 일본 ATR IRC 연구소에서 인간-로봇 상호작용 연구에 참여했으며, 미국 아이오와 주립 대학교에서 대사회로 관련 데이터베이스를 구축하는 일을 했다. 현재 미국 퍼시픽 노스웨스트 국립연구소에서 연구원으로 일하고 있다. 다양한 프로그래밍 언어로 데이터 과학 실무 경력을 쌓고 있다. 역서로 『손에 잡히는 R 프로그래밍』(한빛미디어, 2015)이 있다.

정보제공 : Aladin

목차

CHAPTER 1 탐색적 데이터 분석 
1.1 정형화된 데이터의 요소 
1.2 테이블 데이터 
1.3 위치 추정 
1.4 변이 추정 
1.5 데이터 분포 탐색하기 
1.6 이진 데이터와 범주 데이터 탐색하기 
1.7 상관관계 
1.8 두 개 이상의 변수 탐색하기 
1.9 마치며 

CHAPTER 2 데이터와 표본분포 
2.1 랜덤표본추출과 표본편향 
2.2 선택 편향 
2.3 통계학에서의 표본분포 
2.4 부트스트랩 
2.5 신뢰구간 
2.6 정규분포 
2.7 긴 꼬리 분포 
2.8 스튜던트의 t 분포 
2.9 이항분포 
2.10 푸아송 분포와 그 외 관련 분포들 
2.11 마치며 

CHAPTER 3 통계적 실험과 유의성 검정 
3.1 A/B 검정 
3.2 가설검정 
3.3 재표본추출 
3.4 통계적 유의성과 p 값 
3.5 t 검정 
3.6 다중검정 
3.7 자유도 
3.8 분산분석 
3.9 카이제곱검정 
3.10 멀티암드 밴딧 알고리즘 
3.11 검정력과 표본크기 
3.12 마치며 

CHAPTER 4 회귀와 예측 
4.1 단순선형회귀 
4.2 다중선형회귀 
4.3 회귀를 이용한 예측 
4.4 회귀에서의 요인변수 
4.5 회귀방정식 해석 
4.6 가정 검정: 회귀 진단 
4.7 다항회귀와 스플라인 회귀 
4.8 마치며 

CHAPTER 5 분류 
5.1 나이브 베이즈 
5.2 판별분석 
5.3 로지스틱 회귀 
5.4 분류 모델 평가하기 
5.5 불균형 데이터 다루기 
5.6 마치며 

CHAPTER 6 통계적 머신러닝 
6.1 K 최근접 이웃 
6.2 트리 모델 
6.3 배깅과 랜덤 포레스트 
6.4 부스팅 
6.5 마치며 

CHAPTER 7 비지도 학습 
7.1 주성분분석 
7.2 K 평균 클러스터링 
7.3 계층적 클러스터링 
7.4 모델 기반 클러스터링 
7.5 스케일링과 범주형 변수 
7.6 마치며

관련분야 신착자료

민음사. 편집부 (2021)
송상용 (2021)
인문한국(HK)연구소협의회. HK/HK+성과확산총괄센터 (2021)
東京大学未来ビジョン研究センタ- (2021)
21세기 장성아카데미 (2021)