HOME > 상세정보

상세정보

(밑바닥부터 시작하는) 데이터 과학 : 데이터 분석을 위한 파이썬 프로그래밍과 수학ㆍ통계 기초 (153회 대출)

자료유형
단행본
개인저자
Grus, Joel 박은정, 역 김한결, 역 하성주, 역
서명 / 저자사항
(밑바닥부터 시작하는) 데이터 과학 : 데이터 분석을 위한 파이썬 프로그래밍과 수학ㆍ통계 기초 / 조엘 그루스 지음 ; 박은정, 김한결, 하성주 옮김
발행사항
서울 :   인사이트,   2016   (2017 3쇄)  
형태사항
xviii, 318 p. : 삽화, 도표 ; 24 cm
총서사항
Programming insight
원표제
Data science from scratch : first principles with Python
ISBN
9788966261819
일반주기
색인수록  
일반주제명
Python (Computer program language) Database management Data structures (Computer science)
000 00000nam c2200205 c 4500
001 000045874120
005 20170531140519
007 ta
008 160614s2016 ulkad 001c kor
020 ▼a 9788966261819 ▼g 93000
040 ▼a 211009 ▼c 211009 ▼d 211009
041 1 ▼a kor ▼h eng
082 0 4 ▼a 005.7565 ▼a 006.312 ▼2 23
085 ▼a 005.7565 ▼2 DDCK
090 ▼a 005.7565 ▼b 2016
100 1 ▼a Grus, Joel ▼0 AUTH(211009)18274
245 2 0 ▼a (밑바닥부터 시작하는) 데이터 과학 : ▼b 데이터 분석을 위한 파이썬 프로그래밍과 수학ㆍ통계 기초 / ▼d 조엘 그루스 지음 ; ▼e 박은정, ▼e 김한결, ▼e 하성주 옮김
246 1 9 ▼a Data science from scratch : ▼b first principles with Python
260 ▼a 서울 : ▼b 인사이트, ▼c 2016 ▼g (2017 3쇄)
300 ▼a xviii, 318 p. : ▼b 삽화, 도표 ; ▼c 24 cm
440 0 0 ▼a Programming insight
500 ▼a 색인수록
650 0 ▼a Python (Computer program language)
650 0 ▼a Database management
650 0 ▼a Data structures (Computer science)
700 1 ▼a 박은정, ▼e▼0 AUTH(211009)103292
700 1 ▼a 김한결, ▼e▼0 AUTH(211009)8614
700 1 ▼a 하성주, ▼e▼0 AUTH(211009)1574
900 1 0 ▼a 그루스, 조엘, ▼e
945 ▼a KLPA

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 중앙도서관/제2자료실(3층)/ 청구기호 005.7565 2016 등록번호 111759541 도서상태 대출중 반납예정일 2023-08-16 예약 서비스 M
No. 2 소장처 중앙도서관/제2자료실(3층)/ 청구기호 005.7565 2016 등록번호 111770379 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 3 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 005.7565 2016 등록번호 121236953 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 4 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 005.7565 2016 등록번호 121239466 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 5 소장처 의학도서관/자료실(3층)/ 청구기호 005.7565 2016 등록번호 131051986 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 6 소장처 의학도서관/실험실습자료/ 청구기호 안암영상의학 005.7565 2016 등록번호 931001464 도서상태 대출불가(열람가능) 반납예정일 예약 서비스 M
No. 7 소장처 세종학술정보원/과학기술실(5층)/ 청구기호 005.7565 2016 등록번호 151346521 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 중앙도서관/제2자료실(3층)/ 청구기호 005.7565 2016 등록번호 111759541 도서상태 대출중 반납예정일 2023-08-16 예약 서비스 M
No. 2 소장처 중앙도서관/제2자료실(3층)/ 청구기호 005.7565 2016 등록번호 111770379 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 005.7565 2016 등록번호 121236953 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 2 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 005.7565 2016 등록번호 121239466 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 의학도서관/자료실(3층)/ 청구기호 005.7565 2016 등록번호 131051986 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 2 소장처 의학도서관/실험실습자료/ 청구기호 안암영상의학 005.7565 2016 등록번호 931001464 도서상태 대출불가(열람가능) 반납예정일 예약 서비스 M
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 세종학술정보원/과학기술실(5층)/ 청구기호 005.7565 2016 등록번호 151346521 도서상태 대출가능 반납예정일 예약 서비스 B M

컨텐츠정보

책소개

라이브러리나 프레임워크와 같은 도구를 사용하지 않고 '밑바닥부터' 만들어 보며 데이터 과학과 관련된 알고리즘을 알려 주는 기본서. 책 전반에 걸쳐 데이터 과학에 필요한 파이썬 프로그래밍과 수학, 통계학 기초를 다루며, 데이터 과학의 어려운 개념을 모두 설명하기보다는 꼭 알고 넘어가야 할 내용을 중심으로 담았다.

이 책은 먼저 본격적으로 데이터 과학에 뛰어들기 전, 기본적인 파이썬 프로그래밍을 배우고, 이후에는 선형대수, 통계, 확률 등 데이터 과학 개념과 기술을 뒷받침하는 핵심적인 내용을 학습한다. 또한 다양한 통계와 확률 이론을 바탕으로 하는 분석 모델과 알고리즘에 대해서도 알아본다. 여기서는 머신러닝의 기본 개념을 살펴보고, k-NN, 나이브 베이즈, 선형 및 로지스틱 회귀 분석, 의사결정나무, 신경망 및 클러스터링 모델 등을 배운다.

데이터 과학에 필요한 기초 이론과 프로그래밍, 두 마리 토끼를 모두 잡는 기본서

이 책은 라이브러리나 프레임워크와 같은 도구를 사용하지 않고 '밑바닥부터' 만들어 보며 데이터 과학과 관련된 알고리즘을 알려 주는 기본서다. 책 전반에 걸쳐 데이터 과학에 필요한 파이썬 프로그래밍과 수학, 통계학 기초를 다루며, 데이터 과학의 어려운 개념을 모두 설명하기보다는 꼭 알고 넘어가야 할 내용을 중심으로 담았다.
『밑바닥부터 시작하는 데이터 과학』은 크게 세 가지 내용으로 나뉜다. 먼저 본격적으로 데이터 과학에 뛰어들기 전, 기본적인 파이썬 프로그래밍을 배운다. 데이터 과학자에게 필요한 내용을 짚어 주는 속성 강좌로, 파이썬에 익숙하지 않은 독자라면 일독을 권한다.
이후에는 선형대수, 통계, 확률 등 데이터 과학 개념과 기술을 뒷받침하는 핵심적인 내용을 학습한다. 샘플 데이터와 예제를 통해 원리를 들여다 보는 방식으로 기초적인 내용을 다루니 수식에 겁먹지 말자.
또한 다양한 통계와 확률 이론을 바탕으로 하는 분석 모델과 알고리즘에 대해서도 알아본다. 여기서는 머신러닝의 기본 개념을 살펴보고, k-NN, 나이브 베이즈, 선형 및 로지스틱 회귀 분석, 의사결정나무, 신경망 및 클러스터링 모델 등을 배운다. 또한 추천 시스템, 자연어 처리, 네트워크 분석, 맵리듀스 등의 알고리즘을 알아 본다.
저자는 데이터 과학을 배우는 데는 스스로 해보는 것보다 좋은 방법이 없다고 조언한다. 데이터 과학에 대한 호기심과 의지만 있다면, 이 책을 따라 데이터 과학자로서의 한걸음을 내딛어 보자.

<책의 대상 독자>
- 데이터 과학에 필요한 기초와 프로그래밍 두 마리 토끼를 모두 잡고 싶은 전공자
- 수학·통계학 이론이 녹아 든 데이터 과학 관련 알고리즘을 살펴보려는 데이터 과학자
- 데이터 분석에 필요한 수학·통계학 이론을 살펴보려는 프로그래머


정보제공 : Aladin

저자소개

조엘 그루스(지은이)

구글의 소프트웨어 엔지니어이다. 구글 입사 이전에는 각종 스타트업에서 데이터 사이언티스트로 일했다. 시애틀에 거주하면서 데이터 사이언스 밋업을 여러 개 참여하고 있다. joelgrus.com에 종종 글을 쓰며 @joelgrus라는 계정으로 종일 트위터를 한다.

박은정(옮긴이)

서울대학교에서 데이터마이닝을 전공하고 있으며 마케팅, 반도체, 영화, 정치 등의 영역에서 데이터 분석 프로젝트를 진행했다. 프로그래머는 아니지만 프로그래밍을 즐긴다. 『D3를 이용한 시각적 스토리텔링』(인사이트)을 공역했다.

김한결(옮긴이)

KAIST에서 산업 및 시스템공학을 전공하고 현재 서울대학교 산업공학과 데이터마이닝센터에서 석사 과정을 밟고 있다. 에너지, 자동차, 뉴스 관련 데이터 분석 프로젝트를 진행했다. 『D3를 이용한 시각적 스토리텔링』(인사이트)을 공역했다.

하성주(옮긴이)

서울대학교 컴퓨터공학부 최적화 연구실에서 박사 과정 중에 있다. 데이터를 바탕으로 복잡한 현상을 이해하고 더 나은 결정을 내리는 것에 관심이 있으며 주어진 상황에 과학자와 공학자의 시각을 번갈아가며 적용하며 실험하는 것을 좋아한다.

정보제공 : Aladin

목차

1장 들어가기 
1.1 데이터 시대의 도래 
1.2 데이터 과학이란? 
1.3 동기부여를 위한 상상: 데이텀 주식회사 

2장 파이썬 속성 강좌 
2.1 기본기 다지기 
2.2 기본기에서 한 걸음 나아가기 
2.3 더 공부해 보고 싶다면 

3장 데이터 시각화 
3.1 matplotlib 
3.2 막대 그래프 
3.3 선 그래프 
3.4 산점도 
3.5 더 공부해 보고 싶다면 

4장 선형대수 
4.1 벡터 
4.2 행렬 
4.3 더 공부해 보고 싶다면 

5장 통계 
5.1 데이터셋 설명하기 
5.2 상관관계 
5.3 심슨의 역설 
5.4 상관관계에 대한 추가적인 경고 사항 
5.5 상관관계와 인과관계 
5.6 더 공부해 보고 싶다면 

6장 확률 
6.1 종속성과 독립성 
6.2 조건부 확률 
6.3 베이즈 정리 
6.4 확률변수 
6.5 연속 분포 
6.6 정규분포 
6.7 중심극한정리 
6.8 더 공부해 보고 싶다면 

7장 가설과 추론 
7.1 통계적 가설 검정 
7.2 예시: 동전 던지기 
7.3 p-value 
7.4 신뢰구간 
7.5 p-value 해킹 
7.6 예시: A/B test 해보기 
7.7 베이지안 추론 
7.8 더 공부해 보고 싶다면 

8장 경사 하강법 
8.1 경사 하강법에 숨은 의미 
8.2 Gradient 계산하기 
8.3 Gradient 적용하기 
8.4 적절한 이동 거리 정하기 
8.5 종합하기 
8.6 SGD(stochastic gradient descent) 
8.7 더 공부해 보고 싶다면 

9장 파이썬으로 데이터 수집하기 
9.1 stdin과 stdout 
9.2 파일 읽기 
9.3 웹 스크래핑 
9.4 API 사용하기 
9.5 예시: 트위터 API 사용하기 
9.6 더 공부해 보고 싶다면 

10장 데이터 다루기 
10.1 데이터 탐색하기 
10.2 정제하고 합치기 
10.3 데이터 처리 
10.4 척도 조절 
10.5 차원 축소 
10.6 더 공부해 보고 싶다면 

11장 기계학습 
11.1 모델링 
11.2 기계학습이란? 
11.3 오버피팅과 언더피팅 
11.4 정확도 
11.5 Bias-variance 트레이드오프 
11.6 특성 추출 및 선택 
11.7 더 공부해 보고 싶다면 

12장 k-NN 
12.1 모델 
12.2 예시: 가장 인기 있는 프로그래밍 언어 
12.3 차원의 저주 
12.4 더 공부해 보고 싶다면 

13장 나이브 베이즈 
13.1 바보 스팸 필터 
13.2 조금 더 똑똑한 스팸 필터 
13.3 구현하기 
13.4 모델 검증하기 
13.5 더 공부해 보고 싶다면 

14장 단순 회귀 분석 
14.1 모델 
14.2 경사 하강법 사용하기 
14.3 최대우도추정법 
14.4 더 공부해 보고 싶다면 

15장 다중 회귀 분석 
15.1 모델 
15.2 최소자승법에 대한 몇 가지 추가 가정 
15.3 모델 학습하기 
15.4 모델 해석하기 
15.5 적합성(Goodness of fit) 
15.6 여담: bootstrap 
15.7 계수의 표준 오차 
15.8 정규화(regularization) 
15.9 더 공부해 보고 싶다면 

16장 로지스틱 회귀 분석 
16.1 문제 
16.2 로지스틱 함수 
16.3 모델 적용하기 
16.4 적합성(Goodness of fit) 
16.5 SVM 
16.6 더 공부해 보고 싶다면 

17장 의사결정나무 
17.1 의사결정나무란? 
17.2 엔트로피 
17.3 파티션의 엔트로피 
17.4 의사결정나무 만들기 
17.5 종합하기 
17.6 랜덤포레스트 
17.7 더 공부해 보고 싶다면 

18장 신경망 
18.1 퍼셉트론 
18.2 순방향(Feed-forward) 신경망 
18.3 Backpropagation 
18.4 예시: CAPTCHA 깨기 
18.5 더 공부해 보고 싶다면 

19장 군집화 
19.1 군집화 감 잡기 
19.2 모델 
19.3 예시: 오프라인 모임 
19.4 k 값 선택하기 
19.5 예시: 색 군집화하기 
19.6 상향식 계층 군집화 
19.7 더 공부해 보고 싶다면 

20장 자연어 처리 
20.1 워드 클라우드 
20.2 n-gram 모델 
20.3 문법 
20.4 여담: 깁스 샘플링 
20.5 토픽 모델링 
20.6 더 공부해 보고 싶다면 

21장 네트워크 분석 
21.1 매개 중심성 
21.2 고유벡터 중심성 
21.3 방향성 그래프(Directed graphs)와 페이지랭크 
21.4 더 공부해 보고 싶다면 

22장 추천 시스템 
22.1 수작업을 이용한 추천 
22.2 인기도를 활용한 추천 
22.3 사용자 기반 협업 필터링 
22.4 상품 기반 협업 필터링 
22.5 더 공부해 보고 싶다면 

23장 데이터베이스와 SQL 
23.1 CREATE TABLE과 INSERT 
23.2 UPDATE 
23.3 DELETE 
23.4 SELECT 
23.5 GROUP BY 
23.6 ORDER BY 
23.7 JOIN 
23.8 서브쿼리 
23.9 인덱싱 
23.10 쿼리 최적화 
23.11 NoSQL 
23.12 더 공부해 보고 싶다면 

24장 맵리듀스 
24.1 예시: 단어 수 세기 
24.2 왜 맵리듀스인가? 
24.3 맵리듀스 일반화하기 
24.4 예시: 사용자의 글 분석하기 
24.5 예시: 행렬 연산 
24.6 여담: Combiner 
24.7 더 공부해 보고 싶다면 

25장 본격적으로 데이터 과학하기 
25.1 IPython 
25.2 수학 
25.3 밑바닥부터 시작하지 않는 방법 
25.4 데이터 찾기 
25.5 데이터 과학하기

관련분야 신착자료