HOME > Detail View

Detail View

데이터 과학자가 되는 핵심 기술 : 데이터 분석에 필요한 수학, 통계, 프로그래밍의 기본 (Loan 17 times)

Material type
단행본
Personal Author
Ozdemir, Sinan 유동하, 역
Title Statement
데이터 과학자가 되는 핵심 기술 : 데이터 분석에 필요한 수학, 통계, 프로그래밍의 기본 / 시난 오즈데미르 지음 ; 유동하 옮김
Publication, Distribution, etc
서울 :   에이콘,   2018  
Physical Medium
478 p. : 삽화 ; 24 cm
Series Statement
acorn+PACKT technical book
Varied Title
Principles of data science : learn the techniques and math you need to start making sense of your data
ISBN
9791161750767 9788960772106 (세트)
General Note
색인수록  
000 00000cam c2200205 c 4500
001 000045937291
005 20181105140540
007 ta
008 180327s2018 ulka 001c kor
020 ▼a 9791161750767 ▼g 94000
020 1 ▼a 9788960772106 (세트)
035 ▼a (KERIS)BIB000014657518
040 ▼a 211062 ▼c 211062 ▼d 211062 ▼d 211009
041 1 ▼a kor ▼h eng
082 0 4 ▼a 005.7565 ▼2 23
085 ▼a 005.7565 ▼2 DDCK
090 ▼a 005.7565 ▼b 2018z2
100 1 ▼a Ozdemir, Sinan
245 1 0 ▼a 데이터 과학자가 되는 핵심 기술 : ▼b 데이터 분석에 필요한 수학, 통계, 프로그래밍의 기본 / ▼d 시난 오즈데미르 지음 ; ▼e 유동하 옮김
246 1 9 ▼a Principles of data science : ▼b learn the techniques and math you need to start making sense of your data
260 ▼a 서울 : ▼b 에이콘, ▼c 2018
300 ▼a 478 p. : ▼b 삽화 ; ▼c 24 cm
440 0 0 ▼a acorn+PACKT technical book
500 ▼a 색인수록
700 1 ▼a 유동하, ▼e
900 1 0 ▼a 오즈데미르, 시난, ▼e

No. Location Call Number Accession No. Availability Due Date Make a Reservation Service
No. 1 Location Science & Engineering Library/Sci-Info(Stacks1)/ Call Number 005.7565 2018z2 Accession No. 121246487 Availability Available Due Date Make a Reservation Service B M
No. 2 Location Science & Engineering Library/Sci-Info(Stacks1)/ Call Number 005.7565 2018z2 Accession No. 521004614 Availability Available Due Date Make a Reservation Service B M
No. 3 Location Sejong Academic Information Center/Science & Technology/ Call Number 005.7565 2018z2 Accession No. 151339260 Availability Available Due Date Make a Reservation Service
No. 4 Location Sejong Academic Information Center/Science & Technology/ Call Number 005.7565 2018z2 Accession No. 151347013 Availability Available Due Date Make a Reservation Service
No. Location Call Number Accession No. Availability Due Date Make a Reservation Service
No. 1 Location Science & Engineering Library/Sci-Info(Stacks1)/ Call Number 005.7565 2018z2 Accession No. 121246487 Availability Available Due Date Make a Reservation Service B M
No. 2 Location Science & Engineering Library/Sci-Info(Stacks1)/ Call Number 005.7565 2018z2 Accession No. 521004614 Availability Available Due Date Make a Reservation Service B M
No. Location Call Number Accession No. Availability Due Date Make a Reservation Service
No. 1 Location Sejong Academic Information Center/Science & Technology/ Call Number 005.7565 2018z2 Accession No. 151339260 Availability Available Due Date Make a Reservation Service
No. 2 Location Sejong Academic Information Center/Science & Technology/ Call Number 005.7565 2018z2 Accession No. 151347013 Availability Available Due Date Make a Reservation Service

Contents information

Book Introduction

2018년 대한민국학술원 우수학술도서 선정도서. 데이터 과학의 원리를 전달하려는 기본적 취지에 맞게, 통계나 수학적 수식이 형성되는 개념을 설명해 준다. 데이터 과학에서 통계, 수학, R과 파이썬 같은 프로그래밍 지식이 왜 필요한지 확실히 알게 될 것이다. 데이터의 수집부터 필요한 정보만 정제하고, 유형을 살펴서 분석하고, 결과의 해석까지 필요한 원리를 복합적으로 다룬다.

이 책은 데이터 과학의 원리를 전달하려는 기본적 취지에 맞게, 통계나 수학적 수식이 형성되는 개념을 설명해 준다. 꼭 필요한 최소한의 수학적 개념만 소개하기 때문에 수학 울렁증이 있는 사람도 쉽게 읽을 수 있다. 목적을 이해하고 원리를 알면 수식을 무작정 외울 필요가 없다는 것을 이제야 깨닫게 될 것이다. 더불어 데이터 과학에서 통계, 수학, R과 파이썬 같은 프로그래밍 지식이 왜 필요한지 확실히 알게 된다. 데이터의 수집부터 필요한 정보만 정제하고, 유형을 살펴서 분석하고, 결과의 해석까지 필요한 원리를 복합적으로 다룬다.

★ 이 책에서 다루는 내용 ★

■ 데이터 과학의 가장 중요한 다섯 가지 단계
■ 데이터를 현명하게 다루는 방법
■ 수학과 프로그래밍 간의 격차 해소
■ 확률과 계산법, 통계적 모델을 사용해 데이터를 정제하고 실행 가능한 결과를 얻는 방법
■ 기본적인 머신 러닝 모델의 구축과 평가
■ 머신 러닝 모델의 성공 여부를 결정짓는 가장 효과적인 측정 지표 탐색
■ 실행 가능한 통찰력을 전달하는 데이터 시각화
■ 머신 러닝 개념을 문제에 적용한 실제 예측

★ 이 책의 대상 독자 ★

이 책은 모든 도메인에 대한 데이터 과학의 기본 업무를 이해하고 활용하고자 하는 사람들을 위한 책이다.
기본 수학(대수, 확률)을 잘 알고 있어야 하며, 의사 코드뿐만 아니라 R/파이썬의 코드 조각을 읽기 편해야 한다. 데이터 분야의 작업 경험은 없어도 된다. 그러나 이 책에서 제시한 기술을 배워서 자신들의 데이터셋이나 제공된 데이터셋에 적용하려는 열정은 있어야 한다.

★ 이 책의 구성 ★

1장. '데이터 과학자처럼 말하는 방법'에서는 데이터 과학자가 사용하는 기본 용어를 소개하고, 이 책 전반에 걸쳐 해결할 문제의 유형을 살펴본다.
2장. '데이터 유형'에서는 데이터의 다양한 수준과 유형 및 각 유형을 조작하는 방법을 살펴보면서 데이터 과학에 필요한 수학을 다루기 시작한다.
3장. '데이터 과학의 다섯 단계'에서는 데이터 조작 및 정제를 비롯해 데이터 과학을 수행하는 다섯 가지 기본 단계를 알아보고, 각 단계의 예를 자세히 보여준다.
4장. '기초 수학'에서는 미적분 선형 대수 등의 예를 살펴보고 해결함으로써 데이터 과학자의 행동을 안내하는 기본 수학 원리를 발견할 수 있다.
5장. '확률의 기초와 원리'에서는 초보자의 시각으로 확률 이론을 살펴보고 무작위 세상을 이해하는 데 확률이 어떻게 사용되는지 설명한다.
6장. '고급 확률'에서는 앞에서 살펴본 원리를 사용하고 세상의 숨겨진 의미를 밝히기 위해 베이즈 정리 같은 원리를 소개하고 적용한다.
7장. '기초 통계'에서는 통계적 추론이 실험의 기본, 표준화, 무작위 표본 추출을 사용해서 설명하려는 문제 유형을 다룬다.
8장. '고급 통계'에서는 가설 검정과 신뢰 구간을 사용해 실험으로부터 통찰력을 얻는다. 적절한 검정 방법을 선택하고, p-값과 다른 결과를 해석하는 것은 매우 중요하다.
9장. '데이터 의미 전달'에서는 상관관계와 인과관계가 데이터 해석에 어떻게 영향을 주는지 설명한다. 또한 결과를 세상과 공유하기 위해 시각화를 사용한다.
10장. '머신 러닝 요점'에서는 머신 러닝의 정의에 중점을 두고 머신 러닝이 언제 어떻게 적용되는지에 대한 실제 사례를 살펴본다. 모델 평가의 타당성에 대한 기본적인 지식도 소개한다.
11장. '의사 결정 트리에서 자라는 예측'에서는 좀 더 복잡한 데이터 관련 작업을 해결하기 위해 의사 결정 트리 및 베이지안 기반 예측과 같은 좀 더 복잡한 머신 러닝 모델을 살펴본다.
12장. '필수 요소를 넘어서'에서는 편향과 분산을 포함해 데이터 과학을 안내하는 신비한 힘을 소개한다. 신경망은 현대의 딥러닝 기술로 소개한다.
13장. '사례 연구'에서는 다수의 사례 연구를 통해 데이터 과학의 아이디어를 확고히 한다. 주가 예측 및 필체 감지를 비롯해 여러 가지 예를 통해 전체 데이터 과학의 작업 흐름을 처음부터 끝까지 여러 번 따라갈 것이다.


Information Provided By: : Aladin

Author Introduction

시난 오즈데미르(지은이)

데이터 과학자이고, 스타트업 창업자이자 교육자다. 샌프란시스코 베이 지역에서 강아지 찰리와 고양이 유클리드, 수염 난 도마뱀 피에로와 함께 살고 있다. 존스홉킨스대학교에서 순수 수학을 공부하면서 학업을 시작했다. 존스홉킨스대학교와 주 의회에서 수년간 데이터 과학을 강의했다. 이후에는 인공 지능 및 데이터 과학을 사용하는 스타트업(Legion Analytics)을 설립해 기업의 영업 팀을 지원하고 있다. 와이콤비네이터(Y Combinator) 액셀러레이터에서 연구원 생활을 마친 후 빠르게 성장하고 있는 자신의 회사에서 대부분 시간을 보내고, 데이터 과학을 위한 교육 자료를 만들고 있다.

유동하(옮긴이)

디지털 분석 기업인 넷스루(NETHRU)에서 전략 기획을 담당하며, 서울과학종합대학원(aSSIST) 빅데이터 MBA 과정에서 웹 마이닝 과목을 가르치고 있다. 한국외국어대학교 경영대학원 경영정보학과에서 웹 마이닝을 가르쳤고, 이 밖에도 한국방송통신대학교에서 인터넷 마케팅, 네이버 사내 강의와 네이버 검색 광고주 대상으로 웹 분석과 관련된 강의를 했다. 국내외 게임 회사와 인터넷 쇼핑몰, 금융권, 공공기관 등의 웹 분석 프로젝트를 수행했다. 월간 마이크로소프트웨어에 데이터 마이닝과 웹 마이닝 주제로 강좌를 연재했고, 네이버 키워드 스퀘어에 인터넷 광고 측정에 관한 칼럼을 쓰기도 했다.

Information Provided By: : Aladin

Table of Contents

1장. 데이터 과학자처럼 말하는 방법 
__데이터 과학이란 무엇인가? 
__데이터 과학 벤 다이어그램 
__도메인 지식 
__더 많은 전문 용어 
__데이터 과학 사례 연구 
__요약 

2장. 데이터 유형 
__데이터의 특색 
__데이터를 구분해야 하는 이유 
__구조적 데이터와 비구조적 데이터 비교 
__정량적 데이터와 정성적 데이터 
__지금까지 정리 
__데이터의 4가지 수준 
__제 눈에 안경인 데이터 
__요약 

3장. 데이터 과학의 다섯 단계 
__데이터 과학 개론 
__다섯 단계 개요 
__데이터 탐색 
__요약 

4장. 기초 수학 
__학문으로서의 수학 
__기본 기호 및 용어 
__선형 대수학 
__요약 

5장. 확률의 기초와 원리 
__기본 정의 
__확률 
__베이지안과 빈도 확률 
__복합 이벤트 
__조건부 확률 
__확률의 규칙 
__조금 깊이 들어가기 
__요약 


6장. 고급 확률 
__전체 포괄적인 이벤트 
__베이지안 아이디어 재검토 
__확률 변수 
__요약 

7장.기초 통계 
__통계란? 
__데이터를 얻고 표본 추출하는 방법 
__표본 추출 데이터 
__통계를 측정하는 방법 
__경험적 규칙 
__요약 

8장. 고급 통계 
__점 추정치 
__표본 분포 
__신뢰 구간 
__가설 검정 
__요약 

9장. 데이터 의미 전달 
__커뮤니케이션이 중요한 이유 
__효과적인 시각화와 비효과적인 시각화 식별 
__그래프와 통계가 거짓말할 때 
__구두 의사소통 
__왜/어떻게/어떤 프레젠테이션 전략 
__요약 

10장. 머신 러닝 요점 
__머신 러닝이란 무엇인가? 
__머신 러닝은 완벽하지 않다. 
__머신 러닝은 어떻게 작동하는가? 
__머신 러닝의 유형 
__통계적 모델링은 이 모든 것을 어떻게 맞출까? 
__선형 회귀 
__로지스틱 회귀 
__확률, 공산, 로그 공산 

11장. 의사 결정 트리에서 자라는 예측 
__나이브 베이즈 분류 
__의사 결정 트리 
__자율 학습 
__K-means 클러스터링 
__K와 클러스터 검증을 위한 최적의 수 선택 
__특징 추출 및 주요 구성 요소 분석 
__요약 

12장. 필수 요소를 넘어서 
__편향 분산 트레이드오프 
__K겹 교차 검증 
__그리드 검색 
__앙상블 기술 
__신경망 
__요약 

13장. 사례 연구 
__사례 연구 1: 소셜 미디어를 기반주가 예측 
__사례 연구 2: 왜 일부 사람들은 배우자를 속일까? 
__사례 연구 3: 텐서플로 사용 
__요약

New Arrivals Books in Related Fields

Ramamurthy, Bina (2021)