HOME > Detail View

Detail View

(비즈니스를 위한) 데이터 과학 : 빅데이터를 바라보는 데이터 마이닝과 분석적 사고 (Loan 48 times)

Material type
단행본
Personal Author
Provost, Foster 강권학, 역 Fawcett, Tom, 저
Title Statement
(비즈니스를 위한) 데이터 과학 : 빅데이터를 바라보는 데이터 마이닝과 분석적 사고 / 포스터 프로보스트, 톰 포셋 지음 ; 강권학 옮김
Publication, Distribution, etc
서울 :   한빛미디어,   2014  
Physical Medium
419 p. : 삽화, 도표 ; 24 cm
Varied Title
Data science for business : what you need to know about data mining and data-analytic thinking
ISBN
9788968481093
General Note
부록: 1. 제안서 검토 가이드, 2. 또 다른 제안서 예제, 3. 용어 정리  
색인수록  
Subject Added Entry-Topical Term
Data mining Big data Information science Business -- Data processing
000 01216camcc2200361 c 4500
001 000045807559
005 20140826110827
007 ta
008 140825s2014 ulkad 001c kor
020 ▼a 9788968481093 ▼g 13000
035 ▼a (KERIS)BIB000013508432
040 ▼a 211023 ▼c 211023 ▼d 211009
041 1 ▼a kor ▼h eng
082 0 4 ▼a 005.74 ▼2 23
085 ▼a 005.74 ▼2 DDCK
090 ▼a 005.74 ▼b 2014z4
100 1 ▼a Provost, Foster
245 2 0 ▼a (비즈니스를 위한) 데이터 과학 : ▼b 빅데이터를 바라보는 데이터 마이닝과 분석적 사고 / ▼d 포스터 프로보스트, ▼e 톰 포셋 지음 ; ▼e 강권학 옮김
246 1 9 ▼a Data science for business : ▼b what you need to know about data mining and data-analytic thinking
260 ▼a 서울 : ▼b 한빛미디어, ▼c 2014
300 ▼a 419 p. : ▼b 삽화, 도표 ; ▼c 24 cm
500 ▼a 부록: 1. 제안서 검토 가이드, 2. 또 다른 제안서 예제, 3. 용어 정리
500 ▼a 색인수록
650 0 ▼a Data mining
650 0 ▼a Big data
650 0 ▼a Information science
650 0 ▼a Business ▼x Data processing
700 1 ▼a 강권학, ▼e
700 1 ▼a Fawcett, Tom, ▼e
900 1 0 ▼a 프로보스트, 포스터, ▼e
900 1 0 ▼a 포셋, 톰, ▼e
945 ▼a KLPA

Holdings Information

No. Location Call Number Accession No. Availability Due Date Make a Reservation Service
No. 1 Location Science & Engineering Library/Sci-Info(Stacks1)/ Call Number 005.74 2014z4 Accession No. 121230600 Availability Available Due Date Make a Reservation Service B M
No. 2 Location Science & Engineering Library/Sci-Info(Stacks1)/ Call Number 005.74 2014z4 Accession No. 121232888 Availability Available Due Date Make a Reservation Service B M

Contents information

Book Introduction

비즈니스 의사 결정을 향상시키기 위해 대량의 데이터에서 유용한 정보와 지식을 추출하는 방법에 대해 설명하는 책.

이 책에서는 데이터 과학에서 가장 중요한 기본 개념을 설명한다. 이 개념의 일부는 각 장의 '제목'이 되기도 하고 다른 일부는 설명을 통해 자연스럽게 소개된다(설명에 들어 있는 개념은 기본 개념이라고 표시되어 있지 않다).

이 개념들은 문제에 대한 계획을 세우는 일부터 데이터 과학 기법을 적용하고 더 나은 의사 결정을 하기 위해 결과를 배치하는 과정까지 폭 넓게 적용될 뿐만 아니라 다양한 비즈니스 분석 방법론 및 기법의 기반이 되기도 한다.

이 책은 비즈니스 의사 결정을 향상시키기 위해 대량의 데이터에서 유용한 정보와 지식을 추출하는 방법에 대해 설명한다.

데이터 과학이란?
'데이터 과학'과 '데이터 마이닝'이라는 용어는 종종 혼용해서 사용되지만, 다양한 특징을 가진 개인과 기관이 '데이터 과학'을 통해 이익을 얻으려고 함에 따라 새로운 의미를 지니게 되었다. 간단히 말해 데이터 과학은 데이터로부터 지식을 뽑아내는 방법을 알려주는 근본적인 원리를 말하며, 데이터 마이닝은 이 원리에 따르는 기술을 이용해 데이터에서 지식을 뽑아내는 기법을 말한다. 용어의 범위를 따지자면 '데이터 과학'은 기존에 사용해 오던 '데이터 마이닝'에 비해 더 넓은 범위를 가리키며, 데이터 마이닝 기법은 데이터 과학의 원리를 잘 보여준다고 할 수 있다.

왜 이 책을 읽어야 할까?
데이터 과학을 직접 응용할 일이 없더라도 데이터 과학을 이해하는 일은 매우 중요하다. 데이터 분석적 사고 방식에 익숙해지면 데이터 마이닝 프로젝트를 평가하는 데 도움이 된다. 예를 들어 어떤 컨설턴트나 잠재적인 투자자가 데이터에서 지식을 추출하는 업무를 개선하고자 제안할 경우, 제안서를 체계적으로 평가함으로써 제안이 과연 타당한지, 아니면 문제가 있는지를 판단할 수 있다. 그렇다고 해서 프로젝트가 성공한다고는 확신할 수 없지만(데이터 마이닝 프로젝트는 실제로 시도해봐야 결과를 알 수 있는 경우가 많다) 적어도 제안서에 있는 결함이나 비현실적 가정, 빠진(놓치는) 부분은 알아낼 수 있다.

데이터 과학에 대한 이 책의 개념적 접근 방법
이 책에서는 데이터 과학에서 가장 중요한 기본 개념을 설명한다. 이 개념의 일부는 각 장의 '제목'이 되기도 하고 다른 일부는 설명을 통해 자연스럽게 소개된다(설명에 들어 있는 개념은 기본 개념이라고 표시되어 있지 않다). 이 개념들은 문제에 대한 계획을 세우는 일부터 데이터 과학 기법을 적용하고 더 나은 의사 결정을 하기 위해 결과를 배치하는 과정까지 폭 넓게 적용될 뿐만 아니라 다양한 비즈니스 분석 방법론 및 기법의 기반이 되기도 한다.

대상 독자
-. 데이터 과학자와 함께 일을 하거나 데이터 과학 중심의 프로젝트를 관리하는 사람들
-. 데이터 과학 벤처 기업에 투자하려는 기업가
-. 데이터 과학 프로젝트를 구현하려는 개발자
-. 데이터 과학자를 지망하는 사람

이 책으로 가르치는 분들께
"이 책은 매우 다양한 데이터 과학 과정 교재로 훌륭히 사용되어 왔습니다. 초기에 이 책은 포스터 교수가 2005년 가을 뉴욕대 스턴 스쿨에서 여러 과의 주제를 종합해 가르치기 위해 만든 교재에서 시작되었습니다*. 원래 강의는 MBA와 MSIS 학생을 대상으로 했지만, 대학의 다른 학과의 학생들이 많이 몰려와 원래 이 강의 대상이었던 MBA 및 MSIS 학생들뿐만 아니라 기계 학습 등에서 든든한 기반이 있는 학생들에게도 특히 유용했다는 점이 이채롭습니다. 아마도 그들의 교과 과정에서는 알고리즘 이외에 근본적인 원리에 대해 주목하지 않았기 때문일 것 같습니다.
뉴욕대에서는 현재 이 책을 데이터 과학에 관련된 다양한 강의에서 교재로 사용하고 있습니다. 원래의 MBA 및 MSIS 과정은 물론이고, 학부 비즈니스 분석학, 뉴욕대 스턴 스쿨의 비즈니스 분석학 석사 과정, 뉴욕대에 신설된 데이터 과학 석사과정을 위한 데이터 과학 입문 교재로 사용되고 있습니다. 게다가 이 책이 출판되기도 전에 이미 7개국 10여 개 대학의 경영대, 컴퓨터 과학과 및 데이터 과학에 대한 입문 일반 과정에서 이 책을 교재로 채택해 사용해 왔습니다."


Information Provided By: : Aladin

Author Introduction

포스터 프로보스트(지은이)

뉴욕대 스턴 비즈니스 스쿨의 NEC 교수로서 비즈니스 분석학, 데이터 과학, MBA 프로그램을 강의하고 있으며, 다양한 수상 경력에 빛나는 연구 업적은 여러 곳에서 인용되고 있다. 뉴욕대에 오기 전에는 버라이즌에서 데이터 과학 연구원으로 근무했으며, 지난 10여 년간 여러 성공적인 데이터 과학 전문 기업들을 공동 설립했다.

톰 포셋(지은이)

기계 학습으로 박사 학위를 받았으며 GTE, NYNEX/Verizon, HP 등 기업의 연구소에서 근무해왔다. 포셋 박사는 데이터 마이닝 결과 평가 등의 데이터 과학 기법, 사기 사건 탐지 및 스팸 필터링 등 데이터 과학 응용에 대한 논문들을 발표했으며, 이 논문들은 데이터 과학 분야의 필수 논문이 되었다.

강권학(옮긴이)

중앙대학교 컴퓨터공학과에서 학사와 석사학위를 받았다. 국방과학연구소, 퓨쳐시스템, 안철수연구소에서 13년간 개발자, 보안전문가, 프로젝트 관리자로 근무하였으며, 2009년 4월 호주 멜버른에 iGonagi Pty. Ltd.를 설립하고 아이폰 애플리케이션을 개발하고 있다. 번역서로는 『게임 디자인 레벨업 가이드(공역)』, 『Head First Python』, 『안드로이드 시큐리티 인터널』, 『Head First JavaScript Programming』, 『비즈니스를 위한 데이터 과학』, 『C++ AMP』, 『Head First C』, 『iPhone 3D Programming』, 『iPhone Programming(공역)』, 『Head First iPhone Development』(이상 한빛미디어) 등이 있다.

Information Provided By: : Aladin

Table of Contents

목차
지은이ㆍ옮긴이 소개 = 4
이 책에 쏟아진 찬사 = 5
옮긴이의 말 = 8
서문 = 9
감사의 글 = 15
CHAPTER 1 개요 : 데이터 분석적 사고 방식 
 1.1 데이터가 제공하는 무한한 기회 = 27
 1.2 예 : 허리케인 프란시스 = 29
 1.3 예제 : 고객 이탈 예측 = 30
 1.4 데이터 과학, 데이터 공학, 데이터 주도 의사 결정 = 31
 1.5 데이터 처리와 '빅 데이터' = 34
 1.6 빅 데이터 1.0에서 빅 데이터 2.0으로 = 35
 1.7 전략적 자산으로서의 데이터 및 데이터 과학 능력 = 36
 1.8 데이터 분석적 사고 = 40
 1.9 이 책에 대하여 = 42
 1.10 다시 보는 데이터 마이닝과 데이터 과학 = 42
 1.11 데이터 과학과 데이터 과학자의 일은 화학과 시험관의 관계 = 43
 1.12 요약 = 44
CHAPTER 2 비즈니스 문제와 데이터 과학 해결책 
 2.1 비즈니스 문제에서 시작해 데이터 마이닝 작업으로 = 48
 2.2 감독 방법과 자율 방법 = 51
 2.3 데이터 마이닝과 그 결과 = 53
 2.4 데이터 마이닝 프로세스 = 55
  2.4.1 비즈니스 이해 = 56
  2.4.2 데이터 이해 = 57
  2.4.3 데이터 준비 = 58
  2.4.4 모델링 = 59
  2.4.5 평가 = 60
  2.4.6 배치 = 61 
 2.5 데이터 과학팀을 관리한다는 것은? = 63
 2.6 그 외 분석 기법 및 기술 = 64
  2.6.1 통계학 = 65
  2.6.2 데이터베이스 쿼리 = 67
  2.6.3 데이터 웨어하우스 = 68
  2.6.4 회귀 분석 = 68
  2.6.5 기계 학습과 데이터 마이닝 = 69
  2.6.6 이 기법들을 이용해 비즈니스 질문에 답하기 = 70
 2.7 요약 = 71
CHAPTER 3 예측 모델링 개요 : 연관성에서 감독 세분화까지 
 3.1 모델, 유도, 예측 = 75
 3.2 감독 세분화 = 78
  3.2.1 정보를 전달하는 속성의 선택 = 79 
  3.2.2 사례 : 정보량을 증가시키는 속성 선택 = 87
  3.2.3 트리 구조 모델을 이용한 감독 세분화 = 94
 3.3 세분화 과정의 시각화 = 101
 3.4 규칙 집합으로서의 트리 = 103
 3.5 확률 추정 = 104
 3.6 사례 : 트리 유도로 고객 이탈 문제 해결하기 = 107
 3.7 요약 = 110
CHAPTER 4 데이터에 대한 모델 적합화 
 4.1 수학 함수를 통한 분류 = 115
  4.1.1 선형 판별 함수 = 117
  4.1.2 목적 함수의 최적화 = 120
  4.1.3 데이터에서 선형 판별식을 찾아내는 예 = 120
  4.1.4 객체를 점수화하고 순위 매기는 선형 판별 함수 = 122
  4.1.5 지원 벡터 기계 개요 = 123
 4.2 수학 함수를 이용한 회귀 분석 = 126 
 4.3 계층 확률 추정과 로지스틱 회귀 분석 = 129
  4.3.1 로지스틱 회귀 분석 : 수학적 세부 사항 = 132
 4.4 사례 : 로지스틱 회귀 분석과 트리 유도 비교 = 134
 4.5 비선형 함수, 지원 벡터 기계, 신경망 = 139
 4.6 요약 = 141
CHAPTER 5 과적합화 문제 해결 
 5.1 일반화 = 143
 5.2 과적합화 = 145
 5.3 과적합화 검사 = 146
  5.3.1 예비 데이터와 적합도 그래프 = 146
  5.3.2 트리 유도에서의 과적합화 = 148
  5.3.3 수학 함수에서의 과적합화 = 151
 5.4 사례 : 선형 함수 과적합화 = 152
 5.5 사례 : 왜 과적합화가 문제인가? = 155
 5.6 예비 데이터 평가에서 교차 검증까지 = 158
 5.7 다시 모델링한 고객 이탈 문제 = 161
 5.8 학습 곡선 = 162
 5.9 과적합화 회피와 복잡도 제어 = 164
  5.9.1 트리 유도에서 과적합화 회피 = 164
  5.9.2 과적합화를 피하기 위한 일반적인 방법 = 166
  5.9.3 파라미터 최적화에서 과적합화 피하기 = 168
 5.10 요약 = 172
CHAPTER 6 유사도, 이웃, 군집 
 6.1 유사도와 거리 = 176
 6.2 최근접 이웃 추론 = 178
  6.2.1 사례 : 위스키 분석 = 179
  6.2.2 예측 모델링하기 위한 최근접 이웃 = 181
  6.2.3 얼마나 많은 이웃이 얼마나 많은 영향을 미칠까? = 184
  6.2.4 기하 해석, 과적합, 복잡도 제어 = 186
  6.2.5 최근접 이웃 방법의 문제점 = 190
 6.3 유사도 및 이웃에 관한 주요 세부 사항 = 193
  6.3.1 이질적인 속성 = 193
  6.3.2 그 외 거리 함수들 = 194
  6.3.3 혼합 함수 : 이웃 점수 매기기 = 197
 6.4 군집화 = 199
  6.4.1 사례 : 위스키 분석 다시 보기 = 200
  6.4.2 계층적 군집화 = 200
  6.4.3 다시 보는 최근접 이웃 : 중점 주변의 군집화 = 205
  6.4.4 예제 : 비즈니스 뉴스 기사 군집화 = 210
  6.4.5 군집화 결과의 이해 = 214
  6.4.6 군집을 설명하기 위해 감독 학습법 적용하기 = 216
 6.5 비즈니스 문제 해결과 데이터 탐사 문제 = 219
 6.6 요약 = 222
CHAPTER 7 결정 분석적 사고 1 : 좋은 모델은? 
 7.1 분류자 평가 = 224
  7.1.1 널리 사용되는 정확도가 가진 문제 = 225
  7.1.2 혼동 행렬 = 226
  7.1.3 편중된 계층 문제 = 226
  7.1.4 비용대비 효과의 불균형 문제 = 230
 7.2 모델 평가에 대한 일반적인 원리 = 230
 7.3 핵심 분석 프레임워크 : 기댓값 = 231
  7.3.1 기댓값을 사용한 분류자 사용 = 232
  7.3.2 기댓값을 이용한 분류자 평가 = 234
 7.4 평가, 기준선 성능, 데이터 투자의 영향 = 242
 7.5 요약 = 246
CHAPTER 8 모델 성능 시각화 
 8.1 분류 대신 서열화하기 = 250
 8.2 수익 곡선 = 252 
 8.3 ROC 그래프와 곡선 = 255
 8.4 ROC 곡선 하위 영역(AUC) = 260
 8.5 누적 응답 곡선과 향상도 곡선 = 260
 8.6 예제 : 고객 이탈 모델링에 대한 성능 분석 = 263
 8.7 요약 = 272
CHAPTER 9 증거와 확률 
 9.1 예제 : 온라인 고객 광고 타겟팅 = 275
 9.2 증거의 통계적 조합 = 278
  9.2.1 결합 확률과 독립 = 279
  9.2.2 베이즈 규칙 = 280
 9.3 데이터 과학에 베이즈 규칙 응용 = 282
  9.3.1 조건부 독립과 나이브 베이즈 = 283
  9.3.2 나이브 베이즈의 장단점 = 285
 9.4 증거 '향상도' 모델 = 287
 9.5 예제 : 페이스북 '좋아요'의 증거 향상도 = 288
  9.5.1 증거의 활용 : 타겟 광고 = 290
 9.6 요약 = 291
CHAPTER 10 텍스트 표현 및 마이닝 
 10.1 텍스트가 중요한 이유 = 294
 10.2 텍스트가 어려운 이유 = 295
 10.3 텍스트 표현법 = 296
  10.3.1 단어 주머니 = 296
  10.3.2 단어 빈도 = 297
  10.3.3 희박성 측정 : 역문서 빈도(IDF) = 299
  10.3.4 단어 빈도와 역문서 빈도의 결합(TFIDF) = 301
 10.4 예제 : 재즈 음악가 = 302
 10.5 IDF와 엔트로피의 관계 = 306
 10.6 단어 주머니보다 복잡한 표현들 = 309
  10.6.1 n-그램 순열 = 309
  10.6.2 개체명 추출 = 310
  10.6.3 주제 모델 = 310
 10.7 예제 : 주가 변동을 예측하기 위한 뉴스 기사 마이닝 = 312
  10.7.1 작업 = 312
  10.7.2 데이터 = 314
  10.7.3 데이터 전처리 = 317
  10.7.4 결과 = 318
 10.8 요약 = 322
CHAPTER 11 결정 분석적 사고 2 : 분석 공학 
 11.1 자선 단체 후원할 가능성이 높은 후원자 타겟팅 = 326
  11.1.1 기댓값 프레임워크 : 문제 분할과 부분 해결책 재조합 = 326
  11.1.2 표본 편중에 대한 여담 = 329
 11.2 훨씬 더 복잡한 고객 이탈 문제 = 330
  11.2.1 기댓값 프레임워크 : 더욱 복잡한 문제의 구조화 = 330
  11.2.2 혜택의 영향 평가 = 332
  11.2.3 기댓값 분할에서 데이터 과학 해결책으로 = 333
 11.3 요약 = 337
CHAPTER 12 기타 데이터 과학 작업과 기법 
 12.1 동시 발생과 연관성의 발견 = 340
  12.1.1 놀라운 발견 : 향상도와 영향도 = 341
  12.1.2 예제 : 맥주와 로또 = 342
  12.1.3 페이스북 '좋아요' 간의 연관성 = 343
 12.2 프로파일링 : 전형적인 행동의 발견 = 347
 12.3 연결 예측과 친구 추천 = 352
 12.4 데이터 축소, 잠재 정보, 영화 추천 = 354
 12.5 편중, 편차, 조합 기법 = 358 
 12.6 데이터 주도 인과 관계 설명과 바이럴 마케팅 예제 = 361
 12.7 요약 = 363
CHAPTER 13 데이터 과학과 비즈니스 전략 
 13.1 돌아온 데이터 분석적 사고 = 366
 13.2 데이터 과학으로 경쟁 우위 획득 = 368
 13.3 데이터 과학으로 경쟁 우위 유지 = 369
  13.3.1 강력한 역사적 유산 = 370
  13.3.2 고유한 지적 재산 = 370
  13.3.3 고유한 무형의 담보 자산 = 371
  13.3.4 최고의 데이터 과학자 = 371
  13.3.5 초우량 데이터 과학 관리 = 373
 13.4 데이터 과학자 및 팀의 영입과 육성 = 375
 13.5 데이터 과학 사례 연구 조사 = 377
 13.6 모든 창조적인 아이디어의 수용 = 378
 13.7 데이터 과학 프로젝트 제안서 평가 = 379
  13.7.1 데이터 마이닝 제안서 예제 = 379
  13.7.2 빅레드 제안서의 결합 = 380
 13.8 기업의 데이터 과학 성숙도 = 381
CHAPTER 14 결론 
 14.1 데이터 과학의 기본 개념 = 385
  14.1.1 기본 개념을 새로운 문제에 적용하기 : 휴대 기기 데이터 마이닝 = 388
  14.1.2 비즈니스 문제의 해결책에 대한 사고 방식의 전환 = 391
 14.2 데이터가 할 수 없는 일 : 사람이 중심에 = 392
 14.3 개인 정보 보호, 윤리, 데이터 마이닝 = 396
 14.4 데이터 과학에 대한 남은 이야기 = 397
 14.5 마지막 사례 : 크라우드 소싱에서 클라우드 소싱으로 = 398 
 14.6 책을 마치며 = 399 
APPENDIX 부록
 A.1 제안서 검토 가이드 = 401 
 A.2 또 다른 제안서 예제 = 404 
 A.3 용어 정리 = 406
찾아보기 = 414

New Arrivals Books in Related Fields