HOME > 상세정보

상세정보

(MS 본사 데이터 과학자가 알려주는) 헬로 데이터 과학

자료유형
단행본
개인저자
김진영
서명 / 저자사항
(MS 본사 데이터 과학자가 알려주는) 헬로 데이터 과학 = Hello data science / 김진영 지음
발행사항
서울 : 한빛미디어, 2016
형태사항
352 p. : 삽화, 도표 ; 23 cm
ISBN
9788968482656
일반주기
삶과 업무를 바꾸는 생활 데이터 활용법! ; 엑셀로 해보는 데이터 과학
000 00000cam c2200205 c 4500
001 000045864063
005 20160304160144
007 ta
008 160304s2016 ulkad 000c kor
020 ▼a 9788968482656 ▼g 13000
035 ▼a (KERIS)BIB000013999499
040 ▼a 241018 ▼c 241018 ▼d 211009
082 0 4 ▼a 006.312 ▼2 23
085 ▼a 006.312 ▼2 DDCK
090 ▼a 006.312 ▼b 2016z1
100 1 ▼a 김진영
245 2 0 ▼a (MS 본사 데이터 과학자가 알려주는) 헬로 데이터 과학 = ▼x Hello data science / ▼d 김진영 지음
246 3 0 ▼a 데이터 과학
246 3 1 ▼a Data science
260 ▼a 서울 : ▼b 한빛미디어, ▼c 2016
300 ▼a 352 p. : ▼b 삽화, 도표 ; ▼c 23 cm
500 ▼a 삶과 업무를 바꾸는 생활 데이터 활용법! ; 엑셀로 해보는 데이터 과학
945 ▼a KLPA

소장정보

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 006.312 2016z1 등록번호 121235905 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 2 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 006.312 2016z1 등록번호 121236076 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 3 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 006.312 2016z1 등록번호 121236642 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 4 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 006.312 2016z1 등록번호 121236643 도서상태 대출가능 반납예정일 예약 서비스 B M

컨텐츠정보

책소개

흔히 데이터 과학은 전문가를 위한 영역이라고 생각한다. 하지만 이 책은 비전문가를 위하여 복잡한 이론과 프로그래밍 없어도 할 수 있는 데이터 과학을 소개한다. 이 책의 사례와 예제를 보면서 '이게 데이터 과학이야?'라고 생각할 수도 있지만, 원래 데이터 과학은 데이터를 수집하고 분석하여 문제를 해결하고 결과를 소통하는 과정 전체를 가리키는 말이다. 이 책에서는 복잡하고 어려운 이론 대신에, 쉬우면서 독자들의 삶과 업무에 활용 가능한 예제와 실습에 초점을 맞추었다.

우리 모두를 위한 데이터 과학을 꿈꾸며
이 책은 '우리 모두를 위한 데이터 과학'을 이야기한다. 필자가 전달하고자 하는 주된 메시지는 우리 주변에 이미 데이터를 수집하고 분석할 수 있는 다양한 수단이 존재하며, 데이터를 활용하여 삶과 업무를 개선하는 일은 결코 복잡하지 않다는 것이다. 이 책은 초보적인 수준의 통계와 컴퓨터 지식을 갖춘 보통 사람이 데이터 과학을 시작할 수 있는 방법을 제시하고, 이런방법을 개인의 삶과 업무에 활용하는 다양한 사례를 소개한다.
비전문가도 책을 읽고 나서 활용할 수 있도록 엑셀을 사용한다. 따라서 이 책을 읽고 나면 개인 데이터, 생활 데이터 같은 스몰 데이터에 데이터 과학을 접목하여 분명 여러분도 자신의 문제를 해결할 수 있을 것이다.

★ 이 책이 말하는 데이터 과학이란?
흔히 데이터 과학은 전문가를 위한 영역이라고 생각한다. 하지만 이 책은 비전문가를 위하여 복잡한 이론과 프로그래밍 없어도 할 수 있는 데이터 과학을 소개한다. 이 책의 사례와 예제를 보면서 '이게 데이터 과학이야?'라고 생각할 수도 있지만, 원래 데이터 과학은 데이터를 수집하고 분석하여 문제를 해결하고 결과를 소통하는 과정 전체를 가리키는 말이다. 이 책에서는 복잡하고 어려운 이론 대신에, 쉬우면서 독자들의 삶과 업무에 활용 가능한 예제와 실습에 초점을 맞추었다.

★ 삶과 업무를 바꾸는 데이터 과학의 가능성
필자는 미국의 대학원에서 데이터 과학의 첨단을 대표하는 분야인 정보 검색을 전공하여 박사학위를 받고, 현재 미국 마이크로소프트 온라인 서비스 부문에서 데이터 과학자로 근무하고 있다. 이는 매일 수많은 종류의 데이터를 접하고, 이를 바탕으로 다양한 분석을 수행하는 일이다. 이런 경험은 앞에서 언급한 데이터 혁명의 위력과 파급효과를 그 최전선에서 느낄 수 있게 해주었다.

특히 필자가 담당하는 업무는 미국 검색 트래픽의 30%를 담당하는 빙(Bing.com) 서비스의 품질 측정 및 개선을 위한 데이터 셋과 지표를 만드는 일이다. 검색엔진 개발의 모든 프로세스는 정량적인 지표에 따라 계획, 실행 및 평가되기 때문에 이는 조직의 방향을 결정하는 일이라고 할 수 있다. 또한 업무의 일부로 사내에서 데이터 수집 및 분석에 대한 교육을 진행하면서 데이터를 업무에 제대로 활용하기 위해서는 많은 노하우가 필요하다는 사실을 깨달았다.

보통 데이터라고 하면 일에만 적용하는 것으로 생각하기 쉽다. 그렇지만 필자는 업무 이외의 영역에서도 데이터를 활용하는 방법을 항상 고민해왔다. 대학을 다닐 때부터 '내가 행복하다고 느끼는 시간의 양을 최대화하는 것'이 인생의 목표 중 하나라고 여겨왔던 필자는 개인의 행복도를 측정하고 개선할 수 있는 방법을 찾기 위해 약 10년간 다양한 방법을 개발하였다. 그리고 최근에는 생산성, 건강, 인간관계 등 삶의 다른 영역에서도 비슷한 접근을 시도하고 있다.
미국에는 이처럼 개인 데이터 분석에 관심을 갖는 사람들이 '수치화된 나(Quantified Self)'라는 지역별 커뮤니티를 만들어 활동하고 있다. 필자는 2011년부터 보스턴 및 시애틀의 Quantified Self에 활발히 참여하면서 데이터 분석을 통해 자신의 목표를 달성하고 심지어 삶을 바꾸는 여러 경우를 목격하였다. 필자의 행복 측정 프로젝트도 여러 사람의 관심을 끌어 최근에 지역 신문에서 기사화하기도 했다.

이처럼 일과 삶에서 데이터를 활용하는 방법을 고민하면서, 필자는 데이터 과학이 어떤 특정한 산업이나 직업군의 사람에게만 가능한 일은 아니라고 확신하게 되었다. 또한 자신의, 혹은 주변의 데이터를 모으고 분석하는 방법에 대한 사례와 노하우를 블로그, 기고문 등을 통해 공유하기 시작했다. 이런 글들이 여러 사람의 관심과 격려를 받기 시작하면서, 필자는 더 많은 사람에게 이런 메시지를 전달하기 위한 방법을 고민하기 시작했다. 이 책은 그런 고민의 산물이다.

★ 대상 독자
데이터 과학에 대해 책을 쓰겠다는 결심을 하고 서점을 둘러보았을 때, 기존 데이터 과학 관련 책들이 '이미 데이터 과학자이거나 관련 분야의 전공자인 사람'을 대상으로 하고 있다는 사실을 발견했다. 그래서 그 이외의 사람들을, 구체적으로 다음에 해당하는 독자들을 염두에 두고 이 책을 썼다.

- 데이터 과학이 남의 이야기라고 생각하는 사람 : 1장은 왜 우리 모두가 데이터 과학에 관심을 가져야 하며, 데이터를 실제로 삶과 업무에 활용하는 것이 생각보다 어려운 일이 아님을 논하고 있다. 5장~6장에서 데이터 과학의 다양한 활용 사례를 찾을 수도 있을 것이다.
- 데이터 과학에 관심만 있는 사람 : 데이터 활용에 관심이 있었지만 어디서 시작할지 막막했던 사람이라면, 2장~4장에서 구체적인 방법과 따라 할 수 있는 예제를 찾을 수 있을 것이다.
- 데이터 과학을 더 잘 활용하고 싶은 사람 : 데이터 과학을 이미 어느 정도 활용하고 있는 사람이라면, 2장~4장의 방법론을 복습하고, 5장~6장의 사례를 살펴보도록 하자.
- 앞으로 데이터 과학자가 되려는 사람 : 데이터 과학자로서의 커리어에 관심이 있는 사람이라면, 앞 부분을 꼼꼼히 살펴본 후 7장에서 소개하는 다양한 자료를 참고하도록 하자.
- 데이터 과학자와 함께 일하려는 사람 : 직접 데이터 관련 업무를 담당하지 않더라도 데이터 과학자 및 분석가와 함께 일하는 독자들에게 이 책의 내용은 데이터 과학자 혹은 분석가의 세계를 이해하고 그들과 함께 일하는 데 도움이 될 것이다.


정보제공 : Aladin

저자소개

김진영(지은이)

미국 메사추세츠 주립대에서 컴퓨터 사이언스(정보 검색) 전공으로 박사학위를 받고 현재 미국 마이크로소프트 본사의 빙(Bing) 검색엔진 부문의 연구자로 일한다. 회사에서 검색 품질을 평가하는 일을 담당하며, 마이크로소프트 신입사원을 상대로 업무에서 활용할 수 있는 데이터 과학을 가르치기도 한다. 개인적으로 삶의 생산성과 행복도를 높일 수 있는 다양한 데이터 수집 및 분석 방법을 개발하여 사용하고 있고, 이런 활동을 'Seattle Times'에서 보도했다. 정보 검색, 기계학습, 측정 등을 주제로 한 개인 블로그 '헬로 데이터 과학'을 운영한다.

정보제공 : Aladin

목차

1장 데이터 과학 입문 
삶과 비즈니스를 바꾸는 데이터의 가능성 
__의학을 보완하는 개인 데이터의 힘 : 마크 드랭숄트 
__스타트업의 성장 신화를 뒷받침하는 데이터의 힘 : 에어비앤비 
__이들은 데이터를 어떻게 활용했나 
데이터 과학과 테이블 
__데이터는 테이블이다 
__데이터 과학은 테이블 놀이다 
데이터 과학에 대한 오해와 진실 
__스몰데이터로 시작하라 
__단순한 도구와 기술로 시작하라 
데이터 과학을 시작하는 방법 
__데이터 마인드를 가져라 
__데이터 습관을 길러라 
__관련 지식과 기술을 익혀라 
맺음말 

2장 데이터 과학에 유용한 도구 
데이터 과학을 위한 도구 선택하기 
__처리 용량 및 속도 
__지원 데이터형 및 프로그래밍 환경 
__데이터 분석 및 시각화 기능 
__문제 특성에 맞는 도구의 선택 
__문제 해결 단계에 맞는 도구 선택 
엑셀로 시작하는 데이터 과학 
__코드가 아닌 데이터가 중심이다 
__올인원 솔루션이다 
__결과물을 쉽게 공유할 수 있다 
언제부터 엑셀 대신 R을 사용해야 할까 
__워크시트에서 변수로 
__메뉴에서 함수로 
__분석에서 예측으로 
[실습] 엑셀의 기초 
__데이터 불러오기 
__데이터 준비하기 
__데이터 분석 및 시각화하기 
__데이터 집계하기 
[실습] R 맛보기 
__R 작업을 위한 환경 구축 
__R의 기본 기능 
__데이터 준비하기 
__데이터 분석하기 
맺음말 

3장 문제 정의와 데이터 수집 및 준비 
데이터 문제 정의하기 
__데이터 문제 해결 단계 
__데이터 분석 단계 
[사례] 직원 만족도 개선을 위한 데이터 분석 
__데이터 문제 정의하기 
[사례] 넷플릭스 프라이즈 문제 정의 
__유의사항 
데이터 수집하기 
__데이터 수집의 기본 
__수집 방법 결정하기 
[심화학습] 측정 기술 
__어떤 대상도 측정할 수 있는가 
__어떤 대상도 측정할 수 있는 방법 
__수집 환경 결정하기 
[심화학습] 실험 디자인 
__무작위 디자인 
__블록 디자인 
__수집할 데이터양 결정하기 
__데이터 품질 점검하기 
__유의사항 
__데이터 준비하기 
__데이터 선택, 추가, 집계하기 
[실습] 엑셀을 이용한 데이터 준비 
맺음말 

4장 데이터 분석과 스토리텔링 
현상 이해하기 : 탐색적 데이터 분석 
__탐색적 분석 단계 
[사례] 엑셀로 해보는 탐색적 데이터 분석 
__개별 속성 분석하기 
__속성 간의 관계 분석하기 
__유의사항 : 관점은 갖되 편견은 금물이다 
현상 일반화하기 : 통계적 추론 
__통계적 추론의 원리 
__통계적 추론의 유형 
[실습] 엑셀로 해보는 통계적 추론 
__탐색적 데이터 분석 
__데이터 가공하기 
__통계적 추론 
__유의사항 : 데이터에서 도출하는 결론의 가치와 한계 
현상 예측하기 : 기계학습 
__기계학습 유형 
__기계학습 개념 
__기계학습 절차 
[사례] 스몰데이터로 해보는 기계학습 
데이터 스토리텔링 
__데이터 스토리텔링 방법 
__효과적인 데이터 스토리텔링 원칙 
[사례] FiveThirtyEight 
__서론 
__본론 
__결론 
맺음말 

5장 개인 데이터로 공부하는 데이터 과학 
개인 데이터 활용으로 삶을 바꾸는 사람들 
__개인 데이터 활용의 유형과 목표 
__개인 데이터 활용 방법 
[사례] 건강 및 식생활 지표화 
__문제 정의하기 
__건강 데이터화 및 개선하기 
__식사 및 운동량 측정하기 
__마치며 
[사례] 정성적인 현상(행복) 지표화 
__행복 측정 프로젝트 
__행복을 측정하는 방법 
__행복 측정의 결과 
__마치며 
개인 데이터 수집 및 분석 시작하기 
__문제 탐색하기 
__데이터 수집하기 
__분석 및 결과 실천하기 
__자신의 경험 공유하기 
__마치며 
맺음말 

6장 공개 데이터로 공부하는 데이터 과학 
공공 데이터를 통한 탐색적 분석 
__문제 정의하기 
__데이터 수집하기 
__탐색적 데이터 분석 
__유의사항 : 데이터를 검정하고 목표에 집중하라 
경연 데이터를 통한 실전 예측 모델링 
__경연 준비하기 : 나도 할 수 있을까 
__캐글 참가자들의 성공 비결 
__캐글 참여하기 : 타이타닉호 생존자 예측 
비즈니스 성장을 위한 데이터 과학 
[가상 사례] 식당 운영을 위한 데이터 과학 
__식당 창업에 도전한 김 사장의 고민 
__데이터 과학자인 조카의 조언 
__메뉴의 변화가 매출에 미치는 영향 
__고객의 만족도를 알아내는 방법은 무엇인가 
__고객의 만족도를 알아내기 : 고객 행동 분석 
__실험을 통한 신 메뉴 개발 
__데이터 활용의 숨은 장벽들 
__고객 유입의 단계별 데이터 활용 
야구 통계를 통해 지표 개발 배우기 
__야구 통계의 흐름 
__야구 통계의 기초와 전통적인 지표들 
__현대적인 야구 통계가 가져온 혁신 
__마치며 
맺음말 328 

7장 입문을 넘어서 : 데이터 과학자의 길 
데이터 과학자로 살아가기 
__검색엔진 분야에서의 데이터 과학 
__데이터 과학 프로젝트의 시작과 끝 
__데이터 과학자의 일상 
데이터 과학자가 되는 길 
__나에게 어울리는 길인가 
__무엇을 목표로 해야 하나 
__어떻게 공부해야 하나 
__어떻게 취업을 준비할 것인가 
데이터 과학의 미래 
__데이터 관련 기술적인 진보의 가속화 
__데이터 과학의 더욱 폭넓은 활용 
__데이터 과학자 수요 증가 
맺음말

관련분야 신착자료

Taulli, Tom (2020)