HOME > 상세정보

상세정보

(Kaggle 우승작으로 배우는) 머신러닝 탐구생활 : 파이썬을 활용한 머신러닝 실전 예제 분석 (58회 대출)

자료유형
단행본
개인저자
정권우
서명 / 저자사항
(Kaggle 우승작으로 배우는) 머신러닝 탐구생활 : 파이썬을 활용한 머신러닝 실전 예제 분석 / 정권우 지음
발행사항
서울 :   BJpublic,   2018  
형태사항
xviii, 397 p. : 삽화, 도표 ; 24 cm
ISBN
9791186697696
일반주기
색인수록  
000 00000cam c2200205 c 4500
001 000045954891
005 20180913131620
007 ta
008 180913s2018 ulkad 001c kor
020 ▼a 9791186697696 ▼g 93000
035 ▼a (KERIS)BIB000014926633
040 ▼a 211046 ▼c 211046 ▼d 241026 ▼d 211009
082 0 4 ▼a 006.31 ▼2 23
085 ▼a 006.31 ▼2 DDCK
090 ▼a 006.31 ▼b 2018z22
100 1 ▼a 정권우
245 2 0 ▼a (Kaggle 우승작으로 배우는) 머신러닝 탐구생활 : ▼b 파이썬을 활용한 머신러닝 실전 예제 분석 / ▼d 정권우 지음
260 ▼a 서울 : ▼b BJpublic, ▼c 2018
300 ▼a xviii, 397 p. : ▼b 삽화, 도표 ; ▼c 24 cm
500 ▼a 색인수록
945 ▼a KLPA

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 중앙도서관/제2자료실(3층)/ 청구기호 006.31 2018z22 등록번호 111799893 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 2 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 006.31 2018z22 등록번호 121245995 도서상태 대출중 반납예정일 2021-10-13 예약 서비스 M
No. 3 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 006.31 2018z22 등록번호 121246507 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 4 소장처 세종학술정보원/과학기술실/ 청구기호 006.31 2018z22 등록번호 151342958 도서상태 대출가능 반납예정일 예약 서비스
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 중앙도서관/제2자료실(3층)/ 청구기호 006.31 2018z22 등록번호 111799893 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 006.31 2018z22 등록번호 121245995 도서상태 대출중 반납예정일 2021-10-13 예약 서비스 M
No. 2 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 006.31 2018z22 등록번호 121246507 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 세종학술정보원/과학기술실/ 청구기호 006.31 2018z22 등록번호 151342958 도서상태 대출가능 반납예정일 예약 서비스

컨텐츠정보

책소개

과거 캐글 경진대회에서 제공된 실제 데이터를 다룬다. 먼저, 경진대회에 출제된 문제를 올바르게 이해하고, 데이터 시각화 과정을 통해 데이터에 대한 이해를 쌓아간다. 그리고 높은 순위를 기록한 상위 입상자의 코드를 직접 분석하고 피쳐 엔지니어링, 모델 튜닝, 교차 검증 기법을 독자가 직접 재현할 수 있도록 돕는다.

파이썬을 활용한 머신러닝 실전 예제 분석

이 책은 과거 캐글 경진대회에서 제공된 실제 데이터를 다룬다. 머신러닝을 시작하기 위하여 두껍고 어려운 선형대수, 미적분, 통계 책을 읽기 시작하여 고통받고 있는 독자를 위하여, 이 책은 더 재미있고 피부에 와닿는 실제 경진대회를 통해 머신러닝을 배울 수 있도록 돕고자 한다.

먼저, 경진대회에 출제된 문제를 올바르게 이해하고, 데이터 시각화 과정을 통해 데이터에 대한 이해를 쌓아간다. 그리고 높은 순위를 기록한 상위 입상자의 코드를 직접 분석하고 피쳐 엔지니어링, 모델 튜닝, 교차 검증 기법을 독자가 직접 재현할 수 있도록 돕는다. 이 책을 통해 독자는 "성공적인 머신러닝 파이프라인"이 무엇인지를 배우게 될 것이다.

이 책의 특징
- 캐글 경진대회 상위 입상자의 코드를 한 땀 한 땀 분석한다.
- 실제 업계에서 사용하는 Tabular 데이터, 이미지 데이터, 텍스트 데이터, 음성 데이터를 직접 다룬다.
- 최신 머신러닝 모델(XGBoost, LightGBM, CatBoost, PyTorch)을 사용해본다.

독자대상
초중급

소스코드 다운로드
https://github.com/bjpublic/kaggleml

캐글은 2010년에 설립된 머신러닝 경진대회 플랫폼이다. 기업과 연계하여 주최되는 경진대회를 통해 머신러닝 문제와 데이터가 제공되면, 캐글에 가입한 데이터 분석가, 통계학자, 머신러닝 엔지니어 등의 개개인이 모여 가장 높은 점수를 내기 위해 경쟁하는 구조이다. 기업은 우승자의 코드와 분석 기법을 토대로 기업이 보유한 내부 머신러닝 알고리즘을 고도화할 수 있는 기회를 얻게 되고, 개인들은 평소에 접할 수 없는 데이터를 직접 다루는 기회를 얻으며, 상위 입상 시 고액의 상금을 얻는다.

아마존, 페이스북, 구글 등 모두가 아는 IT 기업들도 캐글에 경진대회를 개최한 경험이 있다. 세계 최고 수준의 머신러닝 알고리즘을 구현하는 기업, 구글 딥마인드에서도 파이썬을 활용한 캐글 경진대회에서 우수한 성적을 거두면 자연스럽게 쌓아갈 수 있는 풍부한 경험과 지식을 채용 1순위 기준으로 삼고 있다. 이 책은 전세계에서 인정받을 수 있는 머신러닝 엔지니어 업무를 커리어로 삼고 싶은 독자들을 위한 책이다.


정보제공 : Aladin

저자소개

정권우(지은이)

카네기멜론 대학교 응용수학과 학부를 졸업했다. 5살부터 유초중고 시절을 일본 도쿄에서 보내고, 대학교를 미국으로 진학한 덕분에 한국어, 일본어, 영어가 능통하다. 대학에서는 금융수학을 전공한 후 UBS Seoul, JP Morgan Tokyo지사에서 사회생활을 시작했다. 대학교 2학년 때 처음으로 접한 프로그래밍에 관심을 갖게 되어, 휴학 후 한국에서의 병역특례 군복무 시절 머신러닝을 독학으로 공부했다. 캐글 경진대회를 통해 머신러닝을 배웠으며, 글로벌 캐글 랭킹이 그 사람의 머신러닝 능력을 대변한다고 믿는다. 캐글 본사의 허락 하에, 공식 블로그를 한글로 번역하고 있으며, 2016년 12월에는 패스트캠퍼스에서 "파이썬을 활용한 머신러닝 프로젝트 CAMP" 강사로 캐글 경진대회를 활용하여 실무 머신러닝 기술을 가르쳤다. 모바일 콘텐츠 플랫폼 카카오페이지를 운영하는 다음카카오의 자회사 포도트리를 거쳐, P2P 투자 기업 8퍼센트의 챗봇을 개발한 데이터나다에서 머신러닝 엔지니어로 근무한 경력이 있다. 지금은 네이버 파파고 팀에서 딥러닝을 통해 더 나은 번역기를 개발하는 일을 하고 있다.

정보제공 : Aladin

목차

1장 파이썬과 머신러닝 그리고 캐글 
1.1 왜 파이썬인가 
1.2 왜 캐글인가? 
1.3 캐글을 시작하는 방법 
1.4 경진대회에 통하는 실질적인 팁 
1.5 경진대회 선별 기준 

2장 산탄데르 제품 추천 경진대회 
2.1 경진대회 소개 
2.2 경진대회 주최자의 동기 
2.3 평가 척도 
2.4 주요 접근 
2.5 데이터 준비하기 
2.6 탐색적 데이터 분석 
2.7 Baseline 모델 
2.8 승자의 지혜 - 8등 소스코드 분석 
2.9 승자의 지혜 

3장 텐서플로 음성 인식 경진대회 
3.1 경진대회 소개 
3.2 경진대회 주최자의 동기 
3.3 평가 척도 
3.4 주요 접근 
3.5 데이터 준비하기 
3.6 탐색적 데이터 분석 
3.7 Baseline 모델 
3.8 승자의 지혜 - 3등 소스코드 분석 
3.9 승자의 지혜 

4장 포르토 세구로 안전 운전자 예측 경진대회 
4.1 경진대회 소개 
4.2 경진대회 주최자의 동기 
4.3 평가 척도 
4.4 주요 접근 
4.5 데이터 준비하기 
4.6 탐색적 데이터 분석 
4.7 Baseline 모델 
4.8 승자의 지혜 - 2등 소스코드 분석 
4.9 승자의 지혜 

5장 스테이트 팜 산만한 운전자 감지 경진대회 
5.1 경진대회 소개 
5.2 경진대회 주최자의 동기 
5.3 평가 척도 
5.4 주요 접근 
5.5 데이터 준비하기 
5.6 탐색적 데이터 분석 
5.7 Baseline 모델 
5.8 성능 개선 실험 
5.9 승자의 지혜

관련분야 신착자료

Cartwright, Hugh M. (2021)
한국소프트웨어기술인협회. 빅데이터전략연구소 (2021)