HOME > 상세정보

상세정보

Scikit-learn으로 머신 러닝 마스터 2/e : 지도 학습, 비지도 학습, 강화 학습 - 핵심 기법 이해와 활용

Scikit-learn으로 머신 러닝 마스터 2/e : 지도 학습, 비지도 학습, 강화 학습 - 핵심 기법 이해와 활용 (15회 대출)

자료유형
단행본
개인저자
Hackeling, Gavin 이병욱, 역
서명 / 저자사항
Scikit-learn으로 머신 러닝 마스터 2/e : 지도 학습, 비지도 학습, 강화 학습 - 핵심 기법 이해와 활용 / 개빈 해클링 지음 ; 이병욱 옮김
발행사항
서울 :   에이콘,   2018  
형태사항
306 p. : 삽화, 도표 ; 24 cm
총서사항
acorn+PACKT technical book 시리즈
원표제
Mastering machine learning with scikit-learn : apply effective learning algorithms to real-world problems using scikit-learn (2nd ed.)
ISBN
9791161751603 9788960772106(세트)
일반주기
기술 감수자: 오렉 오쿤(Oleg Okun)  
색인수록  
일반주제명
Machine learning Python (Computer program language)
000 00000cam c2200205 c 4500
001 000045947199
005 20180711112348
007 ta
008 180711s2018 ulkad 001c kor
020 ▼a 9791161751603 ▼g 94000
020 1 ▼a 9788960772106(세트)
035 ▼a (KERIS)BIB000014845307
040 ▼a 248002 ▼c 248002 ▼d 248002 ▼d 211009
041 1 ▼a kor ▼h eng
082 0 4 ▼a 006.31 ▼2 23
085 ▼a 006.31 ▼2 DDCK
090 ▼a 006.31 ▼b 2018z16
100 1 ▼a Hackeling, Gavin
245 1 0 ▼a Scikit-learn으로 머신 러닝 마스터 2/e : ▼b 지도 학습, 비지도 학습, 강화 학습 - 핵심 기법 이해와 활용 / ▼d 개빈 해클링 지음 ; ▼e 이병욱 옮김
246 1 9 ▼a Mastering machine learning with scikit-learn : ▼b apply effective learning algorithms to real-world problems using scikit-learn ▼g (2nd ed.)
260 ▼a 서울 : ▼b 에이콘, ▼c 2018
300 ▼a 306 p. : ▼b 삽화, 도표 ; ▼c 24 cm
440 0 0 ▼a acorn+PACKT technical book 시리즈
500 ▼a 기술 감수자: 오렉 오쿤(Oleg Okun)
500 ▼a 색인수록
650 0 ▼a Machine learning
650 0 ▼a Python (Computer program language)
700 1 ▼a 이병욱, ▼e
900 1 0 ▼a 해클링, 개빈, ▼e
945 ▼a KLPA

소장정보

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 006.31 2018z16 등록번호 121245200 도서상태 대출중 반납예정일 2021-07-06 예약 예약가능 R 서비스 M

컨텐츠정보

책소개

머신 러닝의 관계에 관해 기초적인 개념을 정립할 수 있도록 돕는다. 지도 학습, 비지도 학습, 강화 학습에 이르기까지 머신 러닝에서 주로 사용되는 기법 대부분을 비교해 설명하며, 이에 관해 파이썬의 scikit-learn 패키지를 사용한 예제를 직접 수행해 볼 수 있다.

특히 잘 정립되고 간결한 설명은 모든 머신 러닝 기법의 기본 개념을 다시 한 번 확고히 이해하는 데 많은 도움을 줄 것이다. 또한 모든 예제를 파이썬 scikit-learn을 사용해 제공하기 때문에 코드를 직접 수행해 가면서 책을 읽을 수 있다.

머신 러닝의 관계에 관해 기초적인 개념을 정립할 수 있도록 돕는 책이다. 지도 학습, 비지도 학습, 강화 학습에 이르기까지 머신 러닝에서 주로 사용되는 기법 대부분을 비교해 설명하며, 이에 관해 파이썬의 scikit-learn 패키지를 사용한 예제를 직접 수행해 볼 수 있다.
특히 잘 정립되고 간결한 설명은 모든 머신 러닝 기법의 기본 개념을 다시 한 번 확고히 이해하는 데 많은 도움을 줄 것이다. 또한 모든 예제를 파이썬 scikit-learn을 사용해 제공하기 때문에 코드를 직접 수행해 가면서 책을 읽을 수 있다.

★ 이 책에서 다루는 내용 ★

■ 편향과 분산 등의 기본 개념
■ 범주형 변수, 텍스트, 이미지 등에서 특징 추출
■ 선형 회귀와 k-최근접 이웃을 사용한 연속 변수 예측
■ 로지스틱 회귀와 서포트 벡터 머신을 이용한 문서와 이미지 분류
■ 배깅과 부스팅 기법을 활용한 예측기의 앙상블 구축
■ K-평균 군집화를 사용한 데이터 내 숨겨진 구조의 발견
■ 보편적으로 사용되는 머신 러닝 시스템의 성능 평가

★ 이 책의 대상 독자 ★

보편적인 머신 러닝 알고리즘의 작동법을 이해하고 어떻게 활용할 것인지에 대한 직관을 얻는 데 도움을 주기 위한 책이다. 또한 이 책은 scikit-learn API를 배우고자 하는 데이터 과학자에게도 유용하다. 책을 읽을 때 머신 러닝의 기초 지식이나 파이썬 지식이 있으면 도움이 되겠지만 반드시 있어야만 하는 것은 아니다.

★ 이 책의 구성 ★

1장, '머신 러닝 기초'에서는 머신 러닝을 경험으로부터 학습해 성능을 개선하는 프로그램을 연구하고 디자인하는 것이라 정의한다. 이는 책 전반에 걸쳐 가이드 역할을 한다. 각 장에서 머신 러닝 모델을 살펴보고 과제에 직접 응용하며, 그 성능을 평가해본다.
2장, '단순 선형 회귀'에서는 단일 특징과 연속 반응 변수 사이의 관계를 설정하는 모델을 알아본다. 비용 함수에 대해 배우며 모델을 최적화하기 위해 정규 방정식을 사용한다.
3장, 'K-최근접 이웃을 이용한 분류와 회귀'에서는 분류와 회귀 과제를 위한 간단한 비선형 모델을 소개한다.
4장, '특징 추출'에서는 텍스트, 이미지, 범주형 변수를 머신 러닝에서 사용할 수 있는 특징으로 표현하는 방법을 알아본다.
5장, '단순 선형 회귀'에서 다중 선형 회귀까지'에서는 연속 반응 변수에 회귀하는 단순 선형 회귀를 확장해 여러 개의 특징을 처리할 수 있게 일반화하는 방법을 알려준다.
6장, '선형 회귀부터 로지스틱 회귀까지'에서는 다중 선형 회귀를 더 일반화하고 이진 분류 과제를 위한 모델을 소개한다.
7장. '나이브 베이즈'에서는 베이즈 정리와 나이브 베이즈 계열의 분류기를 소개하고 생성 모델과 판별 모델을 서로 비교해본다.
8장, '의사결정 트리를 이용한 비선형 분류와 회귀'에서는 분류와 회귀 과제에 사용할 수 있는 간단한 비선형 모델인 의사결정 트리를 소개한다.
9장, '의사결정 트리에서 랜덤 포레스트와 앙상블 기법까지'에서는 모델을 병합하는 세 가지 방법인 배깅, 부스팅, 스태킹에 대해 알아본다.
10장, '퍼셉트론'에서는 이진 분류를 위한 간단한 온라인 모델을 소개한다.
11장, '퍼셉트론에서 서포트 벡터 머신까지'에서는 분류와 회귀를 위한 강력한 판별 모델인 서포트 벡터 머신을 소개하고, 특징을 고차원 공간으로 효과적으로 사상할 수 있는 기법을 설명한다.
12장, '퍼셉트론에서 인공 신경망까지'에서는 인공 신경망으로 구축된 분류와 회귀를 위한 강력한 비선형 모델을 소개한다.
13장, 'K-평균'에서는 레이블이 붙어있지 않은 데이터 내의 구조를 발견하는 데 사용되는 알고리즘을 알아본다.
14장, '주성분 분석을 이용한 차원 축소'에서는 차원의 저주(curse of dimensionality)를 완화할 수 있는 차원 축소 기법을 설명한다.


정보제공 : Aladin

저자소개

개빈 해클링(지은이)

데이터 과학자다. 자동 음성 인식, 문서 분류, 물체 인식, 의미 세분화 등의 다양한 머신 러닝 분야에서 일한다. 노스캐롤라이나 대학과 뉴욕 대학을 졸업했고 부인, 고양이와 함께 브루클린에서 살고 있다.

이병욱(옮긴이)

(주)크라스랩 대표 이사이자 서울과학종합대학원 디지털금융 MBA 주임교수를 맡고 있다. 한국과학기술원(KAIST) 전산학과 계산이론 연구실에서 학사 및 석사학위를 취득했다. 공학을 전공한 금융 전문가로 세계 최초의 핸드 헬드-PC(Handheld-PC) 개발에 참여해 한글 윈도우 CE 1.0과 2.0을 마이크로 소프트 사에서 공동 개발했다. 1999년에는 전 보험사 보험료 실시간 비교 서비스를 제공하는 핀테크 전문회사인 (주)보험넷을 창업해 업계에 큰 반향을 불러일으켰다. 이후 삼성생명을 비롯한 생명 및 손해 보험사에서 CMO(마케팅 총괄 상무), CSMO(영업 및 마케팅 총괄 전무) 등을 역임하면서 혁신적인 상품과 서비스를 개발 및 총괄했다. 세계 최초로 파생 상품 ELS를 기초 자산으로 한 변액 보험을 개발해 단일 보험 상품으로 5,000억 원 이상 판매되는 돌풍을 일으켰고, 매일 분산 투자하는 일 분산 투자(daily averaging) 변액 보험을 세계 최초로 개발해 상품 판매 독점권을 획득했다. 최근에는 머신러닝 기반의 금융 분석과 블록체인에 관심을 갖고 다양한 활동을 하고 있다. 저서로는 『블록체인 해설서』(에이콘, 2019)와 『비트코인과 블록체인, 가상자산의 실체 2/e』(에이콘, 2020)이 있다.

정보제공 : Aladin

목차

1장. 머신 러닝 기초 
__머신 러닝의 정의 
__경험으로부터 학습 
__머신 러닝 과제 
__훈련 데이터, 테스트 데이터, 검증 데이터 
__편향과 분산 
__scikit-learn 소개 
__scikit-learn 설치 
____pip를 사용한 설치 
____윈도우에 설치 
____우분투 16.04에 설치 
____맥 OS에 설치 
____아나콘다 설치 
____설치 검증 
__pandas, Pillow, NLTK, matplotlib 설치 
__요약 

2장 단순 선형 회귀 
__단순 선형 회귀 
____비용 함수를 사용한 모델의 적합도 평가 
____단순 선형 회귀를 위한 OLS 계산 
__모델 평가 
__요약 

3장. K-최근접 이웃을 이용한 분류와 회귀 
__k-최근접 이웃 
__게으른 학습과 비매개변수 모델 
__KNN을 사용한 분류 
__KNN을 사용한 회귀 
____특징의 크기 조절 
__요약 

4장. 특징 추출 
__범주형 변수에서 특징 추출 
__특징의 표준화 
__텍스트에서 특징 추출 
____단어 주머니 모델 
____불용어 필터링 
____형태소 추출과 어휘소 추출 
____tf-idf 가중치를 활용한 단어 주머니의 확장 
____해싱 기법을 사용한 공간효율적 특징 벡터 
____워드 임베딩 
__이미지에서 특징 추출 
____픽셀 강도에서 특징 추출 
____컨벌루션 신경망 활성화를 사용한 특징 
__요약 

5장. 단순 선형 회귀에서 다중 선형 회귀까지 
__다중 선형 회귀 
__다항 회귀 
__정규화 
__선형 회귀의 적용 
____데이터 탐색 
____적합화와 모델 평가 
__기울기 하강법 
__요약 

6장. 선형 회귀에서 로지스틱 회귀까지 
__로지스틱 회귀를 이용한 이진 분류 
__스팸 필터링 
____이진 분류기 평가 척도 
____정확도 
____정밀도와 재현율 
____F1 척도 계산 
____ROC AUC 
__그리드 탐색을 활용한 모델 튜닝 
__다중 부류 분류 
__다중 부류 분류 성능 척도 
__다중 부류 분류와 문제 변환 
__다중 부류 분류 성능 척도 
__요약 

7장. 나이브 베이즈 
__베이즈 정리 
__생성 모델과 판별 모델 
__나이브 베이즈 
__나이브 베이즈에서의 가정 
__scikit-learn으로 구현한 나이브 베이즈 
__요약 

8장. 의사결정 트리를 이용한 비선형 분류와 회귀 
__의사결정 트리 
__의사결정 트리 훈련 
____문제 선택 
______정보 이득 
____지니 불순도 
__scikit-learn을 사용한 의사결정 트리 
____의사결정 트리의 장단점 
__요약 

9장. 의사결정 트리에서 랜덤 포레스트와 앙상블 기법까지 
__배깅 
__부스팅 
__스태킹 
__요약 

10장. 퍼셉트론 
__퍼셉트론 
____활성화 함수 
____퍼셉트론 학습 알고리즘 
____퍼셉트론을 이용한 이진 분류 
____퍼셉트론을 이용한 문서 분류 
__퍼셉트론의 한계 
__요약 

11장. 퍼셉트론에서 서포트 벡터 머신까지 
__커널과 커널 트릭 
__최대 마진 분류기와 서포트 벡터 
__scikit-learn에서 문자 분류 
____필기체 숫자 분류 
____컬러 이미지에서 문자 분류 
__요약 

12장. 퍼셉트론에서 인공지능까지 
__비선형 결정 경계 
__피드포워드와 피드백 ANN 
__다층 퍼셉트론 
__다층 퍼셉트론 훈련 
____역전파 
____XOR 근사를 위한 계층 퍼셉트론의 훈련 
____필기체 숫자를 분류하기 위한 다층 퍼셉트론 훈련 
__요약 

13장. K-평균 
__군집화 
__K-평균 
____지역 최적 값 
____엘보 기법을 사용한 k 값의 선택 
__클러스터의 평가 
__이미지 퀀터제이션 
__특징 학습을 위한 군집화 
__요약 

14장. 주성분 분석을 이용한 차원 축소 
__주성분 분석 
____분산, 공분산, 공분산 행렬 
____고유 벡터와 고윳값 
__PCA 실행 
__PCA를 사용한 고차원 데이터의 시각화 
__PCA를 사용한 얼굴 인식 
__요약

관련분야 신착자료

데이터분석과인공지능활용편찬위원회 (2021)
Harrison, Matt (2021)
Stevens, Eli (2020)