000 | 00000cam c2200205 c 4500 | |
001 | 000045976923 | |
005 | 20190327151854 | |
007 | ta | |
008 | 190321s2019 ulka b 001c kor | |
020 | ▼a 9791161752778 ▼g 94000 | |
020 | 1 | ▼a 9788960772106 (세트) |
035 | ▼a (KERIS)BIB000015088007 | |
040 | ▼a 211046 ▼c 211046 ▼d 211009 | |
041 | 1 | ▼a kor ▼h eng |
082 | 0 4 | ▼a 006.31 ▼2 23 |
085 | ▼a 006.31 ▼2 DDCK | |
090 | ▼a 006.31 ▼b 2019z4 | |
100 | 1 | ▼a Bonaccorso, Giuseppe |
245 | 1 0 | ▼a 머신 러닝 알고리즘 : ▼b 파이썬 예제와 함께 배우는 머신 러닝 / ▼d 주세페 보나코르소 지음 ; ▼e 정사범 옮김 |
246 | 1 9 | ▼a Machine learning algorithms : ▼b reference guide for popular algorithms for data science and machine learning |
260 | ▼a 서울 : ▼b 에이콘, ▼c 2019 | |
300 | ▼a 398 p. : ▼b 삽화 ; ▼c 24 cm | |
440 | 0 0 | ▼a Acorn+PACKT technical book |
504 | ▼a 참고문헌과 색인수록 | |
546 | ▼a 영어로 된 원저작을 한국어로 번역 | |
700 | 1 | ▼a 정사범, ▼e 역 |
900 | 1 0 | ▼a 보나코르소, 주세페, ▼e 저 |
소장정보
No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
---|---|---|---|---|---|---|---|
No. 1 | 소장처 세종학술정보원/과학기술실(5층)/ | 청구기호 006.31 2019z4 | 등록번호 151345627 | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
컨텐츠정보
책소개
머신 러닝에 대한 소개와 파이썬 활용 방법을 소개하고 있다. 단계별로 다음과 같은 머신 러닝 알고리즘을 쉽게 구현할 수 있는 방법에 대해 배울 수 있다. 머신 러닝의 중요한 요소 학습, 특징 선택 및 특징 엔지니어링 프로세스 이해, 선형 회귀의 성능과 오차간 상충성(trade-offs) 평가, 다양한 유형의 알고리즘을 사용해 데이터 모델을 구축하고 해당 모델의 작동 방법 이해, SVM 파라미터를 최적화하는 방법 등을 다룬다.
머신 러닝에 대한 소개와 파이썬 활용 방법을 소개하고 있다. 단계별로 다음과 같은 머신 러닝 알고리즘을 쉽게 구현할 수 있는 방법에 대해 배울 수 있다.
1. 데이터 기반 애플리케이션에 사용되는 통계와 수학 이론
2. EM 알고리즘, PCA, 베이지안 회귀 등의 기술
3. 다양한 데이터를 이용한 패턴 인식과 예측
★ 이 책에서 다루는 내용 ★
■ 머신 러닝의 중요한 요소 학습.
■ 특징 선택 및 특징 엔지니어링 프로세스 이해
■ 선형 회귀의 성능과 오차간 상충성(trade-offs) 평가
■ 다양한 유형의 알고리즘을 사용해 데이터 모델을 구축하고 해당 모델의 작동 방법 이해
■ SVM 파라미터를 최적화하는 방법
■ 군집화 실행
■ 자연어 처리와 추천 시스템의 개념 이해
■ 사전 지식 없이 머신 러닝 아키텍처 구축
★ 이 책의 대상 독자 ★
머신 러닝이 처음인 사람이나 데이터 과학 분야에 입문하고자 하는 IT 전문가를 위한 것이다. 무엇보다 파이썬 언어에 익숙해야 한다. 더욱이 대부분의 내용을 완전히 이해하기 위해서는 기초 수학 지식(선형 대수학, 확률 이론)이 필요하다.
★ 이 책의 구성 ★
1장, '머신 러닝 개요'에서는 머신 러닝에 대해 소개하고 지능형 애플리케이션을 만드는 데 있어 가장 중요한 접근 방식의 기본 개념을 설명한다.
2장, '머신 러닝 핵심 요소'에서는 정보 이론의 몇 가지 요소와 학습 능력의 개념을 포함한 가장 일반적인 머신 러닝 문제의 수학적인 개념을 설명한다.
3장, '특징 선택 및 특징 엔지니어링'에서는 데이터셋을 전처리하고 가장 중요한 정보를 제공하는 특징을 선택하며, 원 데이터의 차원을 축소하는 데 사용되는 핵심기술인 특징 선택 및 특징 엔지니어링에 대해 설명한다.
선형 회귀 연속 선형 모델의 구조를 선형 회귀 알고리즘에 초점을 맞춰 설명한다. 또한 릿지(Ridge), 라소(Lasso) 및 엘라스틱넷(ElasticNet) 최적화와 다른 고급 기술도 다룬다.
5장, '로지스틱 회귀'에서는 로지스틱 회귀(Logistic Regression)와 확률적 경사 하강 알고리즘SGD에 초점을 맞춰 선형 분류의 개념을 소개한다. 이외에 중요한 평가 척도를 설명한다.
6장, '나이브 베이즈'에서는 베이즈(Bayes) 확률 이론을 설명하고, 가장 널리 알려진 나이브 베이즈(Naive Bayes) 분류기 구조에 대해 설명한다.
7장, '지지 벡터 머신'에서는 선형 비선형 분류 문제에 초점을 맞춰 분류 관련 알고리즘을 소개한다.
8장, '의사 결정 나무와 앙상블 학습'에서는 계층적 의사 결정 과정에 대해 설명하고, 의사 결정 나무 분류, 부트스트랩, 배깅 트리, 보팅 분류기의 개념에 대해 설명한다.
9장, '군집화'에서는 기초 군집화의 개념을 소개하고, k-평균 알고리즘을 설명하며, 최적의 군집 수를 결정하기 위한 다양한 접근 방법을 소개한다. 후반부에서는 DBSCAN과 같은 스펙트럼 군집화와 같은 다른 군집화 알고리즘에 대해 설명한다.
10장, '계층적 군집화'에서는 9장, '군집화'에서 설명한 내용에 이어서 응집 군집화(agglomerative clustering)의 개념을 소개한다.
11장, '추천 시스템 개요'에서는 추천 시스템에서 가장 잘 알려진 알고리즘인 추천 시스템에 대해 설명한다. 이 시스템에는 콘텐츠-기반 및 사용자-기반 전략, 협업 필터링, 교대 최소 제곱 방법이 있다.
12장, '자연어 처리'에서는 단어 바구니(BOW, Bag of Words)의 개념을 설명한다. 또한 자연어 데이터셋을 효율적으로 처리하는 데 필요한 기술을 소개한다.
13장, 'NLP에서 토픽 모델링 및 감정 분석'에서는 토픽 모델링의 개념을 소개하고, 가장 중요한 알고리즘인 잠정적 의미 분석(latent semantic analysis)과 잠재 디리클레 할당(latent Dirichlet allocation)을 설명한다. 후반부에서는 감정 분석 문제에 대해 설명하고, 이를 해결하기 위한 접근 방법을 설명한다.
정보제공 :

저자소개
주세페 보나코르소(지은이)
12년 이상의 경력을 겸비한 머신 러닝 및 빅데이터 컨설턴트다. 이탈리아 카타니아 대학(University of Catania) 전자 공학과에서 학위를 받았다. 이후 이탈리아 토르 베르가타(Tor Vergata)의 로마 대학 및 영국 에식스(Essex) 대학에서 대학원 전문 과정을 이수했다. 공공 행정, 군대, 공공 시설, 의료, 진단 및 광고 등 다양한 비즈니스 환경에서 IT 경력을 쌓았다. 또한 자바(Java), 파이썬(Python), 하둡(Hadoop), 스파크(Spark), 테아노(Theano) 및 텐서플로(TensorFlow)를 비롯한 많은 기술을 사용해 프로젝트를 수행하고 관리한 경험이 있다. 주요 관심사는 인공 지능, 머신 러닝, 데이터 과학 및 철학 분야다.
정사범(옮긴이)
의사결정과 최적화 방법론에 관심이 많다. 세상에 존재하는 다양한 데이터를 이용해 당면한 문제를 해결하는 일을 하고 있다. 다양한 책과 현장 경험을 통해 데이터 수집, 정제, 분석, 보고 방법에 대한 지식을 얻는 것에 감사하고 있다. 에이콘출판사에서 출간한 『RStudio 따라잡기』(2013), 『The R book(Second Edition) 한국어판』(2014), 『예측 분석 모델링 실무 기법』(2014), 『데이터 마이닝 개념과 기법』(2015), 『파이썬으로 풀어보는 수학』(2016), 『데이터 스토리텔링』(2016), 『R에서 객체지향 프로그래밍 사용하기』(2016), 『파이썬 프로그래밍 개론』(2016), 『산업인터넷(IIOT)과 함께하는 인더스트리 4.0』(2017), 『장고 마스터하기』(2017), 『텐서플로로 구현하는 딥러닝과 강화학습』(2017), 『머신 러닝 알고리즘』(2019)을 번역했다.

목차
1장. 머신 러닝 개요
__소개-초기의 기계
__학습
__지도학습
____비지도학습
____강화학습
__머신 러닝을 넘어서: 딥러닝과 생체-적응 시스템
__머신 러닝과 빅데이터
__심화 학습
__요약
2장. 머신 러닝의 핵심 요소
__데이터 형식
____멀티클래스 전략
________일대다
________일대일
__학습 능력
____부적합과 과적합
____오류 측정
____PAC 학습
__통계적 학습 접근
____MAP 학습
____최대-우도 학습
__정보 이론의 요소
__참고 문헌
__요약
3장. 특징 선택과 특징 엔지니어링
scikit-learn 토이 데이터셋
__훈련 및 테스트 집합 만들기
__범주형 데이터 관리
__누락된 특징 관리
__데이터 스케일링 및 정규화
__특징 선택 및 필터링
__주성분 분석
____음수 미포함 행렬 분해
____희소 PCA
____커널 PCA
__원자 추출 및 딕셔너리 학습
__참고 문헌
__요약
4장. 선형 회귀
__선형 모델
__2차원 예제
__scikit-learn을 이용한 고차원 선형 회귀
____회귀 분석 표현
__릿지, 라소 및 엘라스틱 넷
__랜덤 샘플 합의 -기반 견고한 회귀
__다항회귀
__이소토닉 회귀
__참고 문헌
__요약
5장. 로지스틱 회귀
__선형 분류
__로지스틱 회귀
__구현 및 최적화
__확률적 경사 하강 알고리즘
__그리드 검색을 통해 최적의 하이퍼파라미터 찾기
__분류 측정 방법
__ROC 곡선
__요약
6장. 나이브 베이즈
__베이지안 이론
__나이브 베이즈 분류기
__scikit-learn에서 나이브 베이즈
____베르누이 나이브 베이즈
____다항 나이브 베이즈
____가우시안 나이브 베이즈
__참고 문헌
__요약
7장. 지지 벡터 머신
__선형 지지 벡터 머신
__scikit-learn 구현
____선형 분류
____커널-기반 분류
________방사형 기저 함수
________다항식 커널
________시그모이드 커널
________사용자 정의 커널
____비선형 예
__제어된 지지 벡터 시스템
__지지 벡터 회귀
__참고 문헌
__요약
8장. 의사 결정 나무와 앙상블 학습
__이진 의사 결정 나무
____이진 의사 결정
____불순도 측정
________지니 불순도 지수
________교차-엔트로피 불순도 지수
________오분류 불순도 지수
____특징 중요도
__scikit-learn을 이용한 의사 결정 나무 분류
__앙상블 학습
____랜덤 포레스트
________랜덤 포레스트에서 특징 중요도
____아다부스트
____그레이디언트 트리 부스팅
____투표 분류기
__참고 문헌
__요약
9장. 군집화 개요
__군집화 기초
____k-평균
________최적 군집 수 찾기
____DBSCAN
____스펙트럼 군집화
__실측 자료에 근거한 평가 방법
____균질성
____완전성
____조정된 랜드 지표
__참고 문헌
__요약
10장. 계층적 군집화
__계층적 전략
__병합적 군집화
____덴드로그램
____scikit-learn에서 병합 군집화
____연결 제약 조건
__참고 문헌
__요약
11장. 추천 시스템 개요
__나이브 사용자 -기반 시스템
____scikit 학습을 이용한 사용자 -기반 시스템 구현
__콘텐츠 -기반 시스템
__모델 없는(또는 메모리-기반) 협업 필터링
__모델 -기반 협업 필터링
____단일값 분해 전략
____교대 최소 자승 전략
____아파치 스파크 MLlib으로 최소 자승 교체하기
__참고 문헌
__요약
12장. 자연어 처리
__NLTK 및 내장형 코사인
____말뭉치 예제
__단어 바구니 전략
____토큰화하기
________문장 토큰화
________Word 토큰화
____불용어 제거
____언어 감지
____어간 추출
____벡터화
________카운트 벡터화
________Tf-idf 벡터화
__로이터 말뭉치에 따른 샘플 텍스트 분류기
__참고 문헌
__요약
13장. NLP에서 토픽 모델링과 감정 분석
__토픽 모델링
____잠재 의미 분석
____확률적 잠재 의미 분석
____잠재 디리클레 할당
__감정 분석
____NLTK를 이용한 VADER 감정 분석
__참고 문헌
__요약
14장. 딥러닝과 텐서플로 개요
__딥러닝 살펴보기
____인공 신경망
____딥 아키텍처
________완전 연결층
________컨볼루션층
________드롭아웃층
________순환 신경망
__텐서플로 소개
____그레이디언트 계산하기
____로지스틱 회귀
____다층 퍼셉트론을 이용해 분류 실행하기
____이미지 컨볼루션
__케라스 내부 빨리 들여다 보기
__참고 문헌
__요약
15장. 머신 러닝 아키텍처 만들기
__머신 러닝 아키텍처
____데이터 수집
____정규화
____차원 축소
____데이터 증강
____데이터 변환
____모델링/그리드 탐색/교차 검증
____가시화
____머신 러닝 아키텍처용 scikit-learn 도구
________파이프라인
____특징 결합
__참고 문헌
__요약
정보제공 :
