HOME > 상세정보

상세정보

(기본 알고리즘 및 적용 예제, 사례 연구로 살펴보는) 데이터 예측을 위한 머신 러닝

(기본 알고리즘 및 적용 예제, 사례 연구로 살펴보는) 데이터 예측을 위한 머신 러닝 (3회 대출)

자료유형
단행본
개인저자
Kelleher, John D., 1974- Mac Namee, Brian, 1978-, 저 D'Arcy, Aoife, 1978-, 저 황정동, 역
서명 / 저자사항
(기본 알고리즘 및 적용 예제, 사례 연구로 살펴보는) 데이터 예측을 위한 머신 러닝 / 존 캘러허, 브라이언 맥 네미, 이퍼 다시 지음 ; 황정동 옮김
발행사항
서울 :   에이콘,   2017  
형태사항
630 p. : 삽화, 도표 ; 26 cm
총서사항
에이콘 데이터 과학 시리즈 = Data science series
원표제
Fundamentals of machine learning for predictive data analytics : algorithms, worked examples, and case studies
ISBN
9788960779976 9788960774469 (Set)
일반주기
부록: A. 머신 러닝을 위한 기술 통계학 및 데이터 시각화, B. 머신 러닝을 위한 확률론 소개, C. 머신 러닝을 위한 미분 기법  
서지주기
참고문헌과 색인수록
일반주제명
Machine learning Data mining Prediction theory
000 00000cam c2200205 c 4500
001 000046000057
005 20190926105303
007 ta
008 190925s2017 ulkad b 001c kor
020 ▼a 9788960779976 ▼g 94000
020 1 ▼a 9788960774469 (Set)
035 ▼a (KERIS)BIB000014511813
040 ▼a 248019 ▼c 248019 ▼d 248019 ▼d 211009
041 1 ▼a kor ▼h eng
082 0 0 ▼a 006.3/1 ▼2 23
085 ▼a 006.31 ▼2 DDCK
090 ▼a 006.31 ▼b 2017z32
100 1 ▼a Kelleher, John D., ▼d 1974- ▼0 AUTH(211009)90227
245 2 0 ▼a (기본 알고리즘 및 적용 예제, 사례 연구로 살펴보는) 데이터 예측을 위한 머신 러닝 / ▼d 존 캘러허, ▼e 브라이언 맥 네미, ▼e 이퍼 다시 지음 ; ▼e 황정동 옮김
246 1 9 ▼a Fundamentals of machine learning for predictive data analytics : ▼b algorithms, worked examples, and case studies
260 ▼a 서울 : ▼b 에이콘, ▼c 2017
300 ▼a 630 p. : ▼b 삽화, 도표 ; ▼c 26 cm
440 0 0 ▼a 에이콘 데이터 과학 시리즈 = ▼x Data science series
500 ▼a 부록: A. 머신 러닝을 위한 기술 통계학 및 데이터 시각화, B. 머신 러닝을 위한 확률론 소개, C. 머신 러닝을 위한 미분 기법
504 ▼a 참고문헌과 색인수록
650 0 ▼a Machine learning
650 0 ▼a Data mining
650 0 ▼a Prediction theory
700 1 ▼a Mac Namee, Brian, ▼d 1978-, ▼e▼0 AUTH(211009)135998
700 1 ▼a D'Arcy, Aoife, ▼d 1978-, ▼e
700 1 ▼a 황정동, ▼e▼0 AUTH(211009)86700
900 1 0 ▼a 캘러허, 존, ▼e
900 1 0 ▼a 네미, 브라이언 맥, ▼e
900 1 0 ▼a 다시, 이퍼, ▼e
945 ▼a KLPA

소장정보

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 중앙도서관/제2자료실(3층)/ 청구기호 006.31 2017z32 등록번호 111815241 도서상태 대출가능 반납예정일 예약 서비스 B M

컨텐츠정보

책소개

데이터 예측이라는 대표적인 머신 러닝 적용 분야를 통해 다양한 머신 러닝의 기본 원리를 알아보고, 각 방식의 장단점과 상황에 맞는 선택 기준을 알아본다. 전산 과학, 자연 과학, 사회 과학, 공학, 경영학 학부생과 대학원생을 위한 머신 러닝, 데이터 마이닝, 데이터 분석이나 인공지능 강의에 적합하다.

실제 머신 러닝을 사용할 때 알고리즘 선택 만큼이나 중요한 데이터 준비, 데이터 탐색 과정을 비롯해 수립한 모델의 평가 및 적용, 모니터링에 이르는 데이터 예측 프로젝트의 전 과정을 상세히 다룬다. 이와 관련된 여러 개념 또한 다양한 분야의 적용 예제, 사례 연구를 통해 구체적으로 이해하기 쉽게 설명하고 있다.

데이터를 바탕으로 결과를 예측하는 데이터 예측이라는 대표적인 머신 러닝 적용 분야를 통해 다양한 머신 러닝의 기본 원리를 알아보고, 각 방식의 장단점과 상황에 맞는 선택 기준을 알아본다. 실제 머신 러닝을 사용할 때 알고리즘 선택 만큼이나 중요한 데이터 준비, 데이터 탐색 과정을 비롯해 수립한 모델의 평가 및 적용, 모니터링에 이르는 데이터 예측 프로젝트의 전 과정을 상세히 다룬다. 이와 관련된 여러 개념을 다양한 분야의 적용 예제, 사례 연구를 통해 구체적으로 이해하기 쉽게 설명한다.

★ 이 책의 대상 독자 ★
이 책은 전산 과학, 자연 과학, 사회 과학, 공학, 경영학 학부생과 대학원생을 위한 머신 러닝, 데이터 마이닝, 데이터 분석이나 인공지능 강의에 사용할 수 있다.
또한 이 책은 데이터 분석가 관점에서 머신 러닝을 산업에 적용하는 사례 연구를 담고 있으므로, 현업 실무자의 입문서나 해당 분야 산업 교육 교재로도 사용할 수 있다.

★ 이 책의 구성 ★
1장. '데이터 예측 분석을 위한 머신 러닝'에서는 머신 러닝을 소개하고,표준 데이터 분석 프로젝트의 생애에서 머신 러닝의 역할을 설명한다.
2장. '데이터에서 통찰을 거쳐 결정으로'에서는 머신 러닝을 바탕으로 비즈니스 목적에 맞는 예측 분석 해법을 설계하고 구축하기 위한 체계를 제공한다. 모든 머신 러닝 알고리즘은 학습에 필요한 데이터셋을 가정하고 있으며,
3장. '데이터 탐색'에서 예측 모델 수립에 사용할 데이터셋을 설계, 구축하고 품질을 확인하는 방법을 설명한다.
4장부터 머신 러닝을 소개한다. 4장. '정보 기반 학습'에서는 정보 수집을 통한 학습, 5장. '유사도 기반 학습'에서는 유추를 통한 학습, 6장. '확률 기반 학습'에서는 가능성 높은 결과를 예측하는 학습, 7장. '오류 기반 학습'에서는 오차를 최소화하는 해법을 찾는 방식의 학습을 제시한다.
각 장들은 크게 두 부분으로 구성된다. 첫 번째 부분에서는 해당 장에서 제시할 주제에 대해 비공식적인 소개를 하고, 내용을 이해하는 데 필요한 근본적인 기술적 개념에 대해 자세히 소개하고, 제시한 학습 방식이 사용하는 표준 머신 러닝 알고리즘을 자세한 적용 예제를 곁들여 설명한다.
두 번째 부분에서는 표준 알고리즘을 잘 알려진 변형 알고리즘으로 확장하는 다양한 방법을 설명한다. 기술적 내용이 실린 장을 이렇게 두 부분으로 구성한 이유는 이렇게 하면 각 장의 내용이 자연스럽게 분리되기 때문이다. 결과적으로 각 장의 첫 번째 부분(기본 발상,원리, 표준 알고리즘, 적용 예제)만 강의에서 다뤄도 주제가 포함된다.
8장. '평가'에서는 예측 모델 성능 평가 방법을 설명하고,다양한 평가 지표를 소개한다. 그리고 표준 방식 다음에 확장과 변형을 설명한다. 기술적인 내용을 다루는 이런 장들은 데이터셋이 포함된 자세한 완전한 실세계 예제들과 예제를 뒷받침하는 논문을 통해 예측 분석과 연결이 유지되고 있다.
9장. '사례 연구: 고객 이탈'과 10장. '사례 연구: 은하 분류'의 사례 연구를 통해 더 넓은 사업적 맥락과 머신 러닝과의 연결 고리를 볼 수 있다. 특히 사례 연구들은 예측 분석 프로젝트의 성공에 필수적인 모델 수립 너머의 비즈니스 이해, 문제 정의, 데이터 수집 및 준비, 통찰을 얻기 위한 의사소통과 같은 다양한 문제와 작업들 을 강조하고 있다.
마지막으로 11장. '데이터 예측 분석을 위한 머신 러닝의 예술'은 머신 러닝의 다양한 근본 주제들을 살펴보고, 주어진 작업에 적절한 머신 러닝 방식을 모델 정확도 이상의 요소들을 고려해 선택하는 방법들도 살펴본다. 또한 모델의 특성과 비즈니스 필요 사항도 다룬다.


정보제공 : Aladin

저자소개

존 켈러허(지은이)

더블린공과대학교 컴퓨터과학부 교수이자 부속기관인 정보통신 및 엔터테인먼트 연구소 소장. 인공지능, 기계학습 분야에서 세계적으로 인정받는 전문가다. 더블린시립대학교, 유럽미디어연구소, 독일인공지능연구센터 등 여러 대학과 연구소에서 일했다. 지은 책으로 《딥러닝》 《데이터 예측을 위한 머신 러닝》(공저)이 있다.

브라이언 맥 네미(지은이)

아일랜드 더블린에 살고 있으며, 더블린 대학의 강사이자, Analytics Store의 이사이다. 데이터 분석, 머신 러닝, 데이터 시각화, 인공 지능에 관해 고민하고 글 쓰는 데 많은 시간을 보낸다.

이퍼 다시(지은이)

2009년 컨설팅 및 교육 회사 Analytics Store를 설립했다. 이 회사는 고급 데이터 마이닝 및 분석 기술들을 이용해 고객이 데이터에서 실행 가능한 통찰을 끌어낼 수 있도록 도와 준다. Analytics Store의 이사이자 수석 컨설턴트로 여러 회사와 함께 사기 검출, 신용 위험, 고객 통찰 등에 대한 해법을 개발해왔다. 또한 고객과 협력해 데이터 마이닝 및 분석에 대한 맞춤식 교육 과정을 개발하고 제공한다.

황정동(옮긴이)

서울대학교에서 전산학과 물리학을 전공하고, 졸업 후 네오위즈에서 시스템 프로그래밍, 시스템 및 네트워크 운영 등의 업무를 맡아 대규모 리눅스 시스템과 네트워크를 관리하고 설계했다. 검색 전문 회사 첫눈에서 웹로봇을 개발했으며, NHN 검색센터에서는 언어 처리 관련 라이브러리 개발에 참여했다. Cauly 등의 모바일 광고 플랫폼 개발 경험이 있으며, LINE+에서 대규모 메시징 플랫폼 개발 및 운영에도 참여했다. 현재 삼성리서치 AI 센터 연구원으로 일하고 있다.

정보제공 : Aladin

목차

1장. 데이터 예측 분석을 위한 머신 러닝
__1.1 데이터 예측 분석이란?
__1.2 왜 머신 러닝인가?
__1.3 머신 러닝의 동작 방식
__1.4 머신 러닝이 잘못되는 경우
__1.5 데이터 예측 분석 프로젝트의 생애: CRISP-DM
__1.6 데이터 예측 분석 도구
__1.7 앞으로의 여정
__1.8 연습문제

2장. 데이터에서 통찰을 거쳐 결정으로
__2.1 비즈니스 문제를 분석적 해법으로 전환
____2.1.1 사례 분석: 자동차 보험 사기
__2.2 적용 가능성 평가
____2.2.1 사례 연구: 자동차 보험 사기
__2.3 기본 분석 테이블 설계
____2.3.1 사례 연구: 자동차 보험 사기
__2.4 속성 설계와 구현
____2.4.1 여러 가지 데이터 유형
____2.4.2 여러 가지 속성 유형
____2.4.3 시간 처리
____2.4.4 법적 문제
____2.4.5 속성 구현
____2.4.6 사례 연구: 자동차 보험 사기
__2.5 정리
__2.6 더 읽을거리
__2.7 연습문제

3장. 데이터 탐색
__3.1 데이터 품질 보고서
____3.1.1 사례 연구: 자동차 보험 사기
__3.2 데이터 알아가기
____3.2.1 정규 분포
____3.2.2 사례 연구: 자동차 보험 사기
__3.3 데이터 품질 문제 확인
____3.3.1 값 누락
____3.3.2 원소 개수 이상
____3.3.3 이상치
____3.3.4 사례 연구: 자동차 보험 사기
__3.4 데이터 품질 문제 처리
____3.4.1 값 누락 처리
____3.4.2 이상치 처리
____3.4.3 사례 연구: 자동차 보험 사기
__3.5 고급 데이터 탐색
____3.5.1 속성 관계 시각화
____3.5.2 공분산과 상관계수 측정
__3.6 데이터 준비
____3.6.1 정규화
____3.6.2 이산화
____3.6.3 표본 추출
__3.7 정리
__3.8 더 읽을거리
__3.9 연습문제

4장. 정보 기반 학습
__4.1 기본 발상
__4.2 원리
____4.2.1 결정 트리
____4.2.2 셰넌의 엔트로피 모델
____4.2.3 정보 이득
__4.3 표준 방식: ID3 알고리즘
____4.3.1 작동 예제: 작물 분포 예측
__4.4 확장과 변형
____4.4.1 속성 선택과 불균질성 지표의 대안
____4.4.2 연속 서술 속성 다루기
____4.4.3 연속 대상 속성 예측
____4.4.4 트리 가지치기
____4.4.5 모델 앙상블
__4.5 정리
__4.6 참고 문헌
__4.7 연습문제

5장. 유사도 기반 학습
__5.1 기본 발상
__5.2 원리
____5.2.1 속성 공간
____5.2.2 거리 함수를 이용한 유사도 측정
__5.3 표준 접근 방식: 최근접 이웃 알고리즘
____5.3.1 작동 예제
__5.4 확장과 변형
____5.4.1 데이터 잡음 처리
____5.4.2 효율적인 메모리 탐색
____5.4.3 데이터 정규화
____5.4.4 연속 목표에 대한 예측
____5.4.5 기타 유사도 지표
____5.4.6 속성 선택
__5.5 정리
__5.6 더 읽을거리
__5.7 에필로그
__5.8 연습문제

6장. 확률 기반 학습
__6.1 기본 발상
__6.2 원리
____6.2.1 베이즈 정리
____6.2.2 베이지언 예측
____6.2.3 조건부 독립과 인수분해
__6.3 표준 방식: 나이브 베이즈 모델
____6.3.1 적용 예제
__6.4 확장과 변형
____6.4.1 스무딩
____6.4.2 연속 속성: 확률 밀도 함수
____6.4.3 연속 속성: 이산화
____6.4.4 베이지안 네트워크
__6.5 정리
__6.6 참고 문헌
__6.7 연습문제

7장. 오류 기반 학습
__7.1 기본 발상
__7.2 원리
____7.2.1 단순 선형 회귀
____7.2.2 오차 측정
____7.2.3 오차 표면
__7.3 표준 방식: 경사 하강법을 이용한 다변수 선형 회귀
____7.3.1 다변수 선형 회귀
____7.3.2 경사 하강법
____7.3.3 학습률과 가중치 초깃값 선택
____7.3.4 적용 예제
__7.4 확장과 변형
____7.4.1 다변수 선형 회귀 모델 해석
____7.4.2 가중치 감쇄를 이용한 학습률 설정
____7.4.3 분류 서술 속성 처리
____7.4.4 분류 대상 속성 처리: 로지스틱 회귀
____7.4.5 비선형 관계 모델링
____7.4.6 다항 로지스틱 회귀
____7.4.7 서포트 벡터 머신
__7.5 정리
__7.6 더 읽을거리
__7.7 연습문제

8장. 평가
__8.1 기본 발상
__8.2 원리
__8.3 표준 방식: 유보 테스트 집합에 대한 오분석율
__8.4 확장과 변형
____8.4.1 평가 실험 설계
____8.4.2 성능 지표: 분류 대상
____8.4.3 성능 지표: 예측 점수
____8.4.4 성능 지표: 다항 대상
____8.4.5 성능 지표: 연속 대상
____8.4.6 모델 적용 이후의 평가
__8.5 정리
__8.6 더 읽을거리
__8.7 연습문제

9장. 사례 연구: 고객 이탈
__9.1 비즈니스 이해
__9.2 데이터 이해
__9.3 데이터 준비
__9.4 모델링
__9.5 평가
__9.6 적용

10장. 사례 연구: 은하 분류
__10.1 비즈니스 이해
____10.1.1 상황적 능숙함
__10.2 데이터 이해
__10.3 데이터 준비
__10.4 모델링
____10.4.1 기준 모델
____10.4.2 속성 선택
____10.4.3 5단계 모델
__10.5 평가
__10.6 적용

11장. 데이터 예측 분석을 위한 머신 러닝의 예술
__11.1 예측 모델에 대한 다른 관점
__11.2 머신 러닝 방식 선택
____11.2.1 프로젝트에 맞는 머신 러닝 방식
____11.2.2 데이터에 맞는 머신 러닝 방식
__11.3 그다음 단계

A장. 머신 러닝을 위한 기술 통계학 및 데이터 시각화
__연속 속성을 위한 기술 A.1 술 통계학
____A.1.1 중심 경향성
____A.1.2 분산
__A.2 분류 속성을 위한 기술 통계학
__A.3 모집단과 표본
__A.4 데이터 시각화
____A.4.1 막대그래프
____A.4.2 히스토그램
____A.4.3 박스 그래프

B장. 머신 러닝을 위한 확률론 소개
__B.1 확률론 기초
__B.2 확률 분포와 확률 합계
__B.3 유용한 확률 규칙 몇 가지
__B.4 정리

C장. 머신 러닝을 위한 미분 기법
__C.1 연속 함수의 도함수
__C.2 연쇄 법칙
__C.3 편도함수

관련분야 신착자료

National Academies of Sciences, Engineering, and Medicine (U.S.) (2020)
Cartwright, Hugh M. (2021)
한국소프트웨어기술인협회. 빅데이터전략연구소 (2021)