HOME > 상세정보

상세정보

R로 마스터하는 머신 러닝 : 업무에 활용할 수 있는 선형모델에서 딥러닝까지 (8회 대출)

자료유형
단행본
개인저자
Lesmeister, Cory 김종원, 역 김태영, 역 류성희, 역 이호, 역
서명 / 저자사항
R로 마스터하는 머신 러닝 : 업무에 활용할 수 있는 선형모델에서 딥러닝까지 / 코리 레즈마이스터 지음 ; 김종원 [외]옮김
발행사항
서울 :   에이콘,   2018  
형태사항
550 p. : 삽화(일부천연색) ; 24 cm
원표제
Mastering machine learning with R : advanced prediction, algorithms, and learning methods with R 3.x (2nd ed.)
ISBN
9791161751283 9788960772106 (Set)
일반주기
부록: A. R의 기본, B. 자료 출처  
공역자: 김태영, 류성희, 이호  
색인수록  
일반주제명
Machine learning R (Computer program language)
000 00000cam c2200205 c 4500
001 000045985447
005 20190604092633
007 ta
008 190603s2018 ulka 001c kor
020 ▼a 9791161751283 ▼g 94000
020 1 ▼a 9788960772106 (Set)
035 ▼a (KERIS)BIB000014760951
040 ▼a 241050 ▼c 241050 ▼d 241050 ▼c 241050 ▼d 211009
041 1 ▼a kor ▼h eng
082 0 4 ▼a 006.31 ▼2 23
085 ▼a 006.31 ▼2 DDCK
090 ▼a 006.31 ▼b 2018z36
100 1 ▼a Lesmeister, Cory
245 1 0 ▼a R로 마스터하는 머신 러닝 : ▼b 업무에 활용할 수 있는 선형모델에서 딥러닝까지 / ▼d 코리 레즈마이스터 지음 ; ▼e 김종원 [외]옮김
246 1 9 ▼a Mastering machine learning with R : ▼b advanced prediction, algorithms, and learning methods with R 3.x ▼g (2nd ed.)
260 ▼a 서울 : ▼b 에이콘, ▼c 2018
300 ▼a 550 p. : ▼b 삽화(일부천연색) ; ▼c 24 cm
500 ▼a 부록: A. R의 기본, B. 자료 출처
500 ▼a 공역자: 김태영, 류성희, 이호
500 ▼a 색인수록
650 0 ▼a Machine learning
650 0 ▼a R (Computer program language)
700 1 ▼a 김종원, ▼e
700 1 ▼a 김태영, ▼e
700 1 ▼a 류성희, ▼e
700 1 ▼a 이호, ▼e
900 1 0 ▼a 레즈마이스터, 코리, ▼e
945 ▼a KLPA

소장정보

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 중앙도서관/제2자료실(3층)/ 청구기호 006.31 2018z36 등록번호 111810515 도서상태 대출중 반납예정일 2021-07-14 예약 예약가능 R 서비스 M

컨텐츠정보

책소개

통계 계산과 그래픽에 특화된 언어인 R을 사용해 머신 러닝을 배우는데 필요한 여러 통계적 기법을 실제 사례에 적용하며 설명한다. 복잡한 수식이나 전문 프로그래밍 기법을 사용하지 않으면서, 선형 회귀에서부터 분류 문제나 딥러닝, 추천 시스템, 군집화, 시계열 분석, 텍스트 마이닝까지 머신 러닝의 거의 전 영역에 대해 실제 데이터를 이용해 간결한 R 코드로 명확하게 설명한다.

통계 계산과 그래픽에 특화된 언어인 R을 사용해 머신 러닝을 배우는데 필요한 여러 통계적 기법을 실제 사례에 적용하며 설명한다. 복잡한 수식이나 전문 프로그래밍 기법을 사용하지 않으면서, 선형 회귀에서부터 분류 문제나 딥러닝, 추천 시스템, 군집화, 시계열 분석, 텍스트 마이닝까지 머신 러닝의 거의 전 영역에 대해 실제 데이터를 이용해 간결한 R 코드로 명확하게 설명한다. 기초 통계와 프로그래밍을 조금 할 줄 안다면 더욱 더 이해하기 쉬울 것이다.

★ 이 책에서 다루는 내용 ★

■ 실제 업계에서 머신 러닝 도구를 적용하는 방법
■ R을 사용해 데이터를 분석하기 전에 효과적으로 준비하는 작업
■ 데이터를 효과적으로 시각화하는 방법
■ 분석을 위해 학습용 데이터 세트와 테스트용 데이터 세트를 만드는 이유와 방법에 대한 이해
■ 가장 기본적인 머신 러닝 방법인 선형 회귀와 로지스틱 회귀
■ 서포트 벡터 머신 같은 심화 머신 러닝 방법 이해
■ 아마존 클라우드 서비스에서 R 사용하기

★ 이 책의 대상 독자 ★

데이터 과학자, 데이터 분석가, R을 이용해 머신 러닝을 하는, 실무 지식이 있는 사람들 대상으로 한다. 갖고 있는 기술을 한 단계 더 끌어올려 이 분야에서 전문가가 되고 싶은 사람을 위한 책이다.

★ 2판에 추가된 내용 ★

1장, '성공을 위한 과정'에서는 순서도상의 오타를 정정하고 새로운 방법론을 추가했다.
2장, '선형 회귀 - 머신 러닝의 기본 기술'에서는 코드를 개선하고 좀 더 나은 도표를 넣었다. 이를 제외하면 초판과 가까운 편이다.
3장, '로지스틱 회귀와 판별 분석'에서는 코드를 개선하고 정리했다. 좋아하는 기법인 다변량 적응 회귀 스프라인(multivariate adaptive regression spline)을 추가했는데, 잘 동작하고 비선형 데이터를 다룰 수 있으며 사용하기도 쉽다. 이를 기준 모형으로 사용해 다른 "도전자" 모형들이 이보다 더 성능이 좋은지 살펴본다.
4장, '선형 모형에서 고급 피처 선택'에서는 회귀뿐만 아니라 분류 문제도 다룬다.
5장, '다른 분류 기법들 - K-최근접 이웃법과 서포트 벡터 머신'에서는 코드를 정리했다.
6장, '분류 트리와 회귀 트리'에서는XG부스트(XGBoost) 패키지가 제공하는 매우 좋은 기법을 사용하는 것과 피처를 선택할 때 랜덤 포레스트(random forest) 기법을 사용을 추가했다.
7장, '신경망과 딥러닝'에서는 딥러닝 방법에 관한 최신 정보를 넣었고, 하이퍼파라미터(hyperparameter) 검색을 포함해 H2O 패키지에 관련된 코드를 개선했다.
8장, '군집화 분석'에서는 랜덤 포레스트를 이용해 비지도학습(unsupervised learning)을 하는 방법을 넣었다.
9장, '주성분 분석'에서는 다른 데이터 세트를 사용하고, 표본 외 예측(out-of-sample prediction)을 추가했다.
10장, '장바구니 분석, 추천 엔진과 순차적 분석'에서는 영업 분야에서 점점 더 중요해지고 있는 순차적 분석(sequential analysis)을 추가했다.
11장, '앙상블 생성과 다중 클래스 분류'에서는 여러 좋은 패키지를 사용해 완전히 새롭게 썼다.
12장, '시계열 자료와 인과관계'에서는 몇 년간의 기후 자료를 더 추가했고, 인과관계를 검사하는 여러 방법을 보여준다.
13장, '텍스트 마이닝'에서는 데이터를 추가하고 코드를 개선했다.
14장, '클라우드에서 R 사용하기'에서는 클라우드에서 R을 사용하는 법을 쉽고 빠르게 배울 수 있다.
부록 A. 'R의 기본'에서는 데이터를 다루는 방법을 추가했다.
부록 B. '자료 출처'에서는 자료 출처와 참고 자료의 목록을 작성했다.


정보제공 : Aladin

저자소개

코리 레즈마이스터(지은이)

10년 넘게 정량 분석에 관련된 일을 해왔으며, 현재 금융계에서 정량 분석 관리자로서 마케팅과 통제 모형을 만드는 일을 하고 있다. 일라이 릴리(Eli Lilly and Company)에서 16년간 일하면서 영업과 시장 분석, 린 식스 시그마(Lean Six Sigma), 시장 분석, 새 제품 예측 등의 일을 했다. 미국 육군에서 복무했으며, 2009년에는 이라크 바그다드에서 2만 9,000명 규모의 이라크 원유 경찰의 전략 고문으로 일하면서 이라크가 원유 관련 산업 시설들을 안전하게 보호하는데 필요한 장비를 공급했다. 비행기 애호가로서 노스 다코다 대학(University of North Dakoda)에서 항공 관리학으로 학사 학위를 받았고, 상용 헬리콥터 자격증을 갖고 있다.

이호(옮긴이)

대학교 동아리에서 컴퓨터 프로그래밍을 배워 한국에서 여러 소프트웨어 벤처에서 경력을 쌓았다. 이후 미국에 건너가 퀄컴, 엔비디아 등에서 리눅스 커널과 시스템 프로그래밍 관련 일을 했으며, 현재 뉴욕주에 있는 헤지펀드에서 소프트웨어 엔지니어로 일하고 있다. 역서로는 『리눅스 커널의 이해』(한빛미디어, 2003)가 있다.

김종원(옮긴이)

여섯 살 딸아이의 아빠로서 초등학생 때부터 프로그래밍을 시작하여 38년째 프로그래밍을 하고 있다. 과학소설과 만화를 좋아하며 새로운 것에 늘 관심이 많다. 『세계 최초의 프로그래머 에이다 러블레이스』, 『컴퓨터 코딩의 여왕 그레이스 호퍼』, 『코믹 SF 걸작선』, 『윈도우 7 프로그래밍』, 『R로 마스터하는 머신러닝』 등을 번역했다. 현재 엔씨소프트에서 테스트 자동화 연구를 하고 있다.

김태영(옮긴이)

고등학교 시절 영화 월-E(Wall-E)를 보고 AI를 전공하기로 결심했다. 미국에서 석사를 마친 후 엔씨소프트에서 배운 것들을 사용해볼 기회를 호시탐탐 엿보고 있다.

류성희(옮긴이)

산업공학을 전공하고 금융관련 SI 업체에서 프로그래머로 일하다가 생태학과 환경에 관심이 생겨 농업 생태계 모델링을 공부하기 위해 유학을 갔으나 늦깎이로 통계학을 시작해 현재 아이오와 대학 통계학 박사 과정에 있다. 공부는 평생 하는 것이고, 언제든 다시 시작할 수 있다고 생각한다.

정보제공 : Aladin

목차

1장. 성공을 위한 과정 

__CRISP-DM 모형화 기법 
__비즈니스 이해 
____비즈니스의 목적을 확인하는 것 
____현재의 상황 판단 
____분석적 목표의 결정 
____프로젝트의 진행 계획을 만드는 것 
__데이터 이해 
__데이터 준비 
__모형화 
__평가적용알고리즘 순서도 
__요약 

2장. 선형 회귀-머신 러닝의 기본 기 

__단변량 선형 회귀 
____비즈니스 이해하기 
__다변량 선형 회귀 
____비즈니스 이해하기 
____데이터의 이해와 준비 과정 
____모형화와 평가 
__선형 모형에서 다른 고려사항 
____질적 피처 
____상호작용 항 
__요약 

3장. 로지스틱 회귀와 판별 분석 

__분류 방법 및 선형 회귀 
__로지스틱 회귀 
____비즈니스 이해하기 
____데이터의 이해와 준비 과정 
____모형화와 평가 
________로지스틱 회귀 모형 
________교차 검증을 포함한 로지스틱 회귀 
__판별 분석의 개요 
____판별 분석의 적용 
__다변량 적응 회귀 스플라인(MARS) 
모__형 선택 
__요약 

4장. 선형 모형에서 고급 피처 선택 

__규제화(regularization)란? 
____능형 회귀 분석 
____LASSO 
____일래스틱넷 
__비즈니스 사례 
____비즈니스 이해하기 
____데이터의 이해와 준비 과정 
__모형화와 평가.. 
____최량 부분 집합 
____능형 회귀 분석 
____LASSO 
____일래스틱넷 
____glmnet을 사용한 교차 검증 
__모형 선택 
__규제화와 분류 
____로지스틱 회귀의 예 
__요약 

5장. 다른 분류 기법들 - K-최근접 이웃법과 서포트 벡터 머신 

__K-최근접 이웃법 
__서포트 벡터 머신 
__비즈니스 사례 
____비즈니스 이해하기 
____데이터의 이해와 준비 과정 
____모형화와 평가 
________최근접 이웃(KNN) 모형화 
________서포트 벡터 머신 모형화. 
____모형 선택 
__서포트 벡터 머신에서의 피처 선택 
__요약 

6장. 분류 트리와 회귀 트리 

__개괄적인 방법 
____회귀 트리 
____분류 트리 
____랜덤 포레스트(무작위의 숲) 
____그레이디언트 부스트(경사 부양 기법) 
__비즈니스 사례 
____모형화 및 평가 
________회귀 트리 
________분류 트리 
________랜덤 포레스트 회귀 분석(random forest regression) 
________랜덤 포레스트 분류 
________익스트림 그레디언트 부스트 기법 - 분류 
____모형 선정. 
____랜덤 포레스트를 사용한 피처 선택 
__요약 

7장. 신경망과 딥러닝 

__신경망 소개 
__딥러닝, 간단히 살펴보기 
____딥러닝을 위한 자료와 심화 기법 
__비즈니스의 이해 
__데이터의 이해와 준비 과정 
__모형화와 평가 
__딥러닝 예제 
____H2O의 배경 
____데이터를 H2O에 업로드하기 
____훈련 및 테스트 데이터 세트 생성 
____모형화 
__요약 

8장. 군집화 분석 

__계층적 군집화 
____거리 계산 
__K-평균 군집화 
__가워와 중간점 구역 분할 
____가워 비유사성 계수 
____중간점 구역 분할 군집화(PAM) 
__랜덤 포레스트 
__비즈니스 이해하기 
__데이터 이해와 준비 과정 
__모형화와 평가 
____계층적 군집화 
__K-평균 군집화 
____가워와 중간점 구역 분할 
____랜덤 포레스트와 중간점 구역 분할 
__요약 

9장. 주성분 분석 

__주성분의 개요 
____회전 
__비즈니스 이해하기 
____데이터의 이해와 준비 과정 
__모형화와 평가 
____성분 추출 
____직각 회전과 해석 
____성분으로부터 요인 점수 생성 
____회귀 분석 
__요약 

10장. 장바구니 분석, 추천 엔진과 순차적 분석 

__장바구니 분석의 개요 
__비즈니스 이해하기 
__데이터의 이해와 준비 과정 
__모형화와 평가 
__추천 엔진의 개요 
____사용자 기반 협업 필터링 
____아이템 기반 협업 필터링 
____특이값 분해와 주성분 분석 
__비즈니스 이해와 추천 
__데이터의 이해와 준비 과정과 추천 
__모형화와 평가 그리고 추천하기 
__순차적 데이터 분석 
____순차적 데이터 분석의 적용 
__요약 

11장. 앙상블 생성과 다중 클래스 분류 

__앙상블 
__비즈니스와 데이터 이해하기 
__모형화와 평가 그리고 선택 
__비즈니스와 데이터 이해하기 
__모형 평가와 선택 
____랜덤 포레스트 
____능형 회귀 분석 
__MLR에서의 앙상블 
__요약 

12장. 시계열 자료와 인과관계 

__단변량 시계열 분석 
____그랜저 인과관계 이해하기 
__비지니스 이해하기 
____데이터의 이해와 준비 과정 
__모형화와 평가 
____단변량 시계열 예측 
____인과관계의 검사 
________선형 회귀 
________벡터 자기회귀 모형(Vector autoregression) 
__요약 

13장. 텍스트 마이닝 

__텍스트 마이닝 프레임워크와 기법 
__주제(topic) 모형 
____그 밖의 정량 분석 기법 
__비즈니스 이해 
____데이터의 이해와 준비 
__모형화와 평가 
____단어 빈도와 주제 모형 
____또 다른 양적 분석 기법 
__요약 

14장. 클라우드에서 R 사용하기 

__아마존 웹 서비스 계정 생성하기 
____가상 머신 실행 
____RStudio 시작하기 
__요약 

부록. A R의 기본 

__R을 실행하기 
__R 사용하기 
__데이터 프레임과 행렬 
__요약 통계 내기 
__패키지를 설치하고 로드하기 
__dplyr 패키지를 이용해 데이터 다루기 
__요약 

부록 B. 자료 출처

관련분야 신착자료

Baumer, Benjamin (2021)
데이터분석과인공지능활용편찬위원회 (2021)
Harrison, Matt (2021)