HOME > 상세정보

상세정보

AWS 머신 러닝 : 아마존 머신 러닝 서비스를 이용한 애플리케이션 개발

AWS 머신 러닝 : 아마존 머신 러닝 서비스를 이용한 애플리케이션 개발 (5회 대출)

자료유형
단행본
개인저자
Perrier, Alexis 정준영, 역
서명 / 저자사항
AWS 머신 러닝 : 아마존 머신 러닝 서비스를 이용한 애플리케이션 개발 / 알렉시스 페리에 지음 ; 정준영 옮김.
발행사항
서울 :   에이콘,   2018  
형태사항
334 p. : 삽화 ; 24 cm
원표제
Effective Amazon machine learning : machine learning in the Cloud
ISBN
9791161751085 9788960772106 (세트)
일반주기
기술 감수자: 더그 오리티츠  
000 00000cam c2200205 c 4500
001 000045934977
005 20180418131514
007 ta
008 180313s2018 ulka 000c kor
020 ▼a 9791161751085 ▼g 94000
020 1 ▼a 9788960772106 (세트)
035 ▼a (KERIS)BIB000014725757
040 ▼a 241050 ▼c 241050 ▼d 241050 ▼d 211009
082 0 4 ▼a 006.31 ▼2 23
085 ▼a 006.31 ▼2 DDCK
090 ▼a 006.31 ▼b 2018z11
100 1 ▼a Perrier, Alexis
245 1 0 ▼a AWS 머신 러닝 : ▼b 아마존 머신 러닝 서비스를 이용한 애플리케이션 개발 / ▼d 알렉시스 페리에 지음 ; ▼e 정준영 옮김.
246 1 9 ▼a Effective Amazon machine learning : ▼b machine learning in the Cloud
260 ▼a 서울 : ▼b 에이콘, ▼c 2018
300 ▼a 334 p. : ▼b 삽화 ; ▼c 24 cm
500 ▼a 기술 감수자: 더그 오리티츠
700 1 ▼a 정준영, ▼e
900 1 0 ▼a 페리에, 알렉시스, ▼e

소장정보

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 세종학술정보원/과학기술실/ 청구기호 006.31 2018z11 등록번호 151340566 도서상태 대출가능 반납예정일 예약 서비스 C

컨텐츠정보

책소개

AWS가 제공하는 머신 러닝 서비스를 이용하면, 복잡한 머신 러닝 내부 알고리즘과 기술을 배우지 않고도 AWS의 S3나, RDS, 레드시프트에 저장된 데이터로 학습 모델을 만들고 애플리케이션을 개발할 수 있다. 직관적인 웹 기반 마법사 기능과 자동화를 위한 SDK, 데이터 변환을 위한 레시피, 학습된 모델의 성능 평가 결과가 자동으로 제공되고, AWS의 다른 서비스와 연동해 배치 또는 실시간으로 예측할 수 있으며, 사용한만큼만 비용이 지불되는 완전 관리형 서비스다.

아마존 머신 러닝을 이용해 처음부터 예측 분석까지 수행하는 방법, 중요 데이터 과학 개념에 대한 실습 경험, 고전 회귀 및 분류 문제 해결, 명령행 인터페이스와 Python SDK를 이용해 프로젝트 실행, 아마존 생태계를 활용해 확장된 데이터 소스, 실시간 또는 고급 프로젝트 구현 등을 알려준다.

AWS가 제공하는 머신 러닝 서비스를 이용하면, 사용자가 복잡한 머신 러닝 내부 알고리즘과 기술을 배우지 않고도 AWS의 S3나, RDS, 레드시프트에 저장된 데이터로 학습 모델을 만들고 애플리케이션을 개발할 수 있다.
직관적인 웹 기반 마법사 기능과 자동화를 위한 SDK, 데이터 변환을 위한 레시피, 학습된 모델의 성능 평가 결과가 자동으로 제공되고, AWS의 다른 서비스와 연동해 배치 또는 실시간으로 예측할 수 있으며, 사용한만큼만 비용이 지불되는 완전 관리형 서비스다.

★ 이 책에서 다루는 내용 ★

- 아마존 머신 러닝을 이용해 처음부터 예측 분석까지 수행하는 방법
- 중요 데이터 과학 개념에 대한 실습 경험
- 고전 회귀 및 분류 문제 해결
- 명령행 인터페이스와 Python SDK를 이용해 프로젝트 실행
- 아마존 생태계를 활용해 확장된 데이터 소스
- 실시간 또는 고급 프로젝트 구현

★ 이 책의 대상 독자 ★

실제 인공 지능 애플리케이션을 구축하려고 하는 파이썬 개발자를 위한 책이다.
파이썬 초보자도 쉽게 사용할 수 있지만, 파이썬에 익숙하다면 코드를 활용해 다양한 작업을 할 수 있다. 인공 지능 기술을 갖고 싶은 경험이 있는 파이썬 개발자에게도 유용하다

★ 이 책의 구성 ★

1장, '머신 러닝과 예측 분석 소개'에서는 아마존 머신 러닝 서비스에 대한 일반적인 소개와 이것으로 처리할 수 있는 예측 분석 문제를 담고 있다. 서비스가 단순한 선형 모델을 회귀와 분류 문제에 사용하는 방법을 보이고, 아마존 머신 러닝으로 성공적인 예측을 할 수 있는 환경을 제시한다.
2장, '머신 러닝의 정의와 개념'에서는 아마존 머신 러닝 서비스를 사용하고 동작을 완전히 이해하기 위해 머신 러닝 개념을 설명한다. 또한 실제 데이터를 다룰 때 사용하는 데이터 처리 기술이 무엇인지, 예측 모델의 성능을 어떻게 평가하는지, 낮은 예측 성능을 개선할 수 있는 전략은 무엇인지에 관해서도 설명한다.
3장, '아마존 머신 러닝 워크플로우 개요'에서는 간단한 아마존 머신 러닝 프로젝트 개요를 다룬다. 아마존 머신 러닝 플랫폼을 시작하는 방법과 계정을 만드는 방법, 계정을 보호하는 방법을 배운다. 유명한 데이터셋으로 간단한 수치형 예측 문제를 살펴볼 것이다. 데이터를 준비하고, 모델을 훈련하고 선택하고, 예측하는 방법을 설명한다.
4장, '데이터셋 준비하기'에서는 아마존 머신 러닝의 레시피를 이용해 데이터를 변환하는 기능을 제공한다. 데이터를 S3에 업로드하고, 교차 유효성 검증을 구현하고, 스키마를 만들고, 데이터의 동계를 검토한다. 새롭게 출시된 AWS SQL 서비스인 아테나(Athena)를 이용해 아마존 머신 러닝의 특징 공학과 데이터 정리 기능을 확장한다.
5장,' 모델 생성'에서는 아마존 머신 러닝의 데이터 변환과 레시피로 사용하는 방법을 살펴본다. 모델을 훈련하고 튜닝한 후, 여러 가지 예측 척도를 분석해 최선의 것을 선택한다. 확률적 경사 하강 알고리즘과 여러 정규화 타입의 사용을 설명한다. 마지막으로 아마존 머신 러닝 이 모델을 훈련하는 동안 어떤 일이 발생하는지 더 잘 이해하기 위해 훈련 로그를 분석한다.
6장, '예측과 성능'에서는 새로 훈련한 모델로 이전에 보여준 적이 없는 데이터에 대한 예측을 실시하고, 성능과 강건성을 평가한다. 배치 예측 방법과 실시간 예측을 위한 접점을 설정하는 방법을 알려준다.
7장, '명령행과 SDK' AWS 웹 인터페이스를 사용해 프로젝트를 관리하고 실행하는 것은 시간이 많이 걸리기 때문에 웹 인터페이스에서 벗어나 AWS 명령행(CLI)과 Boto3 라이브러리를 이용한 Python SDK로 실행한다. 교차 유효성 검증과 반복적 특징 선택을 구현한다.
8장, '레드시프트에서 데이터 소스 만들기'에서는 SQL 질의를 이용해 비선형 데이터셋을 처리한다. 레드시프트를 이용하면 데이터 소스를 만들기 전에 SQL기반의 특징 공학을 할 수 있다. S3에서 데이터를 레드시프트에 적재하고, 데이터베이스에 접속하고, 질의를 실행하고 결과를 내보내는 방법을 살펴본다.
9장, '실시간 데이터 분석 파이프라인 구축하기'에서는 아마존 머신 러닝을 다른 AWS 서비스와 결합해 확장한다. AWS 키네시스와 람다, 레드시프트, 머신 러닝을 결합해 실시간 트윗 분석 데이터 파이프라인을 구축한다.


정보제공 : Aladin

저자소개

알렉시스 페리에(지은이)

보스턴에 있는 도슨트 헬스(Docent Health)라는 스타트업의 데이터 과학자다. 헬스케어 분야에서 환자의 경험을 개선하기 위해 머신 러닝과 자연어 처리 관련 업무를 하고 있다. 확률적 알고리즘의 힘에 매료돼 데이터 과학 커뮤니티에서 강사, 블로거, 발표자로 활발히 활동하고 있으며, 텔레콘 파리 테크(Telecom Paris Tech에)서 신호 처리 분야 박사 학위를 받고 보스턴에 거주하고 있다. 트위터(@alexip)나 이메일(alexis.perrier@gmail.com)로 연락할 수 있다

정준영(옮긴이)

처음 입사한 한글과컴퓨터에서 심마니 서비스로 검색을 시작했다. SK컴즈(네이트닷컴), KTH(파란닷컴), 삼성전자(갤럭시앱스 등)를 거쳐 현재 쿠팡에서 검색을 담당하고 있다. 새로운 영역에 도전해보고자 시작한 첫 번역이다. poterius@naver.com

정보제공 : Aladin

목차

1장. 머신 러닝과 예측 분석 소개

__아마존 머신 러닝 소개
____서비스로서의 머신 러닝
____AWS 융합 활용하기
____성능 비교
____가격 책정
__예측 분석 이해
____가장 간단한 예측 분석 알고리즘 구축하기
____회귀와 분류
____로지스틱 회귀로 회귀를 분류 문제로 확장하기
____결과를 예측하기 위한 특징 추출하기
__예측을 위한 선형 모델 심화
데이터셋 검증
____아마존 머신 러닝에서 결여된 것
____통계적 접근과 머신 러닝 접근
__요약

2장. 머신 러닝 정의와 개념

__알고리즘? 모델?
__지저분한 데이터 다루기
____고전적인 데이터셋과 실제 데이터셋
____다중 분류 모델에 관한 가정
____누락값
____정규화
____불균형 데이터셋
____다중공선성 해결
____이상값 검출
____비선형 패턴 수용
____특징 추가
____전처리 요약
__예측 분석 작업 흐름
____아마존 머신 러닝에서 학습과 평가
__저품질 인지와 수정
____언더피팅
____오버피팅
____선형 모델에 관한 정규화
____모델의 성능 평가
__요약

3장. 아마존 머신 러닝 워크플로 개요

__AWS 계정 만들기
____보안
__계정 설정하기
____유저 생성
____정책 정하기
____로그인 크리덴셜 생성
__표준 아마존 머신 러닝 워크플로 개요
____데이터셋
__모델
__모델 평가
__배치 예측 만들기
__요약

4장. 데이터셋 준비하기

__데이터셋으로 작업하기
____공개 데이터셋 찾기
____타이타닉 데이터셋 소개
__데이터 준비
____데이터 나누기
____데이터를 S3에 올리기
__데이터 소스 만들기
____데이터 스키마 확인
____스키마 재사용
__데이터 통계 진단
__아테나와 특징 공학
____아테나 소개
____타이타닉 데이터셋 만들기
__SQL로 데이터 가공하기
____누락값
____개선된 데이터 소스 만들기
__요약

5장. 모델 생성

__레시피로 데이터 변환하기
____변수 관리
____일곱 가지 변환을 통한 데이터 처리
__모델 만들기
____제안된 레시피 편집하기
____모델의 매개변수화
__평가 생성하기
____모델 평가하기
__로그 분석
____학습률 최적화
__요약

6장. 예측과 성능

__배치 예측 만들기
____배치 예측 작업 만들기
____예측 결과 해석하기
__실시간 예측 만들기
____수작업으로 변수의 영향 조사
____실시간 예측 설정
__요약

7장. 명령행과 SDK

__시작과 설정
____CLI vs SDK 사용하기
____AWS CLI 설치
____CLI 구문 가져오기
____JSON 파일을 이용해 파라미터 전달하기
____Ames Housing 데이터셋 소개
____쉘 명령으로 데이터셋 분리하기
__CLI를 사용하는 간단한 프로젝트
____아마존 머신 러닝 CLI 명령 개요
____데이터 소스 만들기
____모델 만들기
____create-evaluation 명령으로 모델 평가하기
____교차 유효성 검증이란?
____몬테 카를로 교차 유효성 검증 구현하기
____결론
__Boto3, the Python SDK
____아마존 머신 러닝을 위한 Python SDK로 작업하기
____Boto3로 반복적 특징 선택 구현하기
__요약

8장. 레드시프트에서 데이터 소스 만들기

__RDS와 레드시프트 중에서 선택
____레드시프트 인스턴스 만들기
____Psql로 레드시프트 질의 실행하기
____비선형 데이터셋 만들기
__다항회귀 소개
____기준선 정하기
__아마존 머신 러닝에서 다항회귀
____Python에서 실험하기
____결과 해석하기
__요약

9장. 실시간 데이터 분석 파이프라인 구축하기

__실시간 트위터 감성 분석
____트위터의 인기 콘테스트
____데이터셋과 모델 훈련하기
____키네시스
____트윗 수집하기
____레드시프트 데이터베이스
____Redshfit를 키네시스 Firehose에 더하기
____Lambda로 전처리하기
____결과 분석하기
__분류와 회귀를 넘어서
__요약


정보제공 : Aladin

관련분야 신착자료

Harrison, Matt (2021)
데이터분석과인공지능활용편찬위원회 (2021)
Stevens, Eli (2020)