HOME > 상세정보

상세정보

(PyTorch를 활용한) 강화학습/심층강화학습 실전 입문 : 파이토치로 익히는 기초 강화학습 및 심층강화학습 알고리즘의 원리와 구현 (32회 대출)

자료유형
단행본
개인저자
小川雄太郎 심효섭, 역
서명 / 저자사항
(PyTorch를 활용한) 강화학습/심층강화학습 실전 입문 : 파이토치로 익히는 기초 강화학습 및 심층강화학습 알고리즘의 원리와 구현 / 오가와 유타로 지음 ; 심효섭 옮김
발행사항
파주 :   위키북스,   2018  
형태사항
xiv, 242 p. : 삽화 ; 24 cm
총서사항
데이터 사이언스 시리즈 = DS ; 025
원표제
つくりながら学ぶ!深層強化学習 : PyTorchによる実践プログラミング
ISBN
9791158391287
일반주기
Q러닝, Sarsa, DQN, DDQN, A3C, A2C  
색인수록  
000 00000cam c2200205 c 4500
001 000045966489
005 20190104132012
007 ta
008 190103s2018 ggka 001c kor
020 ▼a 9791158391287 ▼g 93000.
035 ▼a (KERIS)BIB000015002627
040 ▼a 244009 ▼c 244009 ▼d 211009
041 1 ▼a kor ▼h jpn
082 0 4 ▼a 006.31 ▼2 23
085 ▼a 006.31 ▼2 DDCK
090 ▼a 006.31 ▼b 2018z33
100 1 ▼a 小川雄太郎
245 2 0 ▼a (PyTorch를 활용한) 강화학습/심층강화학습 실전 입문 : ▼b 파이토치로 익히는 기초 강화학습 및 심층강화학습 알고리즘의 원리와 구현 / ▼d 오가와 유타로 지음 ; ▼e 심효섭 옮김
246 1 9 ▼a つくりながら学ぶ!深層強化学習 : ▼b PyTorchによる実践プログラミング
246 3 ▼a Tsukurinagara manabu shinsō kyōka gakushū : ▼b paitōchi ni yoru jissen puroguramingu
260 ▼a 파주 : ▼b 위키북스, ▼c 2018
300 ▼a xiv, 242 p. : ▼b 삽화 ; ▼c 24 cm
440 0 0 ▼a 데이터 사이언스 시리즈 = ▼x DS ; ▼v 025
500 ▼a Q러닝, Sarsa, DQN, DDQN, A3C, A2C
500 ▼a 색인수록
700 1 ▼a 심효섭, ▼e▼0 AUTH(211009)8832
900 1 0 ▼a Ogawa, Yūtarō, ▼e
900 1 0 ▼a 오가와 유타로, ▼e
945 ▼a KLPA

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 중앙도서관/제2자료실(3층)/ 청구기호 006.31 2018z33 등록번호 111801821 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 2 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 006.31 2018z33 등록번호 121248432 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 3 소장처 세종학술정보원/과학기술실/ 청구기호 006.31 2018z33 등록번호 151346332 도서상태 대출가능 반납예정일 예약 서비스
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 중앙도서관/제2자료실(3층)/ 청구기호 006.31 2018z33 등록번호 111801821 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 006.31 2018z33 등록번호 121248432 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 세종학술정보원/과학기술실/ 청구기호 006.31 2018z33 등록번호 151346332 도서상태 대출가능 반납예정일 예약 서비스

컨텐츠정보

책소개

강화학습이나 딥러닝 같은 이론보다는 강화학습을 실제로 구현하는 데 초점을 맞춘 책이다. 연구자가 아닌 일반인을 대상으로 실제로 강화학습 알고리즘을 구현하는 과정과 통해 강화학습 및 강화학습에 딥러닝을 접목한 심층강화학습을 이해하는 것을 목표로 한다. 따라서 이론보다는 구현을 중시하고 코드와 그에 대한 설명을 많이 다룬다.

초보 수준의 파이썬 프로그래밍 및 선형대수에 대한 지식을 갖췄고, 딥러닝과 강화학습에 대해 관심은 있지만 자세한 구현 방법을 알지 못하는 분들이라면 이 책을 통해 강화학습 및 심층강화학습 알고리즘의 원리와 구체적인 구현 방법을 손에 익힐 수 있을 것이다.

강화학습과 심층강화학습 알고리즘을 직접 구현하면서 이해한다!

이 책에서는 강화학습이나 딥러닝 같은 이론보다는 강화학습을 실제로 구현하는 데 초점을 맞춘다. 연구자가 아닌 일반인을 대상으로 실제로 강화학습 알고리즘을 구현하는 과정과 통해 강화학습 및 강화학습에 딥러닝을 접목한 심층강화학습을 이해하는 것을 목표로 한다. 따라서 이론보다는 구현을 중시하고 코드와 그에 대한 설명을 많이 다룬다. 초보 수준의 파이썬 프로그래밍 및 선형대수에 대한 지식을 갖췄고, 딥러닝과 강화학습에 대해 관심은 있지만 자세한 구현 방법을 알지 못하는 분들이라면 이 책을 통해 강화학습 및 심층강화학습 알고리즘의 원리와 구체적인 구현 방법을 손에 익힐 수 있을 것이다.

★ 이 책에서 다루는 내용 ★

◎ 강화학습 기초 이론
◎ 미로찾기를 통한 강화학습 구현
◎ 역진자 문제를 통한 강화학습 구현
◎ 파이토치를 이용한 딥러닝 구현
◎ 심층강화학습 알고리즘 구현: DQN
◎ 기타 심층강화학습 알고리즘 및 구현 방법
◎ AWS GPU 환경에서 벽돌 깨기 구현


정보제공 : Aladin

저자소개

오가와 유타로(지은이)

주식회사 덴쓰 국제정보서비스 기술본부 개발기술부 소속. 딥러닝을 비롯한 머신러닝 관련 기술의 연구개발 및 워크스타일이노베이션실의 HR 데이터 분석을 담당하고 있다. 아카시 공업고등전문학교, 도쿄대학 공학부를 거쳐 도쿄대학 대학원의 짐보-코타니 연구실에서 뇌기능 계측 및 계산 신경과학을 연구했으며 2016년 박사학위를 취득했다. 도쿄대학 특임연구원을 거쳐 현직에는 2017년 4월부터 종사 중이다. ㆍ깃허브: https://github.com/YutaroOgawa ㆍQiita: https://qiita.com/sugulu

심효섭(옮긴이)

연세대학교 문헌정보학과를 졸업하고 모교 중앙도서관과의 인연으로 도서관 솔루션 업체에서 일하면서 개발을 시작했다. 네이버에서 웹 서비스 개발 업무를 맡았으며, 웹 서비스 외에 머신러닝에 대한 공부도 꾸준히 하고 있다. 최근 관심사는 회사에 속하지 않고도 지속 가능한 삶이다. 옮긴 책으로 『도메인 주도 설계 철저 입문』 『Vue.js 철저 입문』 『도커/쿠버네티스를 활용한 컨테이너 개발 실전 입문』 『PyTorch를 활용한 강화학습/심층강화학습 실전 입문』 『PyTorch를 활용한 머신러닝, 딥러닝 철저 입문』 등이 있다.

정보제공 : Aladin

목차

▣ 01장: 강화학습이란 무엇인가? 
1.1 머신러닝의 유형(지도학습, 비지도학습, 강화학습) 
__용어 정리 
__지도학습, 비지도학습, 강화학습 
1.2 강화학습 및 심층강화학습의 역사 
__강화학습과 뇌에서 일어나는 학습 
__강화학습과 딥러닝의 결합 
1.3 심층강화학습의 응용 사례 
__심층강화학습의 응용 사례 
__심층강화학습의 미래 

▣ 02장: 미로찾기를 위한 강화학습 구현 
2.1 주피터 노트북 체험 페이지 사용법 
__이번 장에서 사용할 강화학습 구현 및 실행 환경 
__주피터 노트북 체험 페이지 사용법 
2.2 미로와 에이전트 구현 
__미로 구현 
__에이전트 구현 
2.3 정책반복 구현 
__정책반복과 가치반복 
__정책경사 알고리즘에 따라 에이전트 이동시키기 
__정책경사 알고리즘으로 정책 수정 
__정책경사 알고리즘에 대한 이론 
__보상 
2.4 가치반복 알고리즘 관련 용어 정리 
__행동가치와 상태가치 
__벨만 방정식과 마르코프 결정 프로세스 
__ε-greedy 알고리즘으로 정책 구현하기 
2.5 Sarsa 알고리즘 구현 
__행동가치 함수 Q(s,a)를 Sarsa 알고리즘으로 수정 
__Sarsa로 미로찾기 구현 
__Q러닝의 알고리즘 
__Q러닝 구현 
2.6 Q러닝 구현 

▣ 03장: 역진자 문제를 위한 강화학습 구현 
3.1 로컬 PC에 강화학습 개발환경 갖추기 
__파이썬 실행 환경인 아나콘다 설치 
__강화학습에 사용할 라이브러리 설치 
3.2 역진자 태스크 “CartPole” 
__CartPole이란? 
__CartPole 구현 
3.3 다변수, 연속값 상태를 표형식으로 나타내기 
__CartPole의 상태 
__상태의 이산변수 변환 구현 
3.4 Q러닝 구현 

▣ 04장: 파이토치를 이용한 딥러닝 구현 
4.1 신경망과 딥러닝의 역사 
__첫 번째 신경망 연구 붐 
__두 번째 신경망 연구 붐 
__세 번째 신경망 연구 붐 
4.2 딥러닝의 계산 과정 
__추론 단계 
__학습 단계 
4.3 파이토치를 이용한 MNIST 손글씨 이미지 분류 구현 
__파이토치란? 
__파이토치 개발환경 갖추기 
__MNIST 데이터 다운로드 
__파이토치를 이용한 딥러닝 구현 
____1. 데이터 전처리 
____2. DataLoader 생성 
____3. 신경망 구성 
____4. 오차함수 및 최적화 기법 설정 
____5. 학습 및 추론 설정 
____6. 학습 및 추론 수행 
파이토치 사용법에 대한 보충 설명 

▣ 05장: 딥러닝을 적용한 강화학습 - DQN 구현 
5.1 딥러닝을 적용한 Q러닝 
__표형식 표현의 문제점 
__심층강화학습 알고리즘 DQN 
5.2 DQN을 구현할 때 중요한 4가지 기법 
5.3 DQN 구현(1) 
__파이토치로 DQN을 구현할 때 주의점 
__DQN 구현 
5.4 DQN 구현(2) 

▣ 06장: 딥러닝을 적용한 강화학습 - 심화 과정 
6.1 심층강화학습 알고리즘 지도 
6.2 DDQN(Double-DQN) 구현 
__DDQN 
__DDQN 구현 
6.3 Dueling Network 구현 
__Dueling Network 
__Dueling Network 구현 
6.4 Prioritized Experience Replay 구현 
__Prioritized Experience Replay 
__Prioritized Experience Replay 구현 
6.5 A2C 구현 
__A2C 
__A2C 구현 

▣ 07장: AWS GPU 환경에서 벽돌 깨기 구현 
7.1 벽돌 깨기 게임 “Breakout” 
7.2 AWS로 GPU를 사용하는 딥러닝 실행 환경 구성 
__우분투 터미널 설치 
__가상 서버와 통신하는 데 사용할 키 생성 
__AWS에서 딥러닝을 실행할 가상 서버 만들기 
__벽돌 깨기 게임 실행 환경 구축 
7.3 Breakout 학습에서 중요한 포인트 4가지 
__로컬 PC 환경 설정 
__Breakout 게임을 학습하는 데 중요한 포인트 4가지 
7.4 A2C 구현(1) 
7.5 A2C 구현(2)

관련분야 신착자료

Baumer, Benjamin (2021)
데이터분석과인공지능활용편찬위원회 (2021)
Harrison, Matt (2021)