HOME > Detail View

Detail View

강화 학습 입문 : GPT-2부터 자동 신경망 구성까지

Material type
단행본
Personal Author
조규남 맹윤호 임지순
Title Statement
강화 학습 입문 : GPT-2부터 자동 신경망 구성까지 / 조규남, 맹윤호, 임지순 지음
Publication, Distribution, etc
서울 :   이지스퍼블리싱,   2021  
Physical Medium
356 p. : 삽화, 도표 ; 26 cm
Series Statement
세상의 속도를 따라잡고 싶다면 Do it!
ISBN
9791163032526
General Note
감수: 송호연  
Bibliography, Etc. Note
참고문헌(p. 351-354)과 색인수록
Subject Added Entry-Topical Term
기계 학습[機械學習] 자연 언어 처리[自然言語處理]
000 00000cam c2200205 c 4500
001 000046096305
005 20211125154618
007 ta
008 211018s2021 ulkad b 001c kor
020 ▼a 9791163032526 ▼g 13000
035 ▼a (KERIS)BIB000015862636
040 ▼a 211062 ▼c 211062 ▼c 211062 ▼d 211009
082 0 4 ▼a 006.31 ▼2 23
085 ▼a 006.31 ▼2 DDCK
090 ▼a 006.31 ▼b 2021z22
100 1 ▼a 조규남
245 1 0 ▼a 강화 학습 입문 : ▼b GPT-2부터 자동 신경망 구성까지 / ▼d 조규남, ▼e 맹윤호, ▼e 임지순 지음
260 ▼a 서울 : ▼b 이지스퍼블리싱, ▼c 2021
300 ▼a 356 p. : ▼b 삽화, 도표 ; ▼c 26 cm
490 1 0 ▼a 세상의 속도를 따라잡고 싶다면 Do it!
500 ▼a 감수: 송호연
504 ▼a 참고문헌(p. 351-354)과 색인수록
650 8 ▼a 기계 학습[機械學習]
650 8 ▼a 자연 언어 처리[自然言語處理]
700 1 ▼a 맹윤호
700 1 ▼a 임지순
830 0 ▼a 세상의 속도를 따라잡고 싶다면 Do it!

Holdings Information

No. Location Call Number Accession No. Availability Due Date Make a Reservation Service
No. 1 Location Sejong Academic Information Center/Science & Technology/ Call Number 006.31 2021z22 Accession No. 151356241 Availability Available Due Date Make a Reservation Service C

Contents information

Book Introduction

이론과 실습을 한 번에 잡는 강화 학습 입문서. 알파고, 테슬라 오토 파일럿, 스타크래프트2 자동 플레이 봇은 어떻게 만들었을까? 궁금하다면 강화 학습을 공부하자. 이 책 한 권이면 이론 공부는 물론이고 다양한 실습으로 강화 학습의 실체를 빠르게 파헤쳐 볼 수 있다. 블랙잭, 비행기 게임, 공 균형 유지 게임 봇, GPT-2 질의응답을 해주는 꼬맹이 자비스, 분산 강화 학습, NAS 자동 신경망 생성기 등을 만들면서 강화 학습을 피부로 느껴 보자.

이론과 실습을 한 번에 잡는 강화 학습 입문서!
파이썬으로 블랙잭 게임 봇 만들기부터 NAS로 자동 신경망 구성까지 Do it!

알파고, 테슬라 오토 파일럿, 스타크래프트2 자동 플레이 봇은 어떻게 만들었을까? 궁금하다면 강화 학습을 공부하자. 영화 <엣지 오브 투모로우>의 이야기로 쉽게 시작하는 강화 학습! 이 책 한 권이면 이론 공부는 물론이고 다양한 실습으로 강화 학습의 실체를 빠르게 파헤쳐 볼 수 있다. 블랙잭, 비행기 게임, 공 균형 유지 게임 봇, GPT-2 질의응답을 해주는 꼬맹이 자비스, 분산 강화 학습, NAS 자동 신경망 생성기 등을 만들면서 강화 학습을 피부로 느껴 보자!

이런 사람이 읽으면 좋아요
- 머신러닝•딥러닝 공부를 하면서 들은 ‘강화 학습’이 무엇인지 궁금해진 사람
- 알파고의 핵심 기술인 ‘강화 학습’을 다양한 실습으로 공부해 보고 싶은 사람
- 에저 분산 강화 학습, AWS 자율 주행 딥레이서 등 강화 학습 상용 서비스를 직접 사용하고 싶은 사람
- 강화 학습의 이론•실습 공부를 한 번에 끝내고 싶은 사람

이런 강화 학습 기술을 경험하고 배울 수 있어요
- 파이썬으로 블랙잭 봇 만들기
- OpenAI 짐 레트로로 2D 게임(비행기 게임)을 자동 플레이하는 에이전트 만들기
- UnityML로 3D 게임(공 균형 유지하기 게임)을 자동 플레이하는 에이전트 만들기
- AWS 딥레이서에서 자율 주행 에이전트 만들기
- MS 에저에서 분산 강화 학습 실습하기
- NAS로 자동 신경망 구성 실습하기

블랙잭 봇부터 자동 신경망 구성까지 실제 동작하는 강화 학습 에이전트 만들기
강화 학습으로 만든 알파고! 강화 학습은 대체 무엇이고 어떤 원리로 동작할까? 직접 만들고 실행하면서 공부하다 보면 강화 학습을 쉽게 이해할 수 있다! 나보다 게임을 더 잘하는 블랙잭, 2D•3D 게임 플레이 봇, 내가 정한 규칙에 맞게 트랙을 달리는 자율 주행 AWS 딥레이서, 내가 하는 질문에 척척 대답하는 GPT-2 꼬맹이 자비스, 신경망을 자동으로 만들어 주는 NAS까지! 책 한 권으로 강화 학습 공부를 끝내 보자!

마르코프 결정 과정, 몬테카를로 학습, PPO 알고리즘 등 강화 학습 이론 소개
강화 학습의 이론 공부도 빼놓을 수 없다! 영화 <엣지 오브 투모로우>로 마르코프 결정 과정이 무엇인지 이해하는 것으로 시작하여 블랙잭 봇을 만들며 몬테카를로 학습을 배우고, 게임 봇이나 아마존 딥레이서에 적용하는 PPO 알고리즘 등 ‘강화 학습에 입문하려면 꼭 알아야 하는 알고리즘’을 수식과 함께 소개했다.

AWS 딥레이서, MS 에저 분산 강화 학습 등 상용 서비스 활용 방법 수록
강화 학습을 현실에 적용할 수 있는지 알고 싶다면 상용 서비스를 직접 사용해 보면 된다! AWS 딥레이서 서비스로 자율 주행 자동차를 만들어 전 세계 사용자와 대결해 보고, MS 에저 분산 강화 학습을 실습하여 실제 강화 학습을 효과적으로 할 수 있는 분산 시스템도 경험해 본다!

이지스퍼블리싱이 선사하는 독자 지원
• 본문 소스 100% 무료 제공
- 깃허브: https://github.com/yunho0130/start-RL

• 이 책의 독자들과 함께 공부하고 책 선물도 받아 가세요!
- 두잇 스터디룸(책 내용 관련 질문 환영): cafe.naver.com/doitstudyroom

추천사
이 책을 먼저 읽은 교수님, 전문 엔지니어의 후기

• 강화 학습의 시야를 확 넓혀 주는 본격 실습 입문서 ━ Riiid VP of AIOps, 송호연 님
이 책은 자연어 처리, 자율 주행, 게임과 같은 영역에서 강화 학습이 어떻게 작용하는지 공부하고 실습해 볼 수 있습니다. 순수 파이썬으로 작성한 블랙잭 게임 강화 학습부터 신경망을 스스로 만들어 나가는 NAS까지 다양한 실습 예제로 강화 학습을 지루하지 않게 공부할 수 있었습니다.

• 강화 학습 입문자, 실무자 모두에게 필요한 책 ━ 포스텍 인공지능대학원, 이근배 교수님
이 책은 강화 학습을 쉽게 공부하고 적용할 수 있도록 설계되어 있습니다. 강화 학습 기술을 쉽게 공부할 수 있는 아주 훌륭한 프레임워크인 셈이죠. 또한 다양한 예제로 강화 학습을 경험하고 연습할 수 있게 해주며 강화 학습 초기 학습자에게 알맞은 짜임새 있는 구성이 돋보입니다. 인공지능이 인공지능을 만드는 NASneural architecture search와 대용량 분산 강화 학습을 다루는 점이 특히 좋았습니다.

• 이론과 실습이라는 토끼 두 마리를 한 번에 모두 잡게 해주는 책 ━ 성균관대학교 소프트웨어학과, 우홍욱 교수님
이 책은 인공지능 중에서도 복잡한 의사결정 문제 해결에 효과적이며 범용 인공지능 기술로 각광받는 강화 학습을 다룹니다. 강화 학습의 이론 설명에만 그치지 않고 게임이나 자율 주행과 같은 다양한 실제 환경에서 활용해 보는 경험을 제공하는 실습 구성이 무척 인상 깊었습니다.

• 최신 알고리즘과 실습을 직관적으로 쉽게 설명하는 책 ━ ex-SecondMind CTO, 김동호 님
직관적으로 이해하기 쉬운 설명과 직접 입력하고 실행하여 눈으로 볼 수 있는 코드를 제공해서 공부하기 편한 책이라는 생각이 듭니다. 배경지식이 없는 상태에서 강화 학습을 재미있게 시작해 보고 싶은 개발자에게 큰 도움이 되리라 믿습니다.

• 강화 학습 입문자도 쉽게 읽을 수 있는 구성이 돋보이는 책 ━ 구글 리서치, 김홍석 님
아마존, 마이크로소프트와 같은 기업에서 제공하는 강화 학습 SaaS의 활용법까지 설명했다는 점에서 특히 눈에 띕니다. 한마디로 딥러닝을 막 마친 사람이 강화 학습을 잘 활용할 수 있게 만들어 주는 책입니다. 강화 학습 입문을 목표로 공부하는 개발자에게 더할 나위 없는 선물이라 생각합니다.


Information Provided By: : Aladin

Author Introduction

맹윤호(지은이)

IBM의 Data&AI 팀에서 엔지니어로 근무했고, 현재는 NCT Marketing의 최고 데이터 책임자로 근무하고 있다. 연세대학교에서 데이터 분석 전공으로 석사 과정을 졸업하고 박사 과정을 수료했다. SK C&C, KISTI, NRF, DBpia 등에서 프로젝트를 진행했으며 Apache Zeppelin, Qiskit, KoGPT-2 등의 오픈소스 프로젝트에 기여했다. 삼성, 현대, LG, 딜로이트 등의 기업과 연세대학교, 중앙대학교, 상명대학교, 순천대학교에서 강연했다. 참여 도서로는 『머신러닝 디자인 패턴』(한빛미디어, 2021), 『Do it! 강화 학습 입문』(이지스퍼블리싱, 2021), 『코딩 진로』(호모 루덴스, 2021), 『초소형 머신러닝 TinyML』(한빛미디어, 2020), 『하이퍼레저 블록체인 개발』(한빛미디어, 2019), 『블록체인의 정석』(지앤선, 2019) 등이 있다. 기술 블로그(https://maengdev.tistory.com)와 유튜브 채널(https://www.youtube.com/myh0130)을 운영 중이다.

조규남(지은이)

삼성전자 소프트웨어 멤버십을 시작으로 현재 국내 IT 대기업에서 AI를 위한 대규모 GPU 시스템 개발 및 운영을 담당하고 있습니다. 고려대학교 대학원에서 슈퍼 컴퓨팅을 활용한 대규모 계산 연구로 석사 학위를 받았습니다. 대규모 GPU를 기반으로 한 AI 시스템과 다양한 컴퓨팅 기술 트렌드에 관심이 많습니다. 최근 3~4년간 국내 다양한 컨퍼런스에서 관련 내용을 발표했습니다.

임지순(지은이)

다양한 기술 스타트업과 콘텐츠 비즈니스를 오가며 기술 에반젤리스트 역할을 수행하고 있습니다. KAIST 바이오 및 뇌공학과에서 신경공학으로 석사 과정을 졸업했습니다.

Information Provided By: : Aladin

Table of Contents

_01장 강화 학습이란?
__01-1 강화 학습 멀리서 훑어보기
__01-2 마르코프 결정 과정으로 시작하는 강화 학습
__01-3 모델 프리 강화 학습

_02장 강화 학습에 딥러닝 조합하기
__02-1 딥러닝 쾌속 복습!
__02-2 DQN 공부하기

_03장 알파고 도전을 위한 첫걸음
__03-1 게임을 스스로 플레이하는 에이전트 만들기
__03-2 유니티 엔진으로 에이전트 만들기

_04장 딥레이서로 구현하는 자율 주행
__04-1 PPO 알고리즘 알아보기
__04-2 딥레이서로 공부하는 강화 학습

_05장 영화 <아이언맨>의 자비스 만들기
__05-1 자연어 처리가 뭐죠?
__05-2 자연어 처리 기법 알아보기
__05-3 GPT로 알아보는 자연어 처리와 강화 학습
__05-4 GPT-2로 자비스 만들기
__05-5 GPT-3와 강화 학습의 미래

_06장 분산 강화 학습 공부하기
__06-1 분산 학습 기초 공부하기
__06-2 분산 강화 학습을 위한 RLlib 라이브러리
__06-3 분산 강화 학습 실행해 보기

_07장 강화 학습으로 만드는 신경망 구조
__07-1 NAS란 무엇일까?
__07-2 NAS 흐름 알아보기
__07-3 NAS 직접 사용해 보기

_08장 NAS 더 자세히 알아보기
__08-1 NAS를 만드는 3단계 다시 알아보기
__08-2 탐색 전략 알아보기
__08-3 탐색 공간 알아보기
__08-4 성능 평가 전략 알아보기
__08-5 NAS, NASNet, ENAS 요약하기


Information Provided By: : Aladin

New Arrivals Books in Related Fields