HOME > Detail View

Detail View

(파이썬으로 경험하는) 빅데이터 분석과 머신러닝

(파이썬으로 경험하는) 빅데이터 분석과 머신러닝 (Loan 7 times)

Material type
단행본
Personal Author
이영호 이수현, 저
Title Statement
(파이썬으로 경험하는) 빅데이터 분석과 머신러닝 / 이영호, 이수현 지음
Publication, Distribution, etc
파주 :   생능출판,   2021  
Physical Medium
443 p. : 삽화, 도표 ; 25 cm
ISBN
9788970504803
Bibliography, Etc. Note
참고문헌(p. 435-439)과 색인수록
000 00000cam c2200205 c 4500
001 000046072640
005 20210305113857
007 ta
008 210303s2021 ggkad b 001c kor
020 ▼a 9788970504803 ▼g 93000
035 ▼a (KERIS)REQ000052755051
040 ▼a 211062 ▼c 211062 ▼c 211062 ▼d 211009
082 0 4 ▼a 006.312 ▼2 23
085 ▼a 006.312 ▼2 DDCK
090 ▼a 006.312 ▼b 2021z2
100 1 ▼a 이영호
245 2 0 ▼a (파이썬으로 경험하는) 빅데이터 분석과 머신러닝 / ▼d 이영호, ▼e 이수현 지음
260 ▼a 파주 : ▼b 생능출판, ▼c 2021
300 ▼a 443 p. : ▼b 삽화, 도표 ; ▼c 25 cm
504 ▼a 참고문헌(p. 435-439)과 색인수록
700 1 ▼a 이수현, ▼e
945 ▼a KLPA

No. Location Call Number Accession No. Availability Due Date Make a Reservation Service
No. 1 Location Main Library/Monographs(3F)/ Call Number 006.312 2021z2 Accession No. 111844892 Availability In loan Due Date 2022-04-18 Make a Reservation Exceeds Maximum Reserve Allowed Service M
No. 2 Location Science & Engineering Library/Sci-Info(Stacks1)/ Call Number 006.312 2021z2 Accession No. 121261474 Availability Available Due Date Make a Reservation Service B M
No. Location Call Number Accession No. Availability Due Date Make a Reservation Service
No. 1 Location Main Library/Monographs(3F)/ Call Number 006.312 2021z2 Accession No. 111844892 Availability In loan Due Date 2022-04-18 Make a Reservation Exceeds Maximum Reserve Allowed Service M
No. Location Call Number Accession No. Availability Due Date Make a Reservation Service
No. 1 Location Science & Engineering Library/Sci-Info(Stacks1)/ Call Number 006.312 2021z2 Accession No. 121261474 Availability Available Due Date Make a Reservation Service B M

Contents information

Book Introduction

빅데이터 머신러닝 기초 이론부터 파이썬으로 차근차근 눈으로 보며 실습하는 것을 목표로 한다. 복잡한 프로그래밍은 최소화하고 가장 유명한 데이터들로 판다스, 시본, 케라스, 텐서플로 등 인기 있는 파이썬 라이브러리를 경험할 수 있다. 나아가 클라우드 머신러닝을 활용한 최신 기술들도 실습할 수 있다.

제가 몸담고 있는 가천대 길병원 로비에는 로봇이 걸어 다닙니다. 초롱초롱 눈망울이 귀여운 이 친구의 이름은 ‘페퍼’입니다. 감정 인식이 가능한 페퍼는 소프트뱅크가 개발한 세계 최초 휴머노이드 소셜 로봇입니다. 페퍼는 병원 본관 로비와 인공지능 암센터에 배치되어 환자를 응대하고 다양한 건강 정보를 제공하며 무균실, 중환자실 등 일반인 접근이 어려운 병실에서 환자들의 신체적 건강뿐만 아니라 감성까지 도와주고 있습니다. 뿐만 아닙니다. IBM 인공지능 의사 ‘왓슨’은 길병원 최전선 임상 현장에서 이미 오래전부터 활약하고 있습니다.
이제 인공지능 기술은 선택의 문제가 아닙니다. 앞으로 얼마나 더 많은, 또 얼마나 더 똑똑한 ‘페퍼’와 ’왓슨’이 쏟아져 나올지 상상해 보십시오. 우리 주변은 벌써 ‘스마트’ 또는 ‘지능형’과 같은 수식어를 단 사물로 가득하며, 이런 인공지능 기술의 진화는 이미 제어하기 힘들 정도의 가속도를 얻으며 미래로 달려가고 있습니다.
이런 인공지능 기술의 핵심은 빅데이터 머신러닝입니다. 쉬운 개념은 아닐지 모르나 결코 낯선 단어는 아니죠. 인터넷 클릭 몇 번이면 관련 지식들이 쏟아지니까요. 하지만 막상 빅데이터 머신러닝을 배우려고 시도해 본 사람이라면, 이 기술에 접근하기가 생각보다 쉬운 일이 아님을 깨닫게 됩니다. 빅데이터, 통계, 머신러닝 기술은 밀접하게 연관되어 있기는 하나, 각자 나름의 영역을 분명하게 가지고 있습니다. 입문자들에게 이런 특성은 뛰어넘기 어려운 벽으로 작용합니다.
‘빅데이터 머신러닝 기술’이 어려운 데에는 이유가 있습니다. 각 영역의 특성을 이해하고 기본기를 탄탄히 하지 않은 채 시작하기 때문입니다. 기본 이론을 단순히 암기하거나 소홀히 지나친다면, 이 중요한 미래 기술을 내 것으로 만들기 힘듭니다. 시중에는 이미 훌륭한 빅데이터 인공지능 관련 책들이 많이 나와 있습니다. 하지만 복잡한 수학 이론을 별다른 도움 없이 이해할 수 있는 경력자들을 위한 책이 대부분이라는 점은 교육 현장에서 학생들의 어려움을 직접 보고 듣는 입장에서 매우 안타까운 일이었습니다.
이 책은 빅데이터 머신러닝 기초 이론부터 파이썬으로 차근차근 눈으로 보며 실습하는 것을 목표로 합니다. 복잡한 프로그래밍은 최소화하고 가장 유명한 데이터들로 판다스, 시본, 케라스, 텐서플로 등 인기 있는 파이썬 라이브러리를 경험할 수 있습니다. 나아가 클라우드 머신러닝을 활용한 최신 기술들도 실습할 수 있습니다. 기본 이론을 이해하고 실습을 통해 차근차근 경험을 쌓아 나가기만 한다면, 빅데이터 머신러닝이라는 거창한 이름이 만만한 친구처럼 편안해질 날은 생각보다 빨리 옵니다. 그때까지 이 책이 여러분의 짐을 나눠지고 지름길을 찾아주는 착한 안내자 역할을 해 줄 수 있기를 기원합니다.

이 책의 특징

어렵고, 복잡한 프로그래밍은 이제 그만!
초보자도 쉽게 파이썬 실습 중심으로 빅데이터와 머신러닝 따라 하기


• 복잡한 통계도 핵심만 쉽게 이해하고 통계 결과를 해석할 수 있습니다.
• 가장 유명한 데이터와 인기 있는 파이썬 라이브러리를 활용하여 학습합니다.
• 데이터의 준비에서부터 미래 머신러닝까지 빅데이터와 인공지능 최신 기술들을 실습합니다.

파이썬을 활용하여 실습을 진행합니다.
빅데이터 분석과 머신러닝 이론과 실습을 동시에 제공합니다.


① 빅데이터와 머신러닝 연계 학습
• 빅데이터와 머신러닝의 전반적인 내용을 학습합니다.
• 이론은 간단히, 실습 중심으로 진행합니다.

② 빅데이터 분석 중심 학습
• 빅데이터 분석에 필요한 데이터 중심으로 학습합니다.
• 파이프라인 절차를 따라 빅데이터 분석을 학습합니다.
• 통계 이론과 실습으로 머신러닝을 이해할 수 있습니다.

③ 머신러닝 중심 학습
• 머신러닝에 필수적인 데이터 이해를 사전 학습합니다.
• 통계를 통해 머신러닝 개념을 이해합니다.
• 파이썬 기반 머신러닝 이론과 실습을 학습합니다.


Information Provided By: : Aladin

Author Introduction

이영호(지은이)

가천대학교 컴퓨터 공학과 교수입니다. 젊은 인재들과 함께 개방형 융합연구소를 운영하며 ICT 기술과 의료 분야가 융합된 의료 정보(Medical Informatics) 전문가로 일하고 있습니다. 교수로서보다는 코치로 학생들과 같이 연구하기를 희망하고 새로운 기술 도전을 즐깁니다. 미국 버지니아 공대에서 데이터 사이언스와 헬스 IT 연구를 진행했고, IBM에서 비즈니스 인텔리전스 전문가로 일했습니다. 50편 이상 ICT 융합 분야 논문, 특허, 학술 발표 경력이 있습니다. 저서로는 <당신이 지금 알아야 할 빅4 클라우드 머신러닝>_(2020, 비제이퍼블릭), <당신이 지금 알아야 할 AWS>_(2019, 비제이퍼블릭), <오픈데이토피아>_(2017, 북오션)>, <보건의료정보학>_(2015, 현문사) 등이 있습니다.

이수현(지은이)

건양대학교 의과대학 정보의학교실 교수입니다. 가천대학교에서 컴퓨터공학을 전공하고, 서울의대 대학원에서 의료정보학으로 의학 박사 학위를 취득하였습니다. 서울대병원 의생명연구원에서 연구 조교수로 재직하였습니다. 주 연구 분야는 Clinical Research informatics, Data management in clinical research, Pharmacovigilance System이며, 50회 이상 정보의학 분야 논문, 특허, 학술 발표 경력이 있습니다. 의과대학 학생들과 정보의학 분야 중 Real world data(RWD)를 활용한 데이터 분석 연구들을 즐겁게 진행하고 있습니다. 또한 국내에서 의료 빅데이터 활용을 위한 임상활용연구회에 참여하고 있습니다.

Information Provided By: : Aladin

Table of Contents

1장 빅데이터와 인공지능
1. 빅데이터와 인공지능 그리고 머신러닝
도로를 달리는 컴퓨터
컴퓨팅 파워
빅데이터와 인공지능의 발전
2. 인공지능 시대 기술
인공지능 머신러닝 딥러닝과 빅데이터
인공지능 센서가 되는 사물인터넷(IoT)
인공지능 확산 핵심 인프라 클라우드
인공지능 원료 빅데이터
더 안전한 블록체인 기반 인공지능
3. 데이터 사이언티스트
빅데이터 머신러닝(이하 빅러닝)을 위한 지식들
데이터 기술자 시대
데이터 사이언티스트
빅러닝 파이프라인
■ 연습문제

2장 빅러닝 환경
1. 빅러닝 분석 도구
빅러닝 도구 필수 조건
파이썬과 R
결론은 파이썬
2. 개발 환경 준비
아나콘다 배포판 준비
파이썬 모듈과 패키지
파이썬 주요 라이브러리
통합 IDE
3. 분석 보고서 만들기
마크업
마크다운
주피터 노트북 마크다운 보고서 작성
■ 연습문제

3장 파이썬 데이터
1. 파이썬 데이터 다루기
데이터 표현
기본 연산
논리 연산
비교 연산
2. 변수와 자료형
변수
자료형
3. 함수와 모듈
함수
모듈
■ 연습문제

4장 데이터 준비
1. 데이터 이해
정형 데이터
반정형 데이터
비정형 데이터
2. 데이터 소스
데이터 구하기
오픈 데이터
3. 데이터 불러오기
CSV 파일
EXCEL 파일
JSON 파일
4. 데이터 저장하기
CSV 파일 저장
EXCEL 파일 저장
JSON 파일 저장
피클 저장하기
5. 공공 데이터 OPEN API
공공 데이터 서비스 이용 방법
공공 데이터 이용 방법
API 키 인증 없이 API 정보 가지고 오기
API와 HTTP 프로토콜
6. 파이썬 웹 크롤링
웹 크롤링 이해
BeautifulSoup 기본 설명
네이버 웹 크롤링
■ 연습문제

5장 데이터 보기
1. 판다스 데이터 구조
2. 시리즈와 데이터프레임
시리즈
데이터프레임
3. 데이터프레임 조작
데이터프레임 행과 열
행과 열의 크기
깔끔한 데이터
데이터프레임 확인
행 데이터
열 변수
데이터 조작
4. 데이터 연결과 병합
데이터 연결
데이터 병합
5. 단일변수 데이터 보기
데이터프레임 변수 유형
변수 유형별 데이터 분석
범주형
연속형
■ 연습문제

6장 데이터 클린징
1. 데이터 클린징의 이해
2. 결측 데이터
결측 데이터 확인
결측 데이터 개수 확인
결측 데이터 제거
결측 데이터 대체
결측 데이터 처리 주의 사항
3. 이상 데이터
이상 데이터 확인
이상 데이터 시각화
이상치 처리 방법
4. 중복 데이터
중복 데이터 확인
중복 시작과 끝 확인
중복 데이터 제거
■ 연습문제

7장 데이터 탐색
1. 데이터 그룹 분석
그룹 분석
집계 함수 사용
2. 데이터 재구조화
데이터 구간화
원-핫인코딩
데이터 전치
피봇테이블
멜트
스택/언스택
3. 시계열 데이터
시간 조작
타임스탬프
기간 함수
■ 연습문제

8장 데이터 시각화
1. 시각화의 시대
눈으로 보는 데이터
시각화의 중요성
엔스콤 시각화
시각화 라이브러리
2. 기본 시각화
시각화 준비
시각화 옵션 지정
일차 시각화
선그래프
막대그래프
산점도
히스토그램
3. 고급 시각화
시본
시각화 옵션
막대그래프
박스플롯
박스플롯으로 이상치 제거 후 시각화
4. 변수 유형별 시각화
일변수 시각화
이변수 시각화
다변량 시각화
5. 인터랙티브 시각화
갭마인더
플로틀리
피갈
보케
홀로뷰
6. 시계열 시각화
시계열 시각화 유형
시계열 시각화 실습
■ 연습문제

9장 데이터 분석
1. 분석 파이프라인
빅데이터 분석 파이프라인
데이터 분석 시작 전 몇 가지 질문
2. 타이타닉 분석 파이프라인
데이터 준비
데이터 보기
데이터 클린징
데이터 탐색
데이터 탐색 자동 보고서
데이터 시각화 분석
타이타닉 분석 요약
■ 연습문제

10장 스몰데이터 통계
1. 기초 통계 이해
2. 가설 수립과 검정
가설 수립
가설 검정
오류
통계 결과 해석
3. T-분석
4. 카이제곱 검정
■ 연습문제

11장 통계에서 머신러닝으로
1. 상관분석
2. 회귀분석
선형회귀분석
로지스틱 회귀분석과 가중치
3. 머신러닝 넘어가기
머신러닝 모델 최적화
머신러닝 모델 일반화
■ 연습문제

12장 머신러닝 핵심
1. 머신러닝
프로그래밍과 머신러닝
머신러닝의 발전
2. 머신러닝 구성
머신러닝 데이터
머신러닝 문제
3. 머신러닝 학습 구분
머신러닝 학습
머신러닝 평가
4. 머신러닝 준비
머신러닝 라이브러리
머신러닝 파이프라인
로지스틱 모델 예측
의사결정나무 예측
■ 연습문제

13장 머신러닝 모델
1. 지도 학습, 비지도 학습 모델
지도 학습
지도 학습 모델
비지도 학습
비지도 학습 모델
2. 인공신경망 모델
인공신경망
기본 신경망
케라스 신경망
케라스 ANN 이미지 모델
3. 머신러닝 최적화 성능 요소
비용함수
옵티마이저
활성화 함수
가중치 감소와 규제
데이터 분할 반복
플레이그라운드 머신러닝
■ 연습문제

14장 딥러닝 텐서플로
1. 딥러닝
심층망의 시작
텐서플로
텐서플로 DNN 모델 만들기
2. 딥러닝의 발전
딥러닝의 문제점
CNN 모델
필터 모델 개념 실습
3. 텐서플로 CNN 모델 만들기
4. 텐서플로 Estimator
■ 연습문제

15장 미래 머신러닝
1. 인공지능의 미래
강/약 인공지능
설명 가능 AI(XAI)
머신러닝 모델
제로샷 학습
2. 클라우드 머신러닝
클라우드 컴퓨팅
클라우드 컴퓨팅 서비스
클라우드 머신러닝
3. GPU가 필요해
코랩
코랩 클라우드 환경
GPU CNN 모델 만들기
■ 연습문제

New Arrivals Books in Related Fields

Chellappa, Rama (2022)
Shneiderman, Ben (2022)