HOME > 상세정보

상세정보

파이썬으로 배우는 데이터 과학 : 파이썬의 주요 패키지부터 머신 러닝, 시각화에 이르기까지 데이터 과학의 핵심을 한번에

자료유형
단행본
서명 / 저자사항
파이썬으로 배우는 데이터 과학 : 파이썬의 주요 패키지부터 머신 러닝, 시각화에 이르기까지 데이터 과학의 핵심을 한번에 / 알베르토 보스체티, 루카 마싸론 지음 ; 이판호 옮김
발행사항
서울 : 에이콘, 2018
형태사항
449 p. : 삽화, 도표 ; 24 cm
총서사항
acorn+PACKT technical book
원표제
Python data science essentials : become an efficient data science practitioner by understanding Python's key concepts (2nd ed.)
ISBN
9791161750910 9788960772106 (세트)
일반주기
색인수록 부록: 파이썬 기초 강화하기
일반주제명
Python (Computer program language) Scripting languages (Computer science)
000 00000cam c2200205 c 4500
001 000045928774
005 20180129102238
007 ta
008 180129s2018 ulkad 001c kor
020 ▼a 9791161750910 ▼g 94000
020 1 ▼a 9788960772106 (세트)
035 ▼a (KERIS)BIB000014657520
040 ▼a 211062 ▼c 211062 ▼d 211062 ▼d 211009
041 1 ▼a kor ▼h eng
082 0 4 ▼a 005.133 ▼2 23
085 ▼a 005.133 ▼2 DDCK
090 ▼a 005.133 ▼b P999 2018z1
100 1 ▼a Boschetti, Alberto
245 1 0 ▼a 파이썬으로 배우는 데이터 과학 : ▼b 파이썬의 주요 패키지부터 머신 러닝, 시각화에 이르기까지 데이터 과학의 핵심을 한번에 / ▼d 알베르토 보스체티, ▼e 루카 마싸론 지음 ; ▼e 이판호 옮김
246 1 9 ▼a Python data science essentials : ▼b become an efficient data science practitioner by understanding Python's key concepts ▼g (2nd ed.)
260 ▼a 서울 : ▼b 에이콘, ▼c 2018
300 ▼a 449 p. : ▼b 삽화, 도표 ; ▼c 24 cm
440 0 0 ▼a acorn+PACKT technical book
500 ▼a 색인수록
500 ▼a 부록: 파이썬 기초 강화하기
650 0 ▼a Python (Computer program language)
650 0 ▼a Scripting languages (Computer science)
700 1 ▼a Massaron, Luca, ▼e
700 1 ▼a 이판호, ▼e
900 1 0 ▼a 보스체티, 알베르토, ▼e
900 1 0 ▼a 마싸론, 루카, ▼e
945 ▼a KLPA

소장정보

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 005.133 P999 2018z1 등록번호 121243199 도서상태 대출가능 반납예정일 예약 서비스 B M

컨텐츠정보

책소개

파이썬의 설치부터 머신 러닝, 시각화에 이르기까지 파이썬을 사용한 데이터 과학의 핵심에 대하여 알려준다. 핵심 도구인 주피터 사용법, 넘파이(numpy), 판다스(pandas) 등 파이썬 주요 패키지를 사용한 데이터 처리, 사이킷런(scikit-learn)에 포함된 주요 머신 러닝 알고리즘의 활용, 데이터 및 분석 결과의 시각화에 대해 배울 수 있다.

파이썬의 설치부터 머신 러닝, 시각화에 이르기까지 파이썬을 사용한 데이터 과학의 핵심에 대해 쉽고 친절하게 가르쳐준다. 핵심 도구인 주피터 사용법, 넘파이(numpy), 판다스(pandas) 등 파이썬 주요 패키지를 사용한 데이터 처리, 사이킷런(scikit-learn)에 포함된 주요 머신 러닝 알고리즘의 활용, 데이터 및 분석 결과의 시각화에 대해 배울 수 있다.

★ 이 책의 대상 독자 ★

데이터 과학자가 되고자 하고, 데이터 분석과 파이썬에 대해 최소한의 실무 지식을 갖고 있다면, 이 책은 여러분이 데이터 과학을 시작하게 해줄 것이다. R이나 매트랩(MATLAB)을 사용한 데이터 분석 경험을 가진 데이터 분석가 또한 데이터 조작과 머신 러닝 기술을 키우기 위한 포괄적인 참고서로 활용할 수 있다

★ 이 책의 구성 ★

1장, '첫 단계'에서는 주피터 노트북을 소개하며 튜토리얼에서 동작되는 데이터에 어떻게 접근할 수 있는지를 보여준다.
2장, '데이터 개조'에서는 데이터 과학 파이프라인의 개요를 제공하며, 어떠한 러닝 알고리즘을 적용하든 사전에 데이터를 다루고 준비하는 데 필요한 주요 도구들을 살펴 본다. 그리고 가설 실험 스케줄을 설정한다.
3장, '데이터 파이프라인'에서는 결과를 잠재적으로 개선할 수 있거나 심지어 강화할 수도 있는 모든 작업을 다룬다.
4장, '머신 러닝'에서는 사이킷런 패키지가 제공하는 주요한 머신 러닝 알고리즘 중 선형 모형, 서포트 벡터 머신(support vector machines), 앙상블 트리, 클러스터링을 위한 비지도적인(unsupervised) 기술 등을 샅샅이 살펴본다.
5장, '소셜 네트워크 분석'에서는 예측 변수/목표 변수 플랫 행렬(predic-tors/target flat matrices)의 흥미로운 변형인 그래프를 소개한다. 이는 현재 데이터 과학에서 꽤 인기 있는 주제다. 매우 복잡하고 난해한 네트워크를 샅샅이 살펴본다.
6장, '시각화, 인사이트 그리고 결과'에서는 맷플롯립(Matplotlib)으로 하는 시각화의 기초, 판다스로 EDA를 조작하 방법, 시본과 보케(Bokeh)로 아름다운 시각화를 이뤄내는 방법 그리고 요구에 따른 정보를 제공하기 위해 어떻게 웹 서버를 설정할 수 있는지에 대해 소개한다.
부록, '파이썬 기초 강화하기'에서는 데이터 과학 프로젝트를 작업하는 데 필수적인 파이썬 언어의 주요 측면에 집중한 예제와 튜토리얼을 다룬다.


정보제공 : Aladin

저자소개

알베르토 보세티(지은이)

신호 처리와 통계 분야의 전문 지식을 갖춘 데이터 과학자로, 통신공학 박사 학위를 가지고 있다. 현재 런던에서 거주하며 일하고 있다. 자연어 처리 및 머신 러닝부터 분산 처리에 이르기까지 수많은 프로젝트에서 다양한 일상 문제에 직면하고 있다. 자신의 일에 매우 열정적이며 항상 데이터 과학 기술의 개발, 모임, 회의 및 기타 이벤트에 대해 최신 정보를 얻으려고 노력한다.

루카 마사론(지은이)

데이터 과학자이며 마케팅 연구 책임자로, 다변량 통계 분석 및 머신 러닝을 전문으로 하며, 10년 이상의 경험을 바탕으로 추론, 통계, 데이터 마이닝 및 알고리즘을 적용해 실생활 문제를 해결하고 이해관계자의 가치를 창출하는 고객 통찰력을 제공해왔다. 이탈리아에서 웹 이용자 분석의 선구자가 된 이후, 캐글러(Kaggler)의 상위 10위를 달성하는 데 이르기까지 데이터와 분석에 관한 모든 것에 항상 열성적이었으며 전문가와 비전문가 모두에게 데이터 기반 지식 검색의 잠재력을 일깨워줬다. 불필요한 정교함보다는 단순함을 선호한다. 데이터 과학에서 본질적인 것만 수행해도 많은 것을 성취할 수 있다고 믿는다.

이판호(옮긴이)

성균관대학교 통계학과를 졸업했다. 현재 싱가포르에서 구조화상품 전문 증권사의 개발자로 일하고 있다. 머신러닝과 프로그래밍을 활용한 금융 데이터 분석 및 트레이딩에 관심이 많다. 에이콘에서 펴낸 『스칼라와 머신러닝』(2018), 『Akka 쿡북』(2018), 『파이썬으로 배우는 데이터 과학 2/e』(2017), 『R 병렬 프로그래밍』(2017)을 번역했다.

정보제공 : Aladin

목차

1장. 첫 단계 

__데이터 과학과 파이썬 소개 
__파이썬 설치 
____파이썬 2 아니면 파이썬 3? 
____차례로 설치하기 
____패키지 설치 
____패키지 업그레이드 
____과학 배포판 
________아나콘다 
________콘다를 활용해 패키지 설치하기 
________엔서트캐노피 
________파이썬XY 
________윈파이썬 
____가상 환경이란? 
________콘다로 환경 관리하기 
____핵심 패키지 맛보기 
________넘파이 
________싸이파이 
________판다스 
________싸이킷런 
________주피터 
________매트플롯립 
________Statsmodels 
________Beautiful Soup 
________NetworkX 
________NLTK 
________젠심 
________PyPy 
________XGBoost 
________티아노 
________케라스 
__주피터 소개 
____빠른 설치 및 첫 테스트 
____주피터 마법 명령 
____주피터는 어떻게 데이터 과학자를 돕는가? 
____주피터의 대안 
__책에서 쓰는 데이터 세트 및 코드 
____싸이킷런 토이데이터 세트 
________MLdata.org 공공 저장소 
________LIBSVM 데이터 표본 
________CVS나 텍스트 파일에서 직접 데이터 불러오기 
________싸이킷런 샘플 생성기 
__요약 

2장. 데이터 개조 

__데이터 과학의 과정 
__데이터 불러오기와 판다스로 전처리하기 
____빠르고 쉬운 데이터 불러오기 
____문제가 있는 데이터 다루기 
____큰 데이터 다루기 
____다른 데이터 형식 접근하기 
____데이터 전처리 
____데이터 선택 
__범주형 및 텍스트 데이터 작업 
____특별한 데이터 타입 - 텍스트 
____뷰티풀수프로 웹 스크래핑하기 
__넘파이 데이터 처리 
____넘파이의 n차원 배열 
____넘파이 ndarray 객체 기초 
__넘파이 배열 만들기 
____리스트에서 1차원 배열로 
____메모리 크기 제어 
____이종적인 리스트 
____리스트에서 다차원 배열로 
____배열 크기 재설정 
____넘파이 함수로부터 만들어진 배열 
____파일에서 직접 배열 얻기 
____판다스로부터 데이터 추출 
__넘파이의 빠른 동작과 연산 
____행렬 연산 
____넘파이 배열 자르기와 색인하기 
____넘파이 배열 채우기 
__요약 

3장. 데이터 파이프라인 

__EDA 소개 
__새로운 특성 만들기 
__차원 축소 
____공분산 행렬 
____주성분 분석 
____빅데이터를 위한 PCA - 확률적 PCA 
____잠재요인분석(LFA) 
____선형판별분석(LDA) 
____잠재의미분석(LSA) 
____독립요소분석(ICA) 
____커널PCA 
____T-SNE 
____제한된 볼츠만 머신(RBM) 
__특이값 감지 및 처치 
__일변량 특이값 탐색 
____EllipticEnvelope 
____단일 클래스 SVM 
__검증 지표 
____멀티 라벨 분류 
____이진분류 
____회귀 
__테스트와 검증 
__교차 검증 
____교차 검증 반복기 사용 
____표본 추출과 부트 스트래핑 
__초매개변수 최적화 
____사용자정의 채점 함수 구축 
____격자 검색 실행시간 단축 
__특성 선택 
____특성 분산 기반 선택 
____일변량 선택 
____재귀적 제거 
____안정성과 L1 기반 선택 
__모든 것을 파이프라인으로 감싸기 
____특성을 함께 결합하고 변환을 연결하기 
____사용자정의 변환 함수 만들기 
__정리 

4장. 머신 러닝 

__도구와 데이터 세트 준비 
__선형 및 로지스틱 회귀 
__단순베이즈 
__K유사 이웃 
__비선형 알고리즘 
____분류를 위한 SVM 
____회귀를 위한 SVM 
____SVM 튜닝 
__앙상블 전략 
____무작위 표본으로 붙이기 
____느슨한 분류기로 담기 
____무작위 하위 공간과 무작위 덧대기 
____랜덤 포레스트와 엑스트라 트리 
____앙상블로부터 확률 추정 
____연속적인 모형 - AdaBoost 
____기울기 나무 강화 
____XGBoost 
__빅데이터 다루기 
____빅터이터 세트 예제 만들기 
____용량 확장성 
____속도 올리기 
____다양성 다루기 
____확률적 기울기 하강에 대한 개요 
__딥러닝 만나기 
__자연어 처리 엿보기(NLP) 
단어 토큰화 
스테밍 
단어 태깅 
개체명 인식 
불용어 
완전한 데이터 과학 예제 - 텍스트 분류 
__비지도학습 개요 
__요약 

5장. 소셜 네트워크 분석 

__그래프 이론 소개 
__그래프 알고리즘 
__그래프 읽기, 덤프하기, 추출하기 
__요약 

6장. 시각화, 통찰, 결과 

__매트플롯립 기초 소개 
____곡선 그리기 
____패널 사용 
____데이터의 관계를 위한 산포도 
____히스토그램 
____막대그래프 
____이미지 시각화 
____판다스로 하는 그래픽적 선택 예제 
________박스플롯과 히스토그램 
____산포도 
____평행 좌표 
__매트플롯립 명령 래핑하기 
____시본 소개 
____EDA 능력 강화 
__보케로 양방향적 시각화하기 
__더 나은 데이터학습 표현 
____학습 곡선 
____검증 곡선 
____랜덤 포레스트를 위한 특성의 중요성 
____GBT 부분 의존성 도표 
____ML-ASS를 위한 예측 서버 만들기 
__요약 

부록. 파이썬 기초 강화하기 
__학습 리스트 
____리스트 
____딕셔너리 
____함수 정의 
____클래스, 객체, OOP 
____예외 
____이터레이터와 제너레이터 
____조건문 
____리스트와 딕셔너리 내포 
__보고, 읽고, 해보며 배우기 
____무크 
____파이콘과 파이데이터 
____양방향적 주피터 
____부끄러워 마라, 진정으로 도전하라

관련분야 신착자료