
000 | 00000cam c2200205 c 4500 | |
001 | 000045934794 | |
005 | 20201202111711 | |
007 | ta | |
008 | 180313s2018 ulka b 001c kor | |
020 | ▼a 9791161751078 ▼g 94000 | |
020 | 1 | ▼a 9788960772106 (세트) |
035 | ▼a (KERIS)BIB000014710251 | |
040 | ▼a 244008 ▼c 244008 ▼d 244008 ▼d 241050 ▼d 211009 | |
082 | 0 4 | ▼a 005.133 ▼2 23 |
085 | ▼a 005.133 ▼2 DDCK | |
090 | ▼a 005.133 ▼b P999 2018z31 | |
100 | 1 | ▼a Fandango, Armando |
245 | 1 0 | ▼a 파이썬을 이용한 데이터 분석 : ▼b 다양한 파이썬 라이브러리와 소프트웨어를 활용한 데이터 사이언스의 이해 / ▼d 아르만도 판당고 지음 ; ▼e 이창화 옮김 |
246 | 1 9 | ▼a Python data analysis ▼g (2nd ed.) |
260 | ▼a 서울 : ▼b 에이콘, ▼c 2018 | |
300 | ▼a 398 p. : ▼b 삽화 ; ▼c 24 cm | |
440 | 0 0 | ▼a acorn+PACKT technical book |
500 | ▼a 감수: 조란 비슬리, 라탄 쿠마르 | |
500 | ▼a 부록: A. 핵심 개념들, B. 유용한 함수들 | |
504 | ▼a 참고문헌(p. 389-391)과 색인수록 | |
700 | 1 | ▼a 이창화, ▼e 역 |
900 | 1 0 | ▼a 판당고, 아르만도, ▼e 저 |
소장정보
No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
---|---|---|---|---|---|---|---|
No. 1 | 소장처 과학도서관/Sci-Info(1층서고)/ | 청구기호 005.133 P999 2018z31 | 등록번호 121255402 | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
No. 2 | 소장처 세종학술정보원/과학기술실(5층)/ | 청구기호 005.133 P999 2018z31 | 등록번호 151340383 | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
---|---|---|---|---|---|---|---|
No. 1 | 소장처 과학도서관/Sci-Info(1층서고)/ | 청구기호 005.133 P999 2018z31 | 등록번호 121255402 | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
---|---|---|---|---|---|---|---|
No. 1 | 소장처 세종학술정보원/과학기술실(5층)/ | 청구기호 005.133 P999 2018z31 | 등록번호 151340383 | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
컨텐츠정보
책소개
NumPy, SciPy, Pandas, matplotlib, scikit-learn 등의 라이브러리를 이용해 IPython 및 Jupyter-notebook 기반의 파이썬 환경에서 작업을 하게 된다. 선형 대수, 데이터 시각화, 시계열 데이터, 데이터베이스와 같은 기본 개념을 살펴보며, 나아가 감성 분석, 예측 분석, 코드의 성능 개선에 대해서도 배운다. 수학 개념을 끌어와 다양한 분야에 적용해보며, 기본 개념부터 예제 응용, 고급 내용에 관한 데이터 과학을 공부할 수 있다.
NumPy, SciPy, Pandas, matplotlib, scikit-learn 등의 라이브러리를 이용해 IPython 및 Jupyter-notebook 기반의 파이썬 환경에서 작업을 하게 된다. 선형 대수, 데이터 시각화, 시계열 데이터, 데이터베이스와 같은 기본 개념을 살펴보며, 나아가 감성 분석, 예측 분석, 코드의 성능 개선에 대해서도 배운다. 수학 개념을 끌어와 다양한 분야에 적용해보며, 기본 개념부터 예제 응용, 고급 내용에 관한 데이터 과학을 공부할 수 있다.
★ 이 책에서 다루는 내용 ★
■ NumPy, SciPy, Pandas, statsmodels, scikit-learn, 떼아노(theano), 케라스(keras), 텐서플로와 같은 오픈소스 파이썬 모듈의 설치
■ 데이터의 준비 및 정제와 탐구 분석을 위한 데이터 활용
■ Pandas로 데이터 다루기
■ RDBMS, NoSQL, 분산 시스템(HDFS, HDF5 등)을 위한 데이터의 검색 및 저장
■ matplotlib, bokeh, plotly와 같은 오픈소스 라이브러리를 이용한 데이터 시각화
■ 지도, 비지도, 확률론적(probabilistic), 베이지안 등의 다양한 머신 러닝 기법 학습
■ 신호 처리와 시계열 데이터 분석의 이해
■ 그래프 처리 및 소셜 미디어 분석
★ 이 책의 대상 독자 ★
이 책은 기본적인 파이썬 지식을 갖췄으며, 파이썬 라이브러리를 이용한 데이터 분석을 배우고자 하는 수학자를 위해 쓰였다. 가능한 한 그 내용을 간단히 다루고자 노력했지만, 모든 주제를 자세히 기술하지 못했다. 수학에 관한 기본적인 내용은 칸 아카데미(Khan Academy)와 코세라(Coursera) 등의 온라인 플랫폼을 이용해 살펴보는 것도 좋을 듯하다.
★ 이 책의 구성 ★
1장. '파이썬 라이브러리로 시작하기'에서는 파이썬과 기본적인 파이썬 데이터 분석 라이브러리를 설치한다. NumPy를 사용해 간단한 애플리케이션을 작성하고 matplolib를 통해 기본적인 그래프를 그려본다.
2장. 'NumPy 배열 다루기'에서는 NumPy와 기본적인 배열을 소개한다. 끝부분에서는 NumPy 배열의 기본을 이해하고 관련된 함수를 살펴본다.
3장. 'Pandas 입문'에서는 Pandas 함수성, 자료 구조, 연산자에 대해 배운다.
4장. '통계학 및 선형 대수'에서는 선형 대수와 통계 함수를 간단히 살펴본다.
5장. '데이터의 검색, 처리, 저장'에서는 다양한 형식 파일에서 데이터를 얻는 방법과 원시 데이터를 정리하고 저장하는 방법을 배운다.
6장. '데이터 시각화'에서는 matplolib와 Pandas 플로팅(plotting) 함수를 사용해 데이터를 그래프화하는 방법을 소개한다.
7장. '신호 처리와 시계열'에서는 흑점 주기 데이터를 사용하는 시계열 및 신호 처리 예제를 살펴본다. 이 예제는 statsmodels와 함께 NumPy/SciPy를 사용한다.
8장. '데이터베이스로 작업하기'에서는 여러 데이터베이스(관계형 및 NoSQL)와 관련 API에 대해 배운다.
9장. '문자 데이터와 소셜 미디어 분석하기'에서는 감성 분석과 주제 인지를 위해 문자를 분석해본다. 주어진 네트워크 분석 예제 또한 살펴본다.
10장. '예측 분석과 머신 러닝'에서는 scikit-learn 라이브러리를 이용해 주어진 예제에서 날씨를 예측하는 인공지능에 대해 알아본다. scikit-learn 라이브러리에서 다루지 않은 알고리즘에 사용되는 다른 API도 사용해본다.
11장. '파이썬 외의 서비스 환경과 클라우드 컴퓨팅'에서는 파이썬으로 작성되지 않은 코드를 통합해 실행하는 방법을 배운다. 클라우드에서 파이썬을 사용하는 부분도 다룬다.
12장. '성능 튜닝, 프로파일링, 그리고 병렬 제어'에서는 키 기술을 통한 프로파일링과 Cython을 이용해 성능을 높여본다. 분산 시스템과 다중 코어에 적합한 프레임워크도 다룬다.
정보제공 :

저자소개
아르만도 판당고(지은이)
에픽 엔지니어링 및 컨설팅 그룹(Epic Engineering and Consulting Group)의 최고 데이터 과학자(CDS, Chief Data Scientist)며, 국방 및 정부 관련 업체의 프로젝트를 진행하고 있다. 자신만의 기술로 스타트업과 글로벌 회사의 임원까지 역임한 기술자로서 핀테크(FinTech), 증권 거래, 금융, 바이오 정보공학, 유전공학, 애드테크(AdTech), 인프라, 교통, 에너지, 인적 자원, 엔터테인먼트 분야에서 활동했다. 10년 동안 예측 분석, 데이터 과학, 머신 러닝, 빅데이터, 생산공학, 고성능 컴퓨팅, 클라우드 인프라 등과 관련된 프로젝트에 참가했다. 현재 머신 러닝, 딥러닝, 과학 연산 영역으로까지 연구 주제가 확장됐다.
이창화(옮긴이)
경북대학교에서 기계공학 및 컴퓨터공학을 전공하고 있으며, 여러 방면의 공학 기술과 학문 자체에 관심이 많다. 대학 입학 전 프로그래밍에 관심을 갖기 시작한 후 C, 파이썬, 웹 언어, 하드웨어 제어를 개발하게 됐다. 최근에는 머신러닝, 딥러닝, 컴퓨터 비전을 공부 중이며, 관련 책과 강의를 듣는 것을 즐긴다. 회사에 연연하지 않고 원하는 일과 연구에 몰입할 수 있는 라이프를 추구한다. 머릿속이 복잡할 때면 수영을 하며 시간을 보내고, 조용한 카페에서 주로 작업한다. 옮긴 책으로 『파이썬을 이용한 데이터 분석 2/e』(에이콘, 2018), 『파이썬 동시성 프로그래밍』(에이콘, 2018)이 있다.

목차
"1장. 파이썬 라이브러리로 시작하기 __파이썬 3 설치하기 ____데이터 분석 라이브러리 설치하기 ____리눅스와 맥 OS X ____윈도우 __셸에서 IPython 사용하기 __매뉴얼 읽어보기 __Jupyter Notebook __NumPy 배열 __간단한 예제 __도움말 및 참조하기 __파이썬 라이브러리의 모듈 나열하기 __matplotlib로 데이터 시각화하기 __요약 2장. NumPy 배열 다루기 __NumPy 배열 객체 ____NumPy 배열의 장점 __다차원 배열 생성 __NumPy 배열 원소 추출하기 __NumPy 숫자형 ____자료형 객체 ____문자 코드 ____dtype 생성자 ____dtype 어트리뷰트 __일차원 슬라이싱 및 인덱싱 __배열 형상 다루기 ____배열 합치기 ____NumPy 배열 쪼개기 ____NumPy 배열 어트리뷰트 ____배열 변환하기 __배열 뷰를 생성하고 복사하기 __고급 인덱싱 __위치 데이터로 인덱싱하기 __논리형 방식으로 인덱싱하기 __브로드캐스팅 __요약 __참고 자료 3장. Pandas 입문 __Pandas 설치와 둘러보기 __Pandas 데이터프레임 __Pandas 시리즈 __Pandas의 데이터 검색 __Pandas 데이터프레임과 통계학 __Padas 데이터프레임과 데이터 수집 __데이터프레임 연쇄와 추가 __데이터프레임 조인 __누락된 데이터 다루기 __날짜 다루기 __피벗 테이블 __요약 __참고 자료 4장. 통계학및 선형 대수 __NumPy와 기본적인 통계학 __NumPy와 선형 대수학 ____NumPy와 역행렬 ____NumPy로 선형 시스템 해석하기 __NumPy와 고유 값 및 고유 벡터 __NumPy와 난수 ____갬블링과 이항 분포 ____정규 분포 샘플링 ____SciPy와 정규성 검정 __NumPy와 마스킹된 배열 ____음수및 극단적인 값들의 제거 __요약 5장. 데이터 검색과 처리, 저장 __NumPy와 Pandas로 CSV 파일 쓰기 .npy와 피클 포맷 __PyTables와 데이터 저장 __HDF5 형태로 Pandas 데이터프레임 읽기 및 쓰기 __Pandas로 엑셀 파일 읽기 및 쓰기 __REST 웹 서비스 및 JSON __Pandas와 JSON 읽기 및 쓰기 __RSS 및 Atom 피드 파싱 __Beautiful Soup를 활용한 HTML 파싱 __요약 __참고 자료 6장. 데이터 시각화 __matplotlib 패키지 __기본적인 matplotlib 플롯 __로그 플롯 __분산 플롯 __범례 및 주석 3차원 플롯 __Pandas와 플로팅 __지연 플롯 __자기 상관 플롯 __Plot.ly __요약 7장. 신호 처리와 시계열 __statsmodels 모듈 __이동 평균법 __윈도우 함수 __공적분 __자기 상관 __자기 회귀 모델 __ARMA 모델 __주기적인 신호 발생하기 __푸리에 분석 __스펙트럼 분석 __필터링 __요약 8장. 데이터베이스로 작업하기 __sqlite3의 개요 __Pandas로 데이터베이스 접근하기 __SQLAlchemy ____SQLAlchemy 설치하고 구성하기 ____SQLAlchemy로 데이터베이스 추가하기 ____SQLAlchemy로 데이터베이스 쿼리하기 __Pony ORM __Dataset: 사용하기 쉬운 데이터베이스 __PyMongo와 MongoDB __Redis에 데이터 저장하기 __memcache에 데이터 저장하기 __Apache Cassandra __요약 9장. 문자 데이터와 소셜 미디어 분석하기 __NLTK 설치 __NLTK란? __불용어, 고유 명사, 숫자 걸러내기 __단어 주머니 모델 __단어 빈도수 분석 __나이브 베이즈 분류기 __감성 분석 __워드 클라우드 만들기 __소셜 미디어 분석 __요약 10장. 예측 분석과 머신 러닝 __전처리 __로지스틱 회귀 분석을 이용한 분류 __서포트 벡터 머신을 이용한 분류 __ElasticNetCV를 이용한 회귀 분석 __서포트 벡터 회귀 분석 __친근도 전파를 이용한 클러스터링 __평균 이동 __유전자 알고리즘 __신경망 __결정 트리 __요약 11장. 파이썬 외의 서비스 환경과 클라우드 컴퓨팅 __Matlab/Octave로 정보 주고받기 __rpy2 패키지 설치 R 언어 인터페이스 __자바로 NumPy 배열 넘겨주기 __SWIG와 NumPy 통합하기 __Boost와 파이썬 통합하기 __F2py로 포트란 코드 사용하기 __PythonAnywhere 클라우드 __요약 12장. 성능 튜닝, 프로파일링, 그리고 병렬 제어 __코드 프로파일링 __Cython 설치하기 C 코드 호출하기 __다중 처리로 풀 작업 생성하기 __Joblib에서 병렬 for 반복문을 사용해 속도 높이기 __Bottleneck과 NumPy 함수 비교하기 __Jug로 맵리듀스 실행하기 __파이썬에서 MPI 설치하기 __병렬 IPython __요약"