HOME > 상세정보

상세정보

파이썬을 활용한 데이터 분석과 응용

파이썬을 활용한 데이터 분석과 응용 (3회 대출)

자료유형
단행본
개인저자
이성건, 李聖鍵, 1972- 강현철, 姜賢哲, 1967-
서명 / 저자사항
파이썬을 활용한 데이터 분석과 응용 = Data analysis and application using Python / 이성건, 강현철 지음
발행사항
파주 :   자유아카데미,   2021  
형태사항
vii, 385 p. : 삽화(일부천연색), 도표 ; 26 cm
ISBN
9791158083083
일반주기
부록: 통계분포표  
색인수록  
000 00000nam c2200205 c 4500
001 000046082595
005 20210614164402
007 ta
008 210611s2021 ggkad 001c kor
020 ▼a 9791158083083 ▼g 93310
040 ▼a 211009 ▼c 211009 ▼d 211009
082 0 4 ▼a 519.502855133 ▼2 23
085 ▼a 519.50285 ▼2 DDCK
090 ▼a 519.50285 ▼b 2021z7
100 1 ▼a 이성건, ▼g 李聖鍵, ▼d 1972- ▼0 AUTH(211009)125686
245 1 0 ▼a 파이썬을 활용한 데이터 분석과 응용 = ▼x Data analysis and application using Python / ▼d 이성건, ▼e 강현철 지음
260 ▼a 파주 : ▼b 자유아카데미, ▼c 2021
300 ▼a vii, 385 p. : ▼b 삽화(일부천연색), 도표 ; ▼c 26 cm
500 ▼a 부록: 통계분포표
500 ▼a 색인수록
700 1 ▼a 강현철, ▼g 姜賢哲, ▼d 1967- ▼0 AUTH(211009)134472
945 ▼a KLPA

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 519.50285 2021z7 등록번호 121257461 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 2 소장처 세종학술정보원/과학기술실/ 청구기호 519.50285 2021z7 등록번호 151356259 도서상태 대출가능 반납예정일 예약 서비스 M
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 519.50285 2021z7 등록번호 121257461 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 세종학술정보원/과학기술실/ 청구기호 519.50285 2021z7 등록번호 151356259 도서상태 대출가능 반납예정일 예약 서비스 M

컨텐츠정보

책소개

파이썬을 이용하여 통계적 데이터 분석을 수행하고자 하는 다양한 분야의 독자들을 위한 압문서이다. 특히 통계분석의 기본 이론을 빠트리지 않고 서술하려고 노력하였으며, 실제적인 예제들에 대한 파이썬의 처리 과정을 쉽고 간단하게 설명하고 있다. 또한, 다양한 형태의 문제를 해결하기 위해서 필요한 몇 가지 고급기법들도 다루고 있기 때문에, 파이썬을 이용해 본 경험이 있는 독자들에게도 잘 몰랐던 부분을 새롭게 배우거나 쉽게 참조할 수 있는 참고서로써 유용하게 사용될 수 있을 것이다.

최근 여러 분야에서 큰 관심을 받고 있는 파이썬(Python)은 C와 JAVA 같은 시스템 프로그래밍뿐만 아니라 기계학습 및 인공지능 분야의 데이터 또한 쉽게 처리할 수 있는 컴퓨팅 언어이다. 또한 pandas, SciPy, statsmodels 등의 패키지를 이용하면 통계적 데이터 분석에도 쉽게 사용할 수 있다. SAS, SPSS, Statistica, Minitab, S-plus 등 수많은 소프트웨어들이 개발되어 있지만, 파이썬은 무료로 다운로드 받아 사용할 수 있고 단순한 기술통계의 계산으로부터 복잡한 통계분석에 이르기까지 편리하게 처리할 수 있다는 장점 때문에, 최근 통계학뿐만 아니라 자연과학, 전산학, 공학, 사회학분야의 많은 연구자들이 널리 사용하고 있다.
이 책은 파이썬을 이용하여 통계적 데이터 분석을 수행하고자 하는 다양한 분야의 독자들을 위한 압문서이다. 특히 통계분석의 기본 이론을 빠트리지 않고 서술하려고 노력하였으며, 실제적인 예제들에 대한 파이썬의 처리 과정을 쉽고 간단하게 설명하고 있다. 또한, 다양한 형태의 문제를 해결하기 위해서 필요한 몇 가지 고급기법들도 다루고 있기 때문에, 파이썬을 이용해 본 경험이 있는 독자들에게도 잘 몰랐던 부분을 새롭게 배우거나 쉽게 참조할 수 있는 참고서로써 유용하게 사용될 수 있을 것이다.
실제 데이터 분석은 일반적으로 특정 데이터 처리 및 분석기법의 일부만을 이용하여 수행되는 경우가 많으므로, 먼저 이 책의 범위 내에서 필요한 기본개념 및 구조를 이해한 후 실제 작업의 필요에 따라 점차 기법 이용의 범위를 확충시켜 나가는 것이 바람직하다. 따라서 통계적 이론이나 파이썬의 사용법에 초보적인 독자들은 먼저 각 장의 예제들을 중심으로 해당 분석기법의 상황 및 처리 과정을 개괄적으로 이해한 후, 이에 필요한 통계적 이론을 충분히 숙지하는 것이 좋을 것으로 생각된다.
이 책은 총 12개의 장으로 구성되어 있다. 1장에서는 파이썬의 기본적인 사용법을 간단히 설명하였고, 2장에서는 데이터셋을 생성하고 관리하는 작업에 대하여 간단히 설명하였다. 3장에서는 데이터의 탐색적 단계로서 실제 데이터에 대한 정리 · 요약 및 그래프적 표현 등에 관한 내용을 자세히 서술하였다. 4장과 5장에서는 통계적 추론에 기본이 되는 확률의 기본개념, 중요한 확률분포 및 표본분포, 통계적 추론의 핵심인 추정과 검정의 문제를 소개하고, 이와 관련된 내용을 실습을 통해 직접 확인해 볼 수 있도록 구성하였다. 6장부터 11장까지는 실제 데이터 분석에서 활용도가 높은 t-검정, 상관분석, 범주형 자료분석, 회귀분석, 분산분석, 비모수적 분석 등의 기본적 내용을 실제 사례를 이용하여 현실감 있게 다루고 있다. 12장에서는 통계적 데이터 분석의 시각에서 데이터사이언스와 기계학습의 개념에 대해서 간단히 소개하였으며, 실제 데이터를 이용하여 데이터사이언스의 과정을 개략적으로 설명하였다.
이 책을 보다 재미있게 학습하기 위해서는 각 장에 나와 있는 실제 사례의 분석과정을 반드시 따라해 보면서 자신감을 갖는 것이 중요하다. 그러면 각 분야에서 자주 접할 수 있는 데이터들에 대해서는 제법 우수한 통계분석 실무능력을 가지게 될 것이다. 독자들의 학습을 위해 본문과 연습문제에서 사용된 데이터들을 출판사의 홈페이지를 통해서 제공하고 있으며(http://www.freeaca.com), 이 책을 가지고 강의하시는 분들을 위해 별도로 강의자료를 제공하고 있다(출판사에 문의 바람).
이 책이 파이썬을 이용하여 실제 데이터를 분석하고자 하는 다양한 분야의 연구자들에게 유용하게 사용되기를 바란다.


정보제공 : Aladin

목차

제1장 파이썬의 기본 사용법
1.1 파이썬(Python)의 소개
1.2 파이썬 설치와 실행
1.3 파이썬 프로그래밍 - Spyder
1.4 파이썬 프로그래밍 - 주피터 노트북
1.5 파이썬 프로그래밍 - Google COLAB
1.6 모률, 라이브러리, 패키지
1.7 판다스 라이브러리
1.8 연습문제

제2장 데이터 프레임
2.1 데이터 프레임의 생성
2.2 데이터 프레임에 함수 적용하기
2.3 데이터 프레임의 가공
2.4 도움말(help) 기능
2.5 연습문제

제3장 데이터의 요약 빛 표현
3.1 자료의 형태
3.2 모수와 통계량
3.3 기술통계량
3.4 그래프를 이용한 양적 데이터의 요약
3.5 질적 데이터의 요약
3.6 그래프를 이용한 질적 데이터의 요약
3.7 이 장에서 사용된 주요 함수들
3.8 연습문제

제4장 확률변수와 분포함수
4.1 확률변수와 확률분포
4.2 기댓값과 분산
4.3 이산형 확률분포
4.4 연속형 확률분포
4.5 표본분포
4.6 연습문제

제5장 통계적 추정과 검정
5.1 통계적 추정
5.2 통계적 가설검정
5.3 단일 모집단에 대한 검정
5.4 이 장에서 사용된 주요 함수들
5.5 연습문제

제6장 두 모집단에 대한 비교
6.1 독립표본에 의한 두 모평균의 비교: 독립표본 t-검정
6.2 대응표본에 의한 두 모평균의 비교: 대응표본 t-검정
6.3 독립표본에 의한 두 모비율의 비교
6.4 대응표본에 의한 두 모비율의 비교 - 맥니머 검정
6.5 모분산의 동일성에 대한 검정
6.6 이 장에서 사용된 주요 함수들
6.7 연습문제

제7장 상관분석
7.1 상관계수의 개념
7.2 상관계수의 추정과 검정
7.3 편상관계수
7.4 측정도구의 신뢰도 분석
7.5 이 장에서 사용된 주요 함수들
7.6 연습문제

제8장 질적변수들의 연관성
8.1 다항분포
8.2 교차분석 - 카이제곱검정
8.3 카이제곱 적합도 검정
8.4 오즈비
8.5 연관성의 측도
8.6 이 장에서 사용된 주요 함수들
8.7 연습문제

제9장 회귀분석
9.1 단순 회귀분석
9.2 잔차분석
9.3 다중 회귀분석
9.4 변수선택
9.5 다중공선성
9.6 가변수 - 질적 설명변수의 처리
9.7 변수변환과 비선형 회귀분석
9.8 이 장에서 사용된 주요 함수들
9.A 부록: 변수선택을 위한 사용자 정의 함수 작성
9.9 연습문제

제10장 분산분석
10.1 실험연구의 제 개념
10.2 일원분류 분산분석
10.3 이원분류 분산분석 - 반복이 없는 경우
10.4 이원분류 분산분석 - 반복이 있는 경우
10.5 공분산분석
10.6 이 장에서 사용된 주요 함수들
10.7 연습문제

제11장 비모수적 검정
11.1 정규성에 대한 검토
11.2 단일 모집단에 대한 검정
11.3 두 모집단에 대한 검정
11.4 독립 k-표본에 대한 검정
11.5 이 장에서 사용된 주요 함수들
11.6 연습문제

제12장 통계분석을 넘어 - 데이터사이언스
12.1 데이터사이언스
12.2 기계학습
12.3 데이터사이언스 사례
12.4 연습문제

▶통계분포표
▶용어 찾아보기

관련분야 신착자료

Bertsimas, Dimitris (2022)
Doane, David P (2022)