HOME > 상세정보

상세정보

(파이썬으로 시작하는) 데이터 분석 : 데이터 분석을 위한 Python 문법부터 데이터 수집, 전처리, 탐색까지 (2회 대출)

자료유형
단행본
개인저자
강지영
서명 / 저자사항
(파이썬으로 시작하는) 데이터 분석 : 데이터 분석을 위한 Python 문법부터 데이터 수집, 전처리, 탐색까지 / 강지영 지음
발행사항
서울 :   아이리포,   2021  
형태사항
xii, 351 p. : 삽화, 도표 ; 26 cm
총서사항
Runner's high
ISBN
9791197347023
일반주기
부록: 데이터 분석 로드맵  
색인수록  
000 00000nam c2200205 c 4500
001 000046088007
005 20210802101811
007 ta
008 210730s2021 ulkad 001c kor
020 ▼a 9791197347023 ▼g 94560
040 ▼a 211009 ▼c 211009 ▼d 211009
082 0 4 ▼a 005.133 ▼2 23
085 ▼a 005.133 ▼2 DDCK
090 ▼a 005.133 ▼b P999 2021z18
100 1 ▼a 강지영
245 2 0 ▼a (파이썬으로 시작하는) 데이터 분석 : ▼b 데이터 분석을 위한 Python 문법부터 데이터 수집, 전처리, 탐색까지 / ▼d 강지영 지음
260 ▼a 서울 : ▼b 아이리포, ▼c 2021
300 ▼a xii, 351 p. : ▼b 삽화, 도표 ; ▼c 26 cm
490 1 0 ▼a Runner's high
500 ▼a 부록: 데이터 분석 로드맵
500 ▼a 색인수록
830 0 ▼a Runner's high
945 ▼a KLPA

소장정보

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 005.133 P999 2021z18 등록번호 121257826 도서상태 대출중 반납예정일 2021-10-05 예약 예약가능(2명 예약중) R 서비스 M

컨텐츠정보

책소개

탐색적 데이터 분석을 위한 '파이썬 프로그래밍 입문서'다. 이 책은 처음 데이터 분석에 입문하는 독자가 최대한 빠르게 시작할 수 있도록 기본을 알려주는 것을 목표로 한다. 그래서 이 책에서는 파이썬에서 제공하는 수많은 기능 중 데이터 분석에 자주 사용하는 핵심 기능을 다루고 있다.

정확하게는 본격적인 데이터 분석을 진행하기에 앞서 데이터를 수집, 탐색하고 정제하는 '탐색적 데이터 분석' 과정에 대해서 설명한다. 그리고 실생활에 사용할 수 있는 실습 예제를 해결하면서 탐색적 데이터 분석의 전반적인 과정을 이해할 수 있도록 구성했다.

어떤 독자를 위한 책인가?
- (빅)데이터 분석 입문자(이제 막 파이썬 입문서를 떼고, 기초적인 파이썬을 문법을 익혔고, 그 다음 학습 과정을 데이터 분석으로 잡은 독자)
- (빅)데이터 분석 입문자(처음 파이썬을 배우는 파이썬 입문자)

[우대경력]

* 데이터 마이닝, 머신러닝, 딥러닝 경험
* 빅데이터 분석 플랫폼 운영 경험
* 정형/비정형 데이터 수집 기술 경험
* 데이터 분석 업무 경험

요즘 기업 채용공고에서 흔히 볼 수 있는 문구입니다. 불과 몇 년 전 만해도 소수 전문가의 영역이라고 생각했던 데이터 분석 기술이 이제는 교양필수 과목처럼 알아두면 여기저기 쓸모 있는, 제법 대중화된 기술이 되었습니다. 데이터 분석은 마케팅을 하는 A, 영업을 하는 B, 자동차를 만드는 C, 쇼핑몰을 운영하는 D 등 남녀노소, 직업을 막론하고 누구에게나 필요한 기술입니다.

[공공 빅데이터 분석 청년인재 양성 데이터 전문 교육 과정] 공식 교재!
행정안전부 주최, 한국지능정보사회진흥원 주관, CSLEE 컨소시엄에서 시행한 ICT 분야 청년 일자리 사업, [공공 빅데이터 분석 청년인재 양성 데이터 전문 교육 과정] 교재입니다. 이 책으로 데이터 분석가(Data Scientist)의 꿈을 이루세요.

일러두기

1. 이 책은 탐색적 데이터 분석을 위한 '파이썬 프로그래밍 입문서' 입니다.

시중에는 이미 파이썬 기본에 대해 설명해주는 책, 데이터 분석 이론을 다룬 책이 많이 출간되어 있습니다. 대부분의 서적은 파이썬에서 제공하는 많은 내용에 대해 상세하게 설명해주고 있어서 깊이 있게 내용을 학습하기에는 좋습니다. 그러나, 데이터 분석 과정을 빠르게 살펴보기 위해서는 그만큼 시간 투자가 필요합니다. 그래서 이 책을 준비했습니다. 이 책은 파이썬에서 제공하는 수많은 기능 중 데이터 분석에 자주 사용하는 핵심 기능을 다루고 있습니다. 정확하게는 본격적인 데이터 분석을 진행하기에 앞서 데이터를 수집, 탐색하고 정제하는 '탐색적 데이터 분석' 과정에 대해서 설명합니다. 그리고 다양한 실습 예제를 해결하면서 탐색적 데이터 분석의 전반적인 과정을 이해할 수 있도록 구성했습니다.

2. 이 책은 파이썬으로 데이터 분석을 시작하려고 하는 독자에게 최적화되었습니다.
이제 막 파이썬 입문서를 떼고, 기초적인 파이썬 문법을 익혔고, 그 다음 학습 과정을 데이터 분석으로 잡은 독자에게 이 책은 최적화되었습니다. 이 책은 여러분이 지금까지 배웠던 기초 파이썬을 데이터 분석에 빠르게 활용할 수 있게끔 안내합니다. 그렇기 때문에 데이터 분석의 깊이 있는 수치 알고리즘, 성능을 고려한 빅데이터 처리 알고리즘, 고급 pandas 문법 등을 학습(고급 활용)하려는 독자에게는 다소 적합하지 않습니다.

3. 프로그래밍이 처음이라면 책의 순서대로 읽는 것을 권장합니다.
이 책은 파이썬 기본 문법(2장), 데이터 분석을 위한 전처리(3장: numpy, pandas), 데이터 탐색을 위한 시각화(4장: seaborn, matplotlib), 데이터 수집을 위한 크롤링(5장: requests, beautifulsoup, selenium)을 순차척으로 설명합니다. 각 장은 이전 장의 내용을 이해했다는 것을 전제로 구성했기 때문에, 프로그래밍이 처음이라면 책의 순서대로 읽는 것이 이해하기 수월합니다.

Chapter 1
: 개발 환경을 설치합니다.
Chapter 2
: 파이썬 기본 문법을 배웁니다. 영어에 빗대어 설명하자면 2장에서는 문장의 5형식에 해당하는 기본 표현을 배우는 것에 해당합니다.
Chapter 3
: 기존에 저장된 데이터를 불러와서 수정하는 다양한 방법, 데이터 분석을 위한 전처리를 배웁니다
Chapter 4
: 다양한 그래프를 그려서 데이터의 분포와 경향을 쉽게 확인하기 위한 시각화 방법을 배웁니다.
Chapter 5
: 웹에 있는 html 문서를 크롤링하여 데이터를 수집하는 방법을 배웁니다.
부록
: 데이터 분석가로서, 인공지능 개발자로서, 딥러닝 개발자로서 한 발 더 나아가기 위한 가이드를 알려드리고, 저자가 학생들을 멘토링하면서 자주 질문받았던 내용을 FAQ로 정리해서 소개합니다.

4. 파이썬이 처음이 아니라면 3장부터 읽어도 좋습니다.
웹 프로그래밍이나 다른 목적으로 파이썬을 사용한 경험이 있다면 파이썬 기본 문법을 다룬 2장은 빠르게 넘겨도 좋습니다. 한편, 파이썬이 아닌 다른 프로그래밍 언어의 경험만 있는 경우라면 2장도 훑어보는 것을 권장합니다. 파이썬은 기존 프로그래밍 언어를 쉽고 간결하게 만드는 것을 목적으로 만들었기 때문에 Java나 C 언어와 같이 전통적으로 많이 사용하는 프로그래밍 언어가 익숙한 사용자는 오히려 간결한 파이썬 문법이 어색하게 느껴질 수 있습니다. 아무리 토종 한국인이라도 케바케, 따아, 답정너…같은 줄임말을 처음 보면 어색한 것처럼요. 그러니 파이썬이 다른 언어의 문법과 어떻게 다른 지는 확인해야 합니다.

5. 실습 문제는 꼭 스스로 해결해보세요.
프로그래밍 언어는 그야말로 컴퓨터와 사람이 의사소통하는 수단일 뿐, 정말 필요한 것은 문제 해결을 위해 로직을 만들어내는 것입니다. 이 책은 이론에 대한 설명은 최대한 간결하게 줄이고, 실습을 통해서 문법을 활용하도록 구성하였습니다. 처음이기 때문에 어렵고 낯선 것은 당연합니다. 그렇지만 책에서 제공하는 솔루션을 보기 전에 꼭 어떻게 로직을 구성할지 생각해보고 코드를 작성해본다면, 훨씬 더 빠르게 실력이 쌓일 것입니다.


정보제공 : Aladin

저자소개

강지영(지은이)

정보관리기술사, 정보시스템 수석감리원 휴대폰 소프트웨어 개발을 시작으로 IT 분야에 입문했다. 새로운 기술에 대해 호기심이 많은데 직접 뜯어보고 다뤄보지 않으면 잘 이해를 못하는 부류라 매우 피곤하게 살고 있다. 요새는 대학생, 취준생 그리고 비전공자를 대상으로 IT 기술 멘토링을 할 때 가장 보람을 느낀다. 주로 머신러닝, 딥러닝, 자연어 처리, 모바일 앱, 라즈베리파이 관련 프로젝트에 대해 이야기를 나눈다.

정보제공 : Aladin

목차

1장. 파이썬 시작하기
__1-1 파이썬으로 무엇을 할 수 있나요?
____1.1.1 왜 파이썬으로 데이터 분석을 시작하는 것이 좋을까요?
____1.1.2 파이썬, 어떤 특징이 있나요?
____1-1-3. 파이썬으로 무엇을 할 수 있나요?
____1-1-4. 이 책을 학습하면 무엇을 할 수 있나요?
__1-2 개발 환경 구축
____1.2.1 아나콘다가 뭐예요?
____1-2-2. 아나콘다 설치파일 내려받기
____1-2-3. 아나콘다 설치하기
__1-3 주피터 노트북
____1-3-1. Hello Python
____1-3-2. 주피터 노트북의 특징
____1-3-3. 주피터 노트북 주요 기능
____1-3-4. 주피터 노트북 사용하기

2장. 파이썬 기본 문법 익히기
__2-1 변수
____2-1-1 변수란 무엇일까요?
____2-1-2 변수 이름을 붙이는 규칙(1) - 꼭 지켜야 하는 규칙
____2-1-3. 변수 이름을 붙이는 규칙(2) - 에러는 발생하지 않지만 알아 두어야 하는 규칙
__2-2 자료형(1) - 기본 데이터 타입
____2-2-1 기본 데이터 타입
____2-2-2 데이터 타입의 형 변환
__2-3 자료형(2) - 컨테이너 타입
____2-3-1 컨테이너 타입이란?
____2-3-2 리스트
____2-3-3 튜플
____2-3-4 세트
____2-3-5 딕셔너리
____2-3-6. Summary
__2-4 조건문
____2-4-1 커피 추천 프로그램
____2-4-2 if
____2-4-3 else
____2-4-4 elif
____2-4-5 이중 if
____2-4-6 내 용돈의 운명은?
__2-5 반복문
____2-5-1 for 문
____2-5-2 컴프리헨션
____2-5-3 while 문
____2-5-4 흐름제어
____2-5-5 반복문 연습문제
__2-6 입출력
____2-6-1 시스템 입력
____2-6-2 시스템 출력
____2-6-3 파일 입출력
__2-7 함수, 람다
____2-7-1 함수란?
____2-7-2 함수 만들기
____2-7-3 함수 예제(1)
____2-7-4 함수 예제(2)
____2-7-5 람다
____2-7-6 문자열
__2-8 모듈, 패키지, 클래스
____2-8-1 기능 꾸러미
____2-8-2 모듈 만들기
____2-8-3 모듈 불러오기
____2-8-4 패키지
____2-8-5 클래스

3장. 데이터 분석을 위한 파이썬 응용 문법
__3-1. numpy
____3-1-1. 배열이란?
____3-1-2. 배열 만들기
____3-1-3. 선택
____3-1-4. 연산
____3-1-5. 변형
____3-1-6. 저장
__3-2. pandas
____3-2-1. Series와 DataFrame의 개념
____3-2-2. 만들기
____3-2-3. 탐색
____3-2-4. 정렬
____3-2-5. 선택
____3-2-6. 삭제
____3-2-7. 연산
____3-2-8. 변형
____3-2-9. 저장
__3-3. 실습
____3-3-1. 데이터 수집
____3-3-2. 데이터 가공

4장. 데이터 시각화
__4-1. seaborn
____4-1-1. 데이터셋
____4-1-2. 산점도
____4-1-3. 회귀선
____4-1-4. 선그래프
____4-1-5. 막대그래프
____4-1-6. 박스그래프, 바이올린플랏
____4-1-7. 히스토그램
____4-1-8. 히트맵
__4-2. matplotlib
____4-2-1. 막대그래프 그래기
____4-2-2. 도화지 설정하기
____4-2-3. 자주 마주하는 문제
____4-2-4. seaborn과 matplotlib 함께 사용하기
__4-3. 데이터 시각화 실습
____4-3-1. 국민건강보험공단 건강검진정보

5장. 데이터 수집
___5-1. 데이터 수집 방법 이해하기
____5-1-1. 크롤링을 사용한 데이터 수집
____5-1-2. 오픈 API를 사용한 데이터 수집
__5-2. requests
____5-2-1. requests 패키지를 사용하여 서버에 HTTP request 보내기
____5-2-2. requests 실습 문제
__5-3. BeutifulSoup
____5-3-1. HTML 문서
____5-3-2. beautifulsoup 설치
____5-3-3. 기본 실습
____5-3-4. 쇼핑몰
__5-4. selenium
____5-4-1. 브라우저를 동적으로 제어하는 코드 작성
__5-5. 정규식
____5-5-1. 패턴을 만드는 방법에 대한 문법

부록 A. 데이터 분석 로드맵
__A-1. 데이터 분석 로드맵
__A-2. FAQ

관련분야 신착자료

Ramamurthy, Bina (2021)
윤관식 (2020)