HOME > Detail View

Detail View

파이썬(Python)을 이용한 빅데이터 분석

파이썬(Python)을 이용한 빅데이터 분석 (Loan 1 times)

Material type
단행본
Personal Author
유성준, 兪成濬, 1959-, 저 구영현, 具永玹, 1979-, 저 정원희, 저 박철호, 저 윤학림, 저, 저 정다운, 저 이여진, 저
Title Statement
파이썬(Python)을 이용한 빅데이터 분석 / 유성준 [외]공저
Publication, Distribution, etc
파주 :   21세기사,   2018   (2021 3쇄)  
Physical Medium
371 p. : 천연색삽화, 도표 ; 26 cm
ISBN
9788984686434
General Note
공저자: 구영현, 정원희, 박철호, 윤학림, 정다운, 이여진  
색인수록  
000 00000cam c2200205 c 4500
001 000046079148
005 20210506112849
007 ta
008 210504s2018 ggkad 001c kor
020 ▼a 9788984686434 ▼g 93000
035 ▼a (KERIS)BIB000014954763
040 ▼a 247009 ▼c 247009 ▼d 211009
082 0 0 ▼a 006.312 ▼2 23
085 ▼a 006.312 ▼2 DDCK
090 ▼a 006.312 ▼b 2018z19
245 0 0 ▼a 파이썬(Python)을 이용한 빅데이터 분석 / ▼d 유성준 [외]공저
246 3 ▼a Phtyon을 이용한 빅데이터 분석
246 3 ▼a 파이썬을 이용한 빅데이터 분석
246 3 0 ▼a 빅데이터 분석
260 ▼a 파주 : ▼b 21세기사, ▼c 2018 ▼g (2021 3쇄)
300 ▼a 371 p. : ▼b 천연색삽화, 도표 ; ▼c 26 cm
500 ▼a 공저자: 구영현, 정원희, 박철호, 윤학림, 정다운, 이여진
500 ▼a 색인수록
700 1 ▼a 유성준, ▼g 兪成濬, ▼d 1959-, ▼e
700 1 ▼a 구영현, ▼g 具永玹, ▼d 1979-, ▼e
700 1 ▼a 정원희, ▼e
700 1 ▼a 박철호, ▼e
700 1 ▼a 윤학림, ▼e 저, ▼e
700 1 ▼a 정다운, ▼e
700 1 ▼a 이여진, ▼e
945 ▼a KLPA

Holdings Information

No. Location Call Number Accession No. Availability Due Date Make a Reservation Service
No. 1 Location Science & Engineering Library/Sci-Info(Stacks1)/ Call Number 006.312 2018z19 Accession No. 121257212 Availability In loan Due Date 2021-11-15 Make a Reservation Available for Reserve R Service M

Contents information

Book Introduction

기계학습 개론 책에서 흔히 등장하는 복잡하고 쉽지 않은 수식을 가급적 빼고 예제를 통해 개념을 설명한다. 즉, 기계학습 이론을 발전시키는 관점보다는 기계학습이라는 도구를 실제 문제에 적용할 수 있는 능력을 키우기 위한 기초도서로 활용할 수 있도록 하였다.

이 책에서는 기계학습 개론 책에서 흔히 등장하는 복잡하고 쉽지 않은 수식을 가급적 빼고 예제를 통해 개념을 설명하고자 한 것이 특징입니다. 즉, 기계학습 이론을 발전시키는 관점보다는 기계학습이라는 도구를 실제 문제에 적용할 수 있는 능력을 키우기 위한 기초도서로 활용할 수 있도록 하였습니다. 이 책의 앞 부분에는 우선 기계학습을 이용한 데이터 분석 개요에 대해 기술합니다. 그 이후에 선형회귀분석을 이용한 데이터 분석, 트리를 이용한 데이터 분석, 인공신경망을 이용한 데이터 분석, SVM을 이용한 데이터 분석, 텍스트 데이터 분석, K-means와 K-nearest neighbor 방식을 이용한 데이터 분석방법 등에 대해 기술합니다. 마지막으로 다양한 특징을 가진 데이터를 조금 더 단순화시켜 접근하는 것이 가능할 수 있는 주성분 분석(PCA) 등의 방법 등에 대해 기술합니다.


Information Provided By: : Aladin

Table of Contents

CHAPTER 1 개요
1.1 빅데이터 분석 개요
1.2 데이터 분석을 위해 필요한 역량
1.3 이 책의 구성

CHAPTER 2 기계학습을 이용한 데이터분석
2.1 기계학습(Machine Learning) 소개
2.1.1 기계학습
2.1.2 기계학습 기술
2.1.3 기계학습을 활용한 데이터 분석
2.2 예측모델 성능 평가
2.2.1 데이터 셋 구성을 통한 검증 방법
2.3 데이터를 사용한 실습
2.3.1 Scikit Learn 제공 Toy Data를 사용한 실습

CHAPTER 3 선형회귀분석을 이용한 데이터 분석
3.1 단일선형회귀분석
3.1.1 단일선형회귀분석이란?
3.1.2 단일선형회귀모델 소개
3.1.3 적합도 검증
3.1.4 성능평가
3.1.5 단일선형회귀분석 실습 ?Basic 1
3.1.6 단일선형회귀분석 실습 ?Basic 2
3.2 다중선형회귀분석
3.2.1 다중선형회귀분석이란?
3.2.2 적합도 검증
3.2.3 다중선형회귀분석 실습 ?Basic 1
3.2.4 다중선형회귀분석 실습 ?Basic 2

CHAPTER 4 트리를 이용한 데이터 분석
4.1 의사결정 트리를 이용한 데이터 분석
4.1.1 의사결정 트리(Decision Tree)란?
4.1.2 의사결정 트리 구성요소
4.1.3 Decision Tree 분석과정
4.1.4 예제를 이용한 의사결정 트리 동작 과정
4.1.5 의사결정 트리 분리기준 (Split Criterion)
4.1.6 예제를 이용한 의사결정 트리 실습
4.2 랜덤 포레스트(Random Forest)를 이용한 데이터 분석
4.2.1 랜덤 포레스트 소개
4.2.2 랜덤 포레스트 이론
4.2.3 Iris 데이터를 이용해 간단한 랜덤 포레스트 구현

CHAPTER 5 인공신경망을 이용한 데이터분석
5.1 인공신경망(Artificial Neural Network : ANN)
5.1.1 인공신경망 개념
5.1.2 인공신경망 종류 ?단일계층신경망
5.2 인공신경망을 이용한 데이터 분석
5.2.1 인공신경망의 종류 ?다층신경망
5.2.2 예제를 이용한 인공신경망 실습

CHAPTER 6 Support Vector Machine
6.1 Support Vector Machine (SVM) 개요
6.1.1 SVM개념
6.2 Support Vector Machine 실습
6.2.1 Python package 로드
6.2.2 Iris data set 로드
6.2.3 Iris data set 정보 확인
6.2.4 데이터 학습
6.2.5 데이터 시각화 전처리
6.2.6 데이터 시각화 및 성능 측정
6.3 SVM의 Parameter 조정하는 방법 실습

CHAPTER 7 Naive Bayes
7.1 Naive Bayes 개념
7.1.1 Naive Bayes란?
7.1.2 베이즈 정리(Bayes theorem)
7.1.3 조건부 확률(Conditional Probability)
7.1.4 라플라스 스무딩 (Laplace Smoothing)
7.1.5 Log 변환
7.2 예제를 이용한 Naive Bayes
7.3 예제를 이용한 Naive Bayes Python 코드 실습
7.3.1 필요한 package 로드
7.3.2 예제 데이터 로드
7.3.3 데이터 전처리
7.3.4 데이터 분리
7.3.5 Train, Test Set 구성
7.3.6 나이브 베이즈 모델 생성
7.3.7 클래스 예측
7.3.8 예측 클래스 확인
7.3.9 분류 성능 측정

CHAPTER 8 영문 텍스트 데이터 분석
8.1 텍스트 분석
8.1.1 텍스트 분석
8.1.2 토큰화
8.1.3 어간추출
8.1.4 형태소 분석
8.1.5 정보 추출
8.1.6 문서 분류
8.1.7 감성 분석
8.2 영문 텍스트 데이터 분석
8.2.1 텍스트 분석
8.2.2 영어 뉴스 데이터 수집
8.2.3 텍스트 데이터 전처리
8.2.4 Word Cloud
8.2.5 특징 값 추출
8.2.6 뉴스 분류

CHAPTER 9 한국어 텍스트 데이터 분류
9.1 한국어 텍스트 데이터 분류
9.1.1 한국어 텍스트 데이터 분류
9.1.2 데이터 셋과 특징 값 추출
9.1.3 분류

CHAPTER 10 기타 기계학습을 이용한 데이터 분석
10.1 K-means
10.1.1 K-means 알고리즘이란?
10.1.2 K-means 클러스터링 예제
10.1.3 Scikit-learn(Sklearn) 패키지 소개
10.1.4 K-means 실습
10.2 K-Nearest Neighbors(KNN)
10.2.1 K-Nearest Neighbors (KNN) 알고리즘이란?
10.2.2 Scikit-learn(Sklearn) 패키지 소개
10.2.3 KNN 실습

CHAPTER 11 PCA와 LDA
11.1 차원 축소
11.1.1 차원 (Dimensionality)
11.1.2 차원의 저주 (Curse of Dimensionality)
11.1.3 차원 축소 방법
11.2 PCA
11.2.1 PCA
11.2.2 고유벡터(Eigenvectors)와 고유값(Eigenvalues)
11.2.3 PCA를 사용한 데이터 재구성
11.3 LDA
11.3.1 LDA
11.4 데이터를 사용한 실습
11.4.1 필요한 패키지 import
11.4.2 원본 데이터 확인
11.4.3 PCA
11.4.4 LDA
11.4.5 원본, PCA, LDA 시각화 결과 비교

New Arrivals Books in Related Fields

National Academies of Sciences, Engineering, and Medicine (U.S.) (2020)
Cartwright, Hugh M. (2021)
한국소프트웨어기술인협회. 빅데이터전략연구소 (2021)