HOME > Detail View

Detail View

(빅데이터를 활용한) 인공지능 개발. 1, 빅데이터를 활용한 통계분석

Material type
단행본
Personal Author
송주영 송태민, 저
Title Statement
(빅데이터를 활용한) 인공지능 개발. 1, 빅데이터를 활용한 통계분석 / 송주영, 송태민 지음
Publication, Distribution, etc
서울 :   황소걸음 아카데미,   2019  
Physical Medium
192 p. : 삽화 ; 26 cm
ISBN
9791186821381
Bibliography, Etc. Note
참고문헌(p. 187)과 색인수록
000 00000cam c2200205 c 4500
001 000046014520
005 20200128171320
007 ta
008 200128s2019 ulka b 001c kor
020 ▼a 9791186821381 ▼g 93310
035 ▼a (KERIS)BIB000015351225
040 ▼a 247009 ▼c 247009 ▼d 211092
082 0 4 ▼a 006.3 ▼2 23
085 ▼a 006.3 ▼2 DDCK
090 ▼a 006.3 ▼b 2019z11
100 1 ▼a 송주영
245 2 0 ▼a (빅데이터를 활용한) 인공지능 개발. ▼n 1, ▼p 빅데이터를 활용한 통계분석 / ▼d 송주영, ▼e 송태민 지음
246 1 1 ▼a Artificial intelligence development using big data. ▼n 1, ▼p Statistical analysis using big data
260 ▼a 서울 : ▼b 황소걸음 아카데미, ▼c 2019
300 ▼a 192 p. : ▼b 삽화 ; ▼c 26 cm
504 ▼a 참고문헌(p. 187)과 색인수록
536 ▼a 이 저서는 2016년 대한민국 교육부와 한국연구재단의 지원과 서울시의 지원을 받아 수행된 연구임
700 1 ▼a 송태민, ▼e

Holdings Information

No. Location Call Number Accession No. Availability Due Date Make a Reservation Service
No. 1 Location Medical Library/Departmental Collection/ Call Number 예방의학 006.3 2019z11 Accession No. 931002507 Availability Loan can not(reference room) Due Date Make a Reservation Service

Contents information

Book Introduction

1권은 빅데이터를 활용하여 인공지능을 개발하기 위해 필요한 지식인 통계분석의 전 과정을 설명하는 책이다. 제1권에서는 빅데이터 분석 프로그램인 R과 SPSS의 설치 및 활용 방법을 소개하고 빅데이터 분석을 위해 데이터 사이언티스트가 습득해야 할 과학적 연구설계와 통계분석에 관해 기술하였다.

빅데이터를 활용한 인공지능 개발
Artificial Intelligence Development Using Big Data


빅데이터는 데이터 형식이 복잡하고 방대할 뿐만 아니라 그 생성속도가 매우 빨라 기존의 데이터 처리방식이 아닌 새로운 관리 및 분석 방법을 필요로 한다. 이에 따라 방대한 데이터를 수집·관리하면서 복잡하고 다양한 사회현상을 분석할 수 있는 능력을 지닌 데이터 사이언티스트의 역할은 그 중요성이 더해가고 있다.

그동안 우리 주변의 사회현상을 예측하기 위해 모집단을 대표할 수 있는 표본을 추출하여 표본에서 생산된 통계량으로 모집단의 모수를 추정해 왔다. 모집단을 추정하기 위해 표본을 대상으로 예측하는 방법은 기존의 이론모형이나 연구자가 결정한 모형에 근거하여 예측하기 때문에 제한된 결과만 알 수 있고, 다양한 변인 간의 관계를 파악하는 데는 한계가 있다. 특히 빅데이터 시대에는 해당 주제와 연관된 모든 데이터를 대상으로 하기 때문에 표본으로 모수를 추정하기 위해 준비된 모형을 적용하고 추정하는 가설검정의 절차가 생략될 수도 있다. 따라서 빅데이터를 학습하여 모형(인공지능)을 개발하는 머신러닝 방법이 다양한 변인들의 관계를 보다 정확히 예측할 수 있다. 머신러닝으로 인공지능을 개발하기 위해서는 다양한 분야에서 데이터의 잡음이 제거된 양질의 학습데이터가 생산되어야 한다.

저자들은 그동안 급속히 변화하는 사회현상을 예측하여 선제적으로 대응하기 위해 정형화된 빅데이터와 소셜 빅데이터를 활용한 연구에 노력을 경주해 왔다. 이 책 역시 그러한 연구의 결과로, 실제로 공공 빅데이터를 분석하여 미래를 예측하기 위한 인공지능을 개발하고 활용하기 위한 전 과정을 자세히 담았다.

빅데이터 분석을 통하여 급속히 변화하는 사회현상을 예측하고 창조적인 결과물을 이끌어내고자 하는 모든 분들에게 이 책이 실질적인 도움이 되기를 바란다. 나아가 머신러닝을 활용한 빅데이터 분석을 통하여 관련 분야의 인공지능 개발 및 학문적 발전에 일조할 수 있기를 진심으로 희망한다.

[이 책의 특징]

첫째, 이 책의 내용은 2권으로 구성되어 있다. 제1권은 빅데이터를 활용하여 인공지능을 개발하기 위해 필요한 지식인 통계분석의 전 과정을 설명한《빅데이터를 활용한 통계분석》이고, 제2권은 인공지능을 개발하기 위해 머신러닝 예측모델링의 전 과정을 설명한《머신러닝을 활용한 인공지능 개발》이다.
둘째, 제1권의 통계분석에는 오픈소스 프로그램인 R과 SPSS를 비교하여 설명하였다.
셋째, 제2권의 머신러닝 모델링은 오픈소스 프로그램인 R을 사용하였다.

[주요 내용]

제1권에서는 빅데이터 분석 프로그램인 R과 SPSS의 설치 및 활용 방법을 소개하고 빅데이터 분석을 위해 데이터 사이언티스트가 습득해야 할 과학적 연구설계와 통계분석에 관해 기술하였다.
제2권에서는 인공지능 개발을 위해 머신러닝 학습데이터를 생성하는 과정을 소개하고 머신러닝 개념과 모델링 그리고 인공지능의 개발과 활용에 대한 전 과정을 기술하였다.


Information Provided By: : Aladin

Table of Contents

[volume. vol.1]----------
목차
머리말  = 4
1장 R과 SPSS 설치 및 활용 = 11
 01 R의 설치와 활용 = 12
  1.1 R 설치 = 12
  1.2 R 활용 = 18
   1) 패키지 설치 및 로딩 = 18
   2) 값의 할당 및 연산 = 21
   3) R의 기본 데이터형 = 23
   4) R의 자료구조 = 24
   5) R의 함수 사용 = 27
   6) R 기본 프로그램(조건문과 반복문) = 28
   7) R 데이터 프레임의 변수 이용방법 = 30
   8) R 데이터 프레임 작성 = 31
   9) 변수 및 관찰치 선택 = 39
   10) R의 주요 GUI(Graphic User Interface) 메뉴 활용 = 42
  연습문제 = 45
 02 SPSS의 설치와 활용 = 48
  2.1 SPSS 설치 = 48
  2.2 SPSS 활용 = 49
   1) SPSS의 기본 구성 = 49
   2) SPSS의 자료 입력 = 50
   3) SPSS의 자료 선택/변환 = 52
   4) SPSS의 명령문 활용 = 54
2장 빅데이터를 활용한 통계분석 = 59
 01 과학적 연구설계 = 60
  1.1 연구의 개념 = 61
  1.2 변수 측정 = 62
   1) 척도 = 62
   2) 변수 = 64
  1.3 분석단위 = 65
  1.4 표본추출과 가설검정 = 66
   1) 조사설계 = 66
   2) 표본추출 = 67
   3) 가설검정 = 71
 02 통계분석 = 73
  2.1 기술통계분석 = 75
   1) 중심위치(central tendency) = 75
   2) 산포도(dispersion) = 76
    (1) 중심위치와 산포도 분석 = 76
    (2) 범주형 변수의 빈도분석 = 79
    (3) 연속형 변수의 빈도분석 = 82
  2.2 추리통계 분석 = 84
    (4) 교차분석(cross tabulation analysis) = 85
    (5) 평균의 검정(일표본 T검정) = 94
    (6) 평균의 검정(독립표본 T검정) = 96
    (7) 평균의 검정(대응표본 T검정) = 98
    (8) 평균의 검정(일원배치 분산분석) = 99
    (9) 평균의 검정(이원배치 분산분석) = 107
    (10) 산점도(scatter diagram) = 113
    (11) 상관분석(correlation analysis) = 116
    (12) 편상관분석(partial correlation analysis) = 121
    (13) 단순회귀분석(simple regression analysis) = 124
    (14) 다중회귀분석(multiple regression analysis) = 130
    (15) 요인분석(factor analysis) = 147
    (16) 신뢰성 분석(reliability analysis) = 161
    (17) 다변량 분산분석(multivariate analysis of variance) = 165
    (18) 이분형 로지스틱 회귀분석(binary logistic regression analysis) = 171
    (19) 다항 로지스틱 회귀분석(multinomial logistic regression analysis) = 176
  연습문제 = 181
참고문헌 = 187
찾아보기 = 188
[volume. vol.2]----------
목차
머리말 = 4
1장 빅데이터를 활용한 머신러닝 학습데이터 생성 = 11
 01 서론 = 12
 02 공공 빅데이터 수집 = 15
 03 머신러닝 학습데이터 생성 = 17
 연습문제 = 28
 참고문헌 = 30
2장 머신러닝 개념과 모델링 = 33
 01 서론 = 34
 02 머신러닝 학습데이터 = 39
 03 머신러닝 기반 비만 예측모형 개발 = 41
  3.1 나이브 베이즈 분류모형 = 41
   1) 비만(정상, 비만) 예측모형 = 43
   2) 비만(저체중, 정상, 비만) 예측모형 = 49
  3.2 로지스틱 회귀모형 = 53
   1) 비만(정상, 비만) 예측모형 = 53
   2) 비만(저체중, 정상, 비만) 예측모형 = 56
  3.3 랜덤포레스트 모형 = 59
   1) 비만(정상, 비만) 예측모형 = 59
   2) 비만(저체중, 정상, 비만) 예측모형 = 65
  3.4 의사결정나무 모형 = 71
   가. R 프로그램 활용 = 71
    1) 비만(정상, 비만) 예측모형 = 71
    2) 비만(저체중, 정상, 비만) 예측모형 = 77
   나. SPSS 프로그램 활용 = 80
    1) 범주형 독립변수를 활용한 비만(정상, 비만) 예측모형 = 80
    2) 범주형 독립변수를 활용한 비만(저체중, 정상, 비만) 예측모형 = 88
    3) 연속형 독립변수를 활용한 비만(정상, 비만) 예측모형 = 90
    4) 범주형과 연속형 독립변수를 활용한 비만(저체중, 정상, 비만) 예측모형 = 92
  3.5 신경망 모형 = 93
   1) 비만(정상, 비만) 예측모형 = 97
   2) 비만(저체중, 정상, 비만) 예측모형 = 108
  3.6 서포트벡터머신 모형 = 112
   1) 비만(정상, 비만) 예측모형 = 113
   2) 비만(저체중, 정상, 비만) 예측모형 = 115
  3.7 연관분석 = 123
   1) 독립변수 간 연관 분석 = 124
   2) 독립변수와 종속변수 간 연관 분석 = 129
  3.8 군집분석 = 133
   1) 군집분석 = 134
   2) 세분화 = 137
 04 머신러닝 모형평가 = 139
  4.1 오분류표를 이용한 머신러닝 모형의 평가 = 142
   1) naïveBayes 분류모형 평가 = 142
   2) 신경망 모형 평가 = 148
   3) 로지스틱 회귀모형 평가 = 153
   4) 서포트벡터머신 모형 평가 = 158
   5) 랜덤포레스트 모형 평가 = 163
   6) 의사결정나무 모형 평가 = 168
  4.2 ROC 곡선을 이용한 머신러닝 모형의 평가 = 173
   1) 범주형 독립변수를 활용한 비만(정상, 비만) 예측모형 ROC 평가 = 173
   2) 범주형과 연속형 독립변수를 활용한 비만(정상, 비만) 예측모형 ROC 평가 = 180
  4.3 머신러닝 모형의 성능향상 방안 = 183
3장 인공지능 개발 및 활용 = 189
 1. 입력변수가 출력변수에 미치는 영향력(예측확률) 산출하기 = 190
 2. 입력변수만 있고 종속변수가 없는 학습데이터에 랜덤포레스트 예측모형에서 예측한 종속변수를 생성하여 학습데이터에 추가하기 = 200
 3. 학습데이터의 분류와 예측데이터의 분류가 동일한 데이터 만들기 = 203
 4. 기존의 학습데이터와 양질의 학습데이터의 평가 = 205
 5. 머신러닝으로 인공지능 만들기 = 207
 연습문제 = 213
참고문헌 = 215
찾아보기 = 217

New Arrivals Books in Related Fields

Baumer, Benjamin (2021)