
000 | 00743camcc2200253 c 4500 | |
001 | 000045739314 | |
005 | 20131031225208 | |
007 | ta | |
008 | 130213s2012 ulkad b 001c kor | |
020 | ▼a 9788955661392 ▼g 94310 | |
020 | 1 | ▼a 9788955660517 (세트) |
035 | ▼a (KERIS)BIB000012977353 | |
040 | ▼a 211006 ▼c 211006 ▼d 211009 | |
082 | 0 4 | ▼a 006.312 ▼2 23 |
085 | ▼a 006.312 ▼2 DDCK | |
090 | ▼a 006.312 ▼b 2012z1 | |
100 | 1 | ▼a 전치혁 |
245 | 1 0 | ▼a 데이터마이닝 기법과 응용 = ▼x Data mining techniques / ▼d 전치혁 지음 |
260 | ▼a 서울 : ▼b 한나래아카데미, ▼c 2012 ▼g (2013) | |
300 | ▼a 488 p. : ▼b 삽화, 도표 ; ▼c 26 cm | |
500 | ▼a 부록: 통계분포표 | |
504 | ▼a 참고문헌과 색인수록 | |
945 | ▼a KLPA |
소장정보
No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
---|---|---|---|---|---|---|---|
No. 1 | 소장처 과학도서관/Sci-Info(1층서고)/ | 청구기호 006.312 2012z1 | 등록번호 121223393 | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
No. 2 | 소장처 과학도서관/Sci-Info(1층서고)/ | 청구기호 006.312 2012z1 | 등록번호 121227069 | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
No. 3 | 소장처 세종학술정보원/과학기술실(5층)/ | 청구기호 006.312 2012z1 | 등록번호 151317952 | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
No. 4 | 소장처 세종학술정보원/학과비치/ | 청구기호 응용통계학과 006.312 2012z1 | 등록번호 151316654 | 도서상태 대출불가(열람가능) | 반납예정일 | 예약 | 서비스 |
No. 5 | 소장처 세종학술정보원/학과비치/ | 청구기호 응용통계학과 006.312 2012z1 | 등록번호 151316655 | 도서상태 대출불가(열람가능) | 반납예정일 | 예약 | 서비스 |
No. 6 | 소장처 세종학술정보원/학과비치/ | 청구기호 응용통계학과 006.312 2012z1 | 등록번호 151316656 | 도서상태 대출불가(열람가능) | 반납예정일 | 예약 | 서비스 |
No. 7 | 소장처 세종학술정보원/학과비치/ | 청구기호 응용통계학과 006.312 2012z1 | 등록번호 151316657 | 도서상태 대출불가(열람가능) | 반납예정일 | 예약 | 서비스 |
No. 8 | 소장처 세종학술정보원/학과비치/ | 청구기호 응용통계학과 006.312 2012z1 | 등록번호 151316658 | 도서상태 대출불가(열람가능) | 반납예정일 | 예약 | 서비스 |
No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
---|---|---|---|---|---|---|---|
No. 1 | 소장처 과학도서관/Sci-Info(1층서고)/ | 청구기호 006.312 2012z1 | 등록번호 121223393 | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
No. 2 | 소장처 과학도서관/Sci-Info(1층서고)/ | 청구기호 006.312 2012z1 | 등록번호 121227069 | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
---|---|---|---|---|---|---|---|
No. 1 | 소장처 세종학술정보원/과학기술실(5층)/ | 청구기호 006.312 2012z1 | 등록번호 151317952 | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
No. 2 | 소장처 세종학술정보원/학과비치/ | 청구기호 응용통계학과 006.312 2012z1 | 등록번호 151316654 | 도서상태 대출불가(열람가능) | 반납예정일 | 예약 | 서비스 |
No. 3 | 소장처 세종학술정보원/학과비치/ | 청구기호 응용통계학과 006.312 2012z1 | 등록번호 151316655 | 도서상태 대출불가(열람가능) | 반납예정일 | 예약 | 서비스 |
No. 4 | 소장처 세종학술정보원/학과비치/ | 청구기호 응용통계학과 006.312 2012z1 | 등록번호 151316656 | 도서상태 대출불가(열람가능) | 반납예정일 | 예약 | 서비스 |
No. 5 | 소장처 세종학술정보원/학과비치/ | 청구기호 응용통계학과 006.312 2012z1 | 등록번호 151316657 | 도서상태 대출불가(열람가능) | 반납예정일 | 예약 | 서비스 |
No. 6 | 소장처 세종학술정보원/학과비치/ | 청구기호 응용통계학과 006.312 2012z1 | 등록번호 151316658 | 도서상태 대출불가(열람가능) | 반납예정일 | 예약 | 서비스 |
컨텐츠정보
책소개
데이터마이닝의 주요 기법을 쉽게 다룬 ‘데이터마이닝 교과서’
데이터마이닝이란 주제는 최근에 매우 보편화되어 많은 입문서가 출판되고 다양한 기법들이 논문을 통해 발표되고 있다. 하지만 이공계 대학생이나 대학원생을 위한 입문서는 찾아보기 어렵다. 이 책은 데이터마이닝을 접하는 독자들이 데이터마이닝의 주요 기법에 대한 이론을 쉽게 이해할 수 있도록, 단순한 소프트웨어 사용법을 싣는 대신에 대표적인 데이터마이닝 기법의 기본 개념 및 원리 등을 설명하는 데 주력했다. 따라서 대학에서는 이 책을 데이터마이닝 관련 과목의 교과서로 활용할 수 있으며, 기업 및 연구소의 연구자들은 지침서로 이용할 수 있다.
이 책에서는 여러 기법의 소개와 함께 예제를 가능한 많이 수록하여, 예제를 통해 기법을 쉽게 이해할 수 있도록 돕는다. 또한, 장마다 연습문제를 실어 복습할 수 있도록 하였다. 일부 연습문제를 풀기 위해서는 소프트웨어의 도움이 필요하지만 이 책에서는 기법에 중심을 두고자 소프트웨어의 어떤 기능을 어떻게 사용할 수 있다는 것은 언급하지 않고 있다. 최근에는 인터넷 등에서도 데이터마이닝 관련 무료 소프트웨어를 구하여 사용할 수 있으므로 기법을 이해한다면 소프트웨어의 사용은 무난할 것이다.
[주요 내용]
데이터마이닝 기법을 목적에 따라 크게 예측, 분류분석, 군집분석, 연관규칙으로 나눌 수 있는데, 이 책에서는 이와 같은 구분에 따라 4부로 구성하였다. 1부의 예측 기법에서는 회귀분석, 주성분분석 및 부분최소자승 회귀분석을 다루고 있다. 2부의 분류분석에서는 로지스틱 회귀분석, 판별분석, 트리기반 기법, 그리고 서포트 벡터 머신을 설명하고 있다. 3부에서는 군집분석을 다루고 있는데, 크게 계층적 군집분석과 비계층 군집분석으로 우선 구분하여 계층적 군집분석에서는 주로 연결법을 설명하고 비계층 군집분석에서는 K-means, K-medoids, 퍼지 K-means, 모형기반 군집방법 등을 소개하고 있다. 마지막 4부에서는 연관규칙과 추천시스템을 포함하고 있다. 연관규칙은 많은 데이터마이닝 서적에서 구체적인 알고리즘을 소개하지 않고 있지만 데이터로부터 유용한 패턴을 찾는다는 데이터마이닝의 주목적에 부합하는 주제이므로 이 책에서는 다루고 있다.
정보제공 :

저자소개
목차
목차 1장 데이터마이닝 개요 = 13 1.1 데이터마이닝의 기능과 기법 = 15 1.2 데이터마이닝의 활용 분야 = 17 1.3 참고사항 = 19 1부 예측 2장 회귀분석 = 21 2.1 다중회귀모형 = 23 2.2 회귀계수의 추정 = 25 2.3 모형에 따른 추론 = 32 2.3.1 회귀성 검정 = 32 2.3.2 개별 회귀계수에 대한 검정(t-검정) = 37 2.4 변수선택 방법 = 42 2.4.1 모형의 성능척도 = 42 2.4.2 모든 가능한 조합의 회귀분석 = 44 2.4.3 단계적 변수선택 = 46 2.5 회귀모형의 진단 = 52 2.6 반응치에 대한 추정 및 예측 = 56 2.6.1 평균반응치의 추정 = 56 2.6.2 미래반응치의 예측 = 59 2.6.3 예측성능 평가 = 60 2.7 다중공선성 = 62 2.7.1 다중공선성의 진단 방법 및 척도 = 63 2.7.2 다중공선성의 해결 방법 = 65 2.8 지시변수와 회귀모형 = 68 2.9 참고사항 = 75 연습문제 = 77 3장 주성분분석 = 97 3.1 변수의 변동과 제곱합 = 99 3.2 주성분의 이해 = 102 3.3 행렬의 분해 = 105 3.4 주성분 스코어 = 114 3.5 제곱합 분해 = 117 3.6 NIPALS 알고리즘 = 123 3.7 주성분 회귀분석 = 125 3.7.1 회귀계수의 추정 = 126 3.7.2 개별 회귀계수의 검정 = 127 3.7.3 회귀성 검정 = 128 3.7.4 반응치의 예측 = 132 3.8 참고사항 = 133 연습문제 = 134 4장 부분최소자승 회귀분석 = 141 4.1 하나의 종속변수에 대한 PLS 회귀분석 = 143 4.1.1 NIPALS 알고리즘 = 144 4.1.2 제곱합 분해 = 150 4.1.3 새로운 데이터에 대한 종속변수 예측 = 152 4.1.4 독립변수의 중요도 = 155 4.2 다수의 종속변수에 대한 PLS 회귀분석 = 158 4.2.1 NIPALS 알고리즘 = 160 4.2.2 제곱합 분해 = 164 4.2.3 새로운 데이터에 대한 종속변수 예측 = 168 4.3 예측성능 평가 = 171 4.4 참고사항 = 171 연습문제 = 173 2부 분류분석 5장 분류분석 개요 = 179 5.1 분류문제 및 분류기법 = 181 5.2 기본적인 분류기법 = 183 5.2.1 인접객체법 = 183 5.2.2 나이브 베이지안 분류법 = 186 5.3 참고사항 = 188 연습문제 = 189 6장 로지스틱 회귀분석 = 191 6.1 이분 로지스틱 회귀모형 = 193 6.1.1 이분형 종속변수 = 193 6.1.2 로짓 변환 = 194 6.1.3 회귀계수의 추정 = 195 6.1.4 분류규칙 = 198 6.1.5 비용을 고려한 분류규칙 = 201 6.1.6 기타 변환 = 202 6.2 명목 로지스틱 회귀모형 = 205 6.3 서열 로지스틱 회귀모형 = 209 6.3.1 누적 로짓모형(Oumulative logit model) = 209 6.3.2 인근범주 로짓모형(Adjacent-categories logit model) = 213 6.4 참고사항 = 215 연습문제 = 220 7장 판별분석 = 229 7.1 피셔 방법 = 231 7.1.1 피셔 판별함수 = 231 7.1.2 분류규칙 = 234 7.2 의사결정론에 의한 분류규칙 = 238 7.3 오분류비용을 고려한 분류규칙 = 246 7.4 이차판별분석 = 247 7.5 세 범주 이상의 분류 = 250 7.6 참고사항 = 253 연습문제 = 254 8장 트리기반 기법 = 261 8.1 CART 개요 = 263 8.2 트리의 형성 = 264 8.2.1 노드 및 트리의 불순도 = 266 8.2.2 분지기준 = 269 8.2.3 최대 트리 형성 = 274 8.3 가지치기 및 최종 트리 선정 = 277 8.3.1 트리의 오분류비용 = 277 8.3.2 비용-복잡도 최소화에 의한 가지치기 = 279 8.3.3 최적 트리의 선정 = 282 8.3.4 범주 배정 = 283 8.4 기타 트리 기법 = 284 8.5 참고사항 = 285 연습문제 = 286 9장 서포트 벡터 머신 = 291 9.1 선형 SVM-분리 가능 경우 = 293 9.2 선형 SVM-분리 불가능 경우 = 299 9.3 비선형 SVM = 303 9.4 참고사항 = 312 연습문제 = 314 10장 분류규칙의 성능 평가 = 317 10.1 분류오류율 = 319 10.2 정확도, 민감도 및 특이도 = 320 10.3 ROC 곡선 = 323 10.4 이익도표 = 327 10.5 참고사항 = 331 연습문제 = 332 3부 군집분석 11장 군집분석 개요 = 333 11.1 군집분석 기법 = 335 11.2 객체 간의 유사성 척도 = 336 11.2.1 거리 관련 척도 = 336 11.2.2 상관계수 관련 척도 = 342 11.3 범주형 객체의 유사성 척도 = 344 11.3.1 이분형 변수의 경우 = 344 11.3.2 서열형 변수의 경우 = 346 11.3.3 명목형 변수의 경우 = 347 11.3.4 혼합형의 경우 = 348 11.4 참고사항 = 349 연습문제 = 350 12장 계층적 군집방법 = 353 12.1 군집 간 거리척도 및 연결법 = 355 12.2 연결법의 군집 알고리즘 = 357 12.3 워드 방법 = 361 12.4 분리적 방법-다이아나 = 367 12.5 군집수의 결정 = 374 12.6 참고사항 = 377 연습문제 = 378 13장 비계층적 군집방법 = 383 13.1 K-means 알고리즘 = 385 13.2 K-medoids 군집방법 = 390 13.2.1 PAM 알고리즘 = 392 13.2.2 CLARA 알고리즘 = 399 13.2.3 CLARANS 알고리즘 = 400 13.2.4 K-means-like 알고리즘 = 402 13.3 퍼지 K-means 알고리즘 = 404 13.4 모형기반 군집방법 = 410 13.5 참고사항 = 417 연습문제 = 419 14장 군집해의 평가 및 해석 = 421 14.1 군집해의 평가 = 423 14.1.1 외부평가지수 = 423 14.1.2 내부평가지수 = 428 14.2 군집해의 해석 = 431 14.3 참고사항 = 433 연습문제 = 434 4부 연관규칙 15장 연관규칙 = 437 15.1 연관규칙의 정의 및 성능척도 = 439 15.2 연관규칙의 탐사 = 442 15.2.1 빈발항목집합 생성 = 443 15.2.2 규칙의 탐사 = 445 15.3 순차적 패턴의 탐사 = 448 15.3.1 시퀀스 = 448 15.3.2 순차적 패턴 탐사 알고리즘 = 450 15.3.3 시퀀스 단계 = 451 15.3.4 개선된 시퀀스 탐사 알고리즘-AprioriSome = 453 15.4 항목의 선정 = 457 15.5 참고사항 = 458 연습문제 = 460 16장 추천시스템 = 463 16.1 내용기반 추천시스템 = 465 16.2 협업 필터링 = 467 16.3 시장바구니 데이터를 이용한 협업 필터링 = 469 16.4 참고사항 = 472 연습문제 = 473 부록 _ 통계분포표 = 475 찾아보기 = 483