HOME > 상세정보

상세정보

비정형 데이터 분석

비정형 데이터 분석

자료유형
단행본
서명 / 저자사항
비정형 데이터 분석 = Unstructured data analysis / 장영재 , 손원 , 황희진 공저
발행사항
서울 : 한국방송통신대학교출판문화원, 2020
형태사항
vi, 256 p. : 삽화, 도표 ; 25 cm
ISBN
9788920036743
서지주기
참고문헌과 색인수록
000 00000cam c2200205 c 4500
001 000046055287
005 20201116141537
007 ta
008 201111s2020 ulkad b AZ 001c kor
020 ▼a 9788920036743 ▼g 93310
035 ▼a (KERIS)BIB000015691177
040 ▼a 211063 ▼c 211063 ▼d 211009
082 0 4 ▼a 005.7 ▼2 23
085 ▼a 005.7 ▼2 DDCK
090 ▼a 005.7 ▼b 2020z1
100 1 ▼a 장영재, ▼g 張永在, ▼d 1971-
245 1 0 ▼a 비정형 데이터 분석 = ▼x Unstructured data analysis / ▼d 장영재 , ▼e 손원 , ▼e 황희진 공저
260 ▼a 서울 : ▼b 한국방송통신대학교출판문화원, ▼c 2020
300 ▼a vi, 256 p. : ▼b 삽화, 도표 ; ▼c 25 cm
504 ▼a 참고문헌과 색인수록
700 1 ▼a 손원, ▼d 1974-, ▼e
700 1 ▼a 황희진, ▼e
770 0 ▼t 비정형 데이터 분석 : 워크북 ▼w 000046056124 ▼z 9788920036927
945 ▼a KLPA

소장정보

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 005.7 2020z1 등록번호 121254893 도서상태 대출가능 반납예정일 예약 서비스 B M

컨텐츠정보

책소개

이 책은 대표적인 비정형 데이터인 텍스트 데이터의 특징과 구체적인 분석 방법을 중점적으로 다루고 있다. 특히 통계학 전공자들이 기존 지식을 바탕으로 텍스트 데이터를 실제 분석해 볼 수 있도록 R을 이용한 분석 절차를 단계적으로 상세하게 정리하였다. 학습자들이 이 책에서 제시한 사례를 충실하게 익히고 분석 예제를 실습해 봄으로써 비정형 데이터에 대한 통찰력과 분석 능력을 함양하여 사회가 요구하는 데이터 과학자의 모습을 갖추어 나가길 기대한다.
이 책은 8개의 장으로 구성되어 있다. 제1장에서는 데이터의 개념과 환경 변화 등 비정형 데이터의 등장 배경에 대해 소개하였다. 제2장에서는 비정형 데이터 분석의 도구로서 다양한 프로그래밍 언어를 정리하였다. 제3장에서는 대표적인 비정형 데이터인 텍스트 데이터의 특징과 입수 방법을 살펴보았다. 제4장 및 5장에서는 텍스트 데이터의 전처리 방법과 탐색적 분석 방법을 다루었다. 제6장에서는 벡터공간모형을 이용하여 텍스트 데이터를 표현하는 방법을 설명하였으며, 제7장에서는 데이터 마이닝 기법을 이용하여 텍스트 데이터를 분석해 보았다. 마지막으로 제8장에서는 텍스트 데이터의 분석 절차에 따라 실제 데이터를 분석해 보고 유용한 정보를 추출하는 일련의 과정을 정리해 보았다.


정보제공 : Aladin

저자소개

손원(지은이)

서울대학교 자연과학대학 계산통계학과(이학사) 서울대학교 대학원 통계학과(이학석사, 통계학박사) 한국은행 경제통계국 차장 2020년 현재: 단국대학교 SW융합대학 정보통계학과 교수

장영재(지은이)

서울대학교 자연과학대학 계산통계학과(이학사) o University of Wisconsin-Madison 통계학과(이학석사, 통계학박사) o 현재: 한국방송통신대학교 정보통계학과 교수

황희진(지은이)

서울대학교 자연과학대학 계산통계학과(이학사) 서울대학교 대학원 계산통계학과(이학석사) 한국외국어대학교 대학원 통계학과(이학박사) 네이버(주) 데이터정보센터 부장 2020년 현재: 한국은행 경제통계국 차장

정보제공 : Aladin

목차

제1장 데이터의 개념 및 환경 변화
1. 데이터의 개념
2. 데이터 환경의 변화
3. 데이터 활용을 위한 제도적 장치(데이터 3법)
4. 데이터 활용의 유의점

제2장 비정형 데이터 분석의 도구
1. 비정형 데이터의 분석
2. 분석 도구의 구현
3. 주요 프로그래밍 언어의 이해
4. 프로그래밍 언어의 선택

제3장 텍스트 데이터 불러오기
1. 비정형 데이터의 현황
2. 텍스트 데이터의 이해
3. 텍스트 데이터의 수집 방법
4. 텍스트 데이터 수집 사례
5. 유용한 R 패키지

제4장 텍스트 데이터의 전처리
1. 텍스트 데이터와 수치형 데이터의 표현 방식의 차이
2. 텍스트 데이터의 통계 분석을 위한 기본 가설
3. 토큰화
4. 대소문자 변환과 문장부호 삭제
5. 어간추출과 원형복원
6. 불용어 삭제
7. 실제 텍스트 데이터의 전처리

제5장 텍스트 데이터에 대한 탐색적 자료분석
1. 텍스트 데이터에 대한 탐색적 자료분석의 필요성
2. 텍스트 데이터의 요약
3. 단어의 출현 위치 탐색
4. 두 문서의 단어 출현 빈도 비교
5. 산점도를 이용한 두 문서의 비교

제6장 벡터공간모형을 이용한 텍스트 데이터 표현
1. 벡터공간모형
2. 문서-단어 행렬
3. 단어빈도-역문서빈도
4. 문서-단어 행렬의 특징
5. 단어 의미의 유사성
6. 워드 임베딩

제7장 텍스트 데이터의 통계적 분석
1. 텍스트 마이닝
2. 코사인 유사도를 이용한 문서의 분류
3. 텍스트 데이터에 대한 군집분석
4. 텍스트 데이터에 대한 분류분석

제8장 텍스트 데이터 분석 사례
1. 분석 대상 텍스트 데이터
2. 텍스트 데이터의 전처리
3. 텍스트 데이터의 탐색적 자료분석
4. 문서-단어 행렬과 코사인 유사도
5. 군집분석
6. 분류분석

찾아보기

관련분야 신착자료