HOME > 상세정보

상세정보

파이썬으로 텍스트 분석하기 : 전략커뮤니케이션을 위한 파이썬 텍스트 마이닝

파이썬으로 텍스트 분석하기 : 전략커뮤니케이션을 위한 파이썬 텍스트 마이닝 (4회 대출)

자료유형
단행본
개인저자
윤태일 尹泰日, 1963- 이수안 李修安, 1986-, 저
서명 / 저자사항
파이썬으로 텍스트 분석하기 : 전략커뮤니케이션을 위한 파이썬 텍스트 마이닝 / 윤태일, 이수안 지음
발행사항
서울 :   늘봄,   2018   (2019 2쇄)  
형태사항
283 p. : 삽화, 도표 ; 22 cm
ISBN
9788965550792
서지주기
참고문헌: p. 280-283
000 00000cam c2200205 c 4500
001 000046003014
005 20191023173644
007 ta
008 191023s2018 ulkad b 000c kor
020 ▼a 9788965550792 ▼g 93000
035 ▼a (KERIS)BIB000015373538
040 ▼a 222003 ▼c 222003 ▼d 211009
082 0 4 ▼a 006.31 ▼2 23
085 ▼a 006.31 ▼2 DDCK
090 ▼a 006.31 ▼b 2018z46
100 1 ▼a 윤태일 ▼g 尹泰日, ▼d 1963-
245 1 0 ▼a 파이썬으로 텍스트 분석하기 : ▼b 전략커뮤니케이션을 위한 파이썬 텍스트 마이닝 / ▼d 윤태일, ▼e 이수안 지음
246 1 1 ▼a Text analytics with Python
260 ▼a 서울 : ▼b 늘봄, ▼c 2018 ▼g (2019 2쇄)
300 ▼a 283 p. : ▼b 삽화, 도표 ; ▼c 22 cm
504 ▼a 참고문헌: p. 280-283
700 1 ▼a 이수안 ▼g 李修安, ▼d 1986-, ▼e
945 ▼a KLPA

소장정보

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 중앙도서관/제2자료실(3층)/ 청구기호 006.31 2018z46 등록번호 111816638 도서상태 대출중 반납예정일 2021-06-26 예약 예약가능(1명 예약중) R 서비스 M

컨텐츠정보

책소개

인문사회과학 분야에서 파이썬을 활용한 텍스트 분석에 대해서 관심이 많음에도 마땅한 책이 없는 현실적 수요에 부응하기 위해 집필하였다. 이 책은 파이썬 텍스트 분석에 앞서 선행되어야 할 부분까지 다루었다. 파이썬 설치 및 코딩하는 방법부터 시작해서, 본격적인 텍스트 분석에 앞서 꼭 알아두어야 할 통계분석을 파이썬으로 어떻게 코딩하는가를 설명했고, 이어서 방대한 빅데이터를 어디에서 어떻게 수집하는가 하는 웹 크롤링, 그리고 수집된 텍스트 데이터를 정제하는 자연어처리를 설명했다.

이러한 내용을 숙지한 후 핵심어 분석, 의미 연결망분석, 군집분석, 토픽 모델링, 단어임베딩, 감정분석 등 많이 활용되는 텍스트 분석기법을 파이썬으로 어떻게 코딩하는가를 기본 개념과 예제 중심으로 설명했다.

왜 파이썬을 활용한 텍스트 마이닝인가?
인문사회과학 분야에서 파이썬을 활용한 텍스트 분석에 대해서 관심이 많음에도 마땅한 책이 없는 현실적 수요에 부응하기 위해 이 책을 집필하게 되었다. 이 책을 집필하면서 특히 염두에 둔 사항은 파이썬 텍스트 마이닝을 하려 할 때 실질적으로 이 한 권으로 가능하도록 하자는 것이다. 기존의 텍스트 마이닝 책들은 파이썬 등 코딩에 대한 기초, 통계분석 기초, 데이터 크롤링 및 자연어 처리 부분에 대해서 별도의 선행학습을 전제로 구성되었다.
이 책에서는 파이썬 텍스트 분석에 앞서 선행되어야 할 부분까지 다루었다. 파이썬 설치 및 코딩하는 방법부터 시작해서, 본격적인 텍스트 분석에 앞서 꼭 알아두어야 할 통계분석을 파이썬으로 어떻게 코딩하는가를 설명했고, 이어서 방대한 빅데이터를 어디에서 어떻게 수집하는가 하는 웹 크롤링, 그리고 수집된 텍스트 데이터를 정제하는 자연어처리를 설명했다.
이러한 내용을 숙지한 후 핵심어 분석, 의미 연결망분석, 군집분석, 토픽 모델링, 단어임베딩, 감정분석 등 많이 활용되는 텍스트 분석기법을 파이썬으로 어떻게 코딩하는가를 기본 개념과 예제 중심으로 설명했다. 아무쪼록 이 책이 코딩에 문외한이지만 파이썬을 이용해서 텍스트 분석을 하려는 인문사회과학 분야의 연구자와 실무자들에게 도움이 되기를 바란다.

빅데이터 시대, 이제는 데이터 리터러시가 중요하다!
전통적으로 글을 읽고 쓸 줄 아는 리터러시 능력이 중요했다. 대중매체가 발달하자 미디어를 이해하고 활용할 줄 아는 미디어 리터러시(media literacy) 능력이 강조되었다. 이제 빅데이터 시대를 맞아, 데이터를 분석하고 이해하며 활용할 줄 아는 데이터 리터러시(data literacy) 능력에 대한 요구가 높아지고 있다.

데이터 리터러시의 기초는 텍스트 마이닝!
데이터의 70% 이상은 숫자로 된 정형 데이터가 아니다. 문자 및 이미지로 구성된 비정형 데이터, 즉 텍스트이다. 텍스트를 대상으로 데이터 분석기술을 활용하여 텍스트 데이터의 특징과 일정한 패턴 등을 분석함으로써 유용한 지식을 발견하는 텍스트 마이닝은 데이터 리터러시 능력의 핵심이다

텍스트 마이닝을 위한 강력한 분석 도구 파이썬!
여러 영역에 두루두루 활용되어 ‘맥가이버의 칼’로 비유되는 파이썬. 그 탁월한 범용성 때문에 최근 인기가 치솟으면서 가장 인기 있는 프로그래밍 언어로 각광받고 있다. 통계 및 데이터 분석에 강력한 효용성을 과시하던 파이썬으로 텍스트 마이닝을 자유자재로 구사한다.


정보제공 : Aladin

저자소개

윤태일(지은이)

한림대학교 광고홍보학과 교수다. 서울대학교 미학과를 졸업하고 광고대행사 한컴에서 카피라이터로 일하다가 SK텔레콤 홍보실로 옮겨 광고홍보 관리 업무를 수행했다. 그 후 미국으로 건너가 테네시대학교(University of Tennessee, Knoxville)에서 석사학위를, 미주리대학교(University of Missouri, Columbia)에서 박사학위를 받았다. 『김석년과 그의 광고시대』(2015), 『신명 커뮤니케이션』(2014) 등의 저서와 『광고와 예술』(2009), 『플랫랜드』(2009)의 번역서를 포함해 10여 권의 책을 출간했고, “When old meets new”(2017), “The border-crossing of habitus”(2011) 등 40편이 넘는 논문을 발표했다. 한국의 대표적 문화 유전자로 꼽히는 ‘신명’을 커뮤니케이션 관점에서 천착하여 자기 준거적 이론으로 정립하려는 것이 주된 연구 관심사다.

이수안(지은이)

강원대학교 SW중심대학 연구교수. ‘분산 병렬 컴퓨팅을 이용한 빅데이터의 효율적 다차원 분석’이라는 주제의 논문으로 강원대학교 대학원에서 석·박사 학위를 받았다. ㈜알티베이스에서 전문연구요원으로 일하면서 스트림 처리 엔진·인메모리 스토리지 엔진을 연구 및 개발했다. 데이터와 AI를 이용한 이로운 세상을 꿈꾸는 데이터 과학자로서, 빅 데이터, 머신러닝, 딥러닝, 실시간 데이터 처리 분야에서 50편 이상의 논문을 발표하며 실용적인 연구를 수행하고 있다. 인하대학교, 강원대학교, 한국산업기술대학교, 한림성심대학교 등 여러 대학에서 컴퓨터를 쉽게 가르치기 위해 노력하고 있다. 컴퓨터에 관심이 많은 학생들을 위한 교육용 유튜브 채널 ‘이수안컴퓨터연구소’ 또한 운영하고 있다(https://www.youtube.com/c/이수안컴퓨터연구소).

정보제공 : Aladin

목차

머리말

01. 왜 파이썬을 활용한 텍스트 마이닝인가?
1. 왜 텍스트 마이닝인가?
2. 왜 파이썬인가?
3. 파이썬으로 하는 텍스트 마이닝의 절차 및 이 책의 구성

02. 파이썬 설치하고 시작하기
1. 파이썬 설치하기
2. 파이썬 실행 방법 및 핵심 라이브러리

03. 기초 파이썬 코딩
1. 파이썬의 입력과 출력
2. 데이터의 유형과 처리
3. 제어문

04. 파이썬으로 하는 통계기초
1. 이 책에서 사용하는 데이터에 대한 설명
2. 데이터 불러오기 및 데이터 프레임 변환
3. 데이터 탐사와 통계분석 방법의 결정
4. 파이썬으로 하는 통계분석

05. 텍스트 수집하기
1. 엑셀을 활용한 데이터 수집
2. 공개 API 활용
3. 공공데이터 포털을 활용하여 데이터 수집하기
4. 한국언론진흥재단의 빅 카인즈로 언론기사 수집하기

06. 텍스트 정제하기
1. 자연어 처리의 기본개념과 절차
2. 영어 텍스트의 자연어 처리
3. 한국어 텍스트의 자연어 처리

07. 핵심어 빈도분석
1. 단순 빈도분석
2. 단어 구름으로 시각화하기
3. 어휘 빈도-문서 역빈도(TF-IDF) 분석

08. 의미 연결망분석
1. 사회(의미) 연결망분석의 기본개념
2. 의미 연결망의 속성

09. 군집분석
1. 군집분석의 기본개념
2. 비계층적 군집분석
3. 계층적 군집분석

10. 토픽 모델링과 단어임베딩
1. 토픽 모델링과 LDA의 이해
2. 단어임베딩과 Word2Vec의 이해

11. 감정분석
1. 감정분석의 기본개념
2. 감정어휘 사전을 이용한 문서 감정분석
3. 공개 API를 활용한 이미지 감정분석

12. 마무리

참고문헌

관련분야 신착자료

Baumer, Benjamin (2021)
데이터분석과인공지능활용편찬위원회 (2021)
Harrison, Matt (2021)