HOME > 상세정보

상세정보

R을 이용한 웹 크롤링과 텍스트 분석

자료유형
단행본
개인저자
서명 / 저자사항
R을 이용한 웹 크롤링과 텍스트 분석 / 권상희 지음
발행사항
서울 : 컴원미디어, 2020
형태사항
388 p. : 천연색삽화 ; 26 cm
ISBN
9791190444316
일반주기
웹 크롤링을 통한 텍스트 분석 처리기법과 시각화를 R 프로그래밍 코드와 실행결과로 제시
서지주기
참고문헌과 색인수록
000 00000cam c2200205 c 4500
001 000046055042
005 20201111144721
007 ta
008 201111s2020 ulka b 001c kor
020 ▼a 9791190444316 ▼g 93070
035 ▼a (KERIS)BIB000015674754
040 ▼a 241002 ▼c 241002 ▼d 211009
082 0 4 ▼a 006.312 ▼2 23
085 ▼a 006.312 ▼2 DDCK
090 ▼a 006.312 ▼b 2020z5
100 1 ▼a 권상희
245 1 0 ▼a R을 이용한 웹 크롤링과 텍스트 분석 / ▼d 권상희 지음
260 ▼a 서울 : ▼b 컴원미디어, ▼c 2020
300 ▼a 388 p. : ▼b 천연색삽화 ; ▼c 26 cm
500 ▼a 웹 크롤링을 통한 텍스트 분석 처리기법과 시각화를 R 프로그래밍 코드와 실행결과로 제시
504 ▼a 참고문헌과 색인수록
945 ▼a KLPA

소장정보

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 중앙도서관/제2자료실(3층)/ 청구기호 006.312 2020z5 등록번호 111835759 도서상태 대출중 반납예정일 2021-02-22 예약 예약가능(2명 예약중) R 서비스 M

컨텐츠정보

책소개

R-Studio를 활용하여 기본적인 통계분석, 시각화 하는 기초능력을 키우는 데 도움을 준다. 웹 크롤링을 통해 데이터를 수집하고 R을 이용해 텍스트를 분석하는 R 강의 교재로 활용될 수 있다. R을 이용한 텍스트마이닝은 대용량 텍스트를 분석하는 도구로, 대용량 텍스트로부터 유용한 정보를 추출한다.

텍스트마이닝은 뉴스, 소셜미디어, 논문 등을 분석해 현상을 이해하고, 이론을 검증하는데 목적이 있다. 은 실행과정에서의 오류를 최소화하기 위해 웹 크롤링과 텍스트 분석 처리기법들을 최신 버전으로 실행한 결과를 제시하고 있다.

통계분석 시각화능력을 키우기

은 R-Studio를 활용하여 기본적인 통계분석, 시각화 하는 기초능력을 키우는 데 도움을 준다. 이 책은 웹 크롤링을 통해 데이터를 수집하고 R을 이용해 텍스트를 분석하는 R 강의 교재로 활용될 수 있다.

R을 이용한 텍스트마이닝은 대용량 텍스트를 분석하는 도구로, 대용량 텍스트로부터 유용한 정보를 추출한다. 텍스트마이닝은 뉴스, 소셜미디어, 논문 등을 분석해 현상을 이해하고, 이론을 검증하는데 목적이 있다. 은 실행과정에서의 오류를 최소화하기 위해 웹 크롤링과 텍스트 분석 처리기법들을 최신 버전으로 실행한 결과를 제시하고 있다.

1장, 2장은 R 프로그램의 기본 원리를 이해할 수 있도록 구성되어 있다. 3장은 R 프로그램의 기초 사용법을 익힐 수 있게 하고, 4장으로 기본적인 객체지향형 데이터 구조를 이해할 수 있다. 5장의 R기초통계는 통계의 이론적인 접근과 더불어 데이터에 대한 기술통계량과 중급통계를 실행할 수 있는 능력을 끌어올릴 수 있게 하고, 6장에서는 다양한 데이터를 그래프로 표현하여 시각화 하고, 데이터에 나타난 현상과 이론적 패턴을 찾아내는 방법을 학습한다. 이 책의 핵심은 7장의 R을 이용한 웹 크롤링과 8장의 텍스트 분석이다. 그렇기 때문에 이 책은 다양한 문서를 스크렙핑 또는 크롤링하는 역량을 익힐 수 있도록 많은 사례를 포함하고 있다.

저자는 R의 동향을 파악하고 상용 프로그램과 연결하는 연구를 통해 연구결과를 저널에 발표해왔다. 저자는 초기 R수용과정 경험을 이 책에 반영하고자 노력해왔다. 인공지능 시대, 머신러닝이 중요해진 이 시기에 이 머신러닝 알고리즘 구현과 텍스트분석을 해내는 학생들을 양성하고 더 나아가 인공지능 연구에 기여가 되기를 기대한다.


정보제공 : Aladin

저자소개

권상희(지은이)

성균관대학교 미디어커뮤니케이션학과 교수이다. 사이버커뮤니케이션과 고급 커뮤니케이션 통계분석론을 강의하고 있다. 소셜 미디어, 미디어이론을 연구하고, 빅(big)데이터, 소셜 미디어, AI, 미디어이론에 관심을 두고 있다. 서울대학교 언론정보학과에서 학사, 캘리포니아 주립대 Radio-Television-Film학과에서 석사, 남일리노이 대에서 Mass Communication & Media Arts로 박사를 마쳤다. (주)삼성전자 홍보실과 아칸사스 주립대 신문방송학과에 조교수로 재직했으며, 캠브리지 대에서 연구년을 보냈다. 역서로 <사이버 커뮤니케이션 이론>, <디지털 시대 미디어 임팩트>, <미디어의 경쟁과 공존>, <아나운싱 : 디지털시대 방송 커뮤니케이션>과 저서로 <컨버전스와 미디어의 세계>, <디지털 문화론>이 있다. 주요 연구로 상호작용 차원연구, 미디어 적소연구, 인터넷 미디어 뉴스형식 연구, 인터넷 발달 보도 프레임 연구, 뉴 할리우드 영화의 포스트모더니즘 연구, 인터넷 광고 효과 모형, 온라인 저널리즘 기사구성방식 비교, 뉴 미디어시대 방송, 통신 융합 연구, 생명공학 보도경향 연구 등이 있다.

정보제공 : Aladin

목차

머리말

Chapter 1 R 프로그램 설치 및 환경설정
1.1 R 소개
1.2 R 프로그램 설치하기
1.3 R 프로그램의 구성
참고문헌

Chapter 2 R-Studio 프로그램 설치 및 환경설정
2.1 R-Studio 소개
2.2 R-Studio 설치하기
2.3 RStudio 프로그램 실행하기
2.4 R-Studio 프로그램의 환경 설정하기
2.5 R-Studio 프로그램의 기초 활용
참고문헌

Chapter 3 R 기초 사용법
3.1 기초 사용법
3.2 연산자 소개
3.3 데이터 유형
참고문헌

Chapter 4 데이터 종류 및 활용
4.1 데이터 형태
4.2 외부 데이터 읽어오기
4.3 데이터 추출하기
4.4 데이터 합치기
참고문헌

Chapter 5 기초통계
5.1 기초통계 및 T-test
5.2 분산분석
5.3 회귀분석
참고문헌

Chapter 6 그래프 사용 및 데이터 시각화
6.1 일변량 범주형 자료 시각화
6.2 일변량 연속형 자료 시각화
6.3 이변량 범주형 자료 시각화
6.4 이변량 연속형 자료 시각화
6.5 기타 그래프
참고문헌

Chapter 7 웹(web) 크롤링 이론과 실습
7.0 웹(web) 스크래핑 이해하기
7.1 커뮤니티 게시판 본문 수집 예제
7.2 커뮤니티 댓글 수집 예제
7.3 대형 포털 쇼핑 상품 정보, 평점, 리뷰 수집 예제
7.4 모바일 네이버 카페 본문 수집 예제
7.5 PC 네이버 블로그 본문 수집 예제
7.6 PC 네이버 뉴스 본문, 반응수, 댓글 수집 예제
참고문헌 240

Chapter 8 텍스트 분석
8.1 텍스트 분석의 정의와 데이터 처리
8.2 텍스트 분석을 위한 전처리 학습
8.3 뉴스 데이터수집과 분석
8.4 텍스트 분석 및 결과 제시
8.5 기계학습을 통한 텍스트 분석
참고문헌

참고문헌 및 추천 자료
색인

관련분야 신착자료

Liu, Zhiyuan, (Computer science and technology) (2020)