HOME > 상세정보

상세정보

빅데이터 분석과 R 활용

빅데이터 분석과 R 활용 (2회 대출)

자료유형
단행본
개인저자
윤철호
서명 / 저자사항
빅데이터 분석과 R 활용 / 윤철호 지음
발행사항
파주 :   생능,   2021  
형태사항
459 p. : 삽화 : ; 24 cm
ISBN
9791186689363
일반주기
부록: datasets 패키지의 데이터 셋  
서지주기
참고문헌(p. 448-455)과 색인수록
000 00000nam c2200205 c 4500
001 000046083978
005 20210628102551
007 ta
008 210625s2021 ggka b 001c kor
020 ▼a 9791186689363 ▼g 93000
040 ▼a 211009 ▼c 211009 ▼d 211009
082 0 4 ▼a 005.74 ▼2 23
085 ▼a 005.74 ▼2 DDCK
090 ▼a 005.74 ▼b 2021z1
100 1 ▼a 윤철호
245 1 0 ▼a 빅데이터 분석과 R 활용 / ▼d 윤철호 지음
260 ▼a 파주 : ▼b 생능, ▼c 2021
300 ▼a 459 p. : ▼b 삽화 : ; ▼c 24 cm
500 ▼a 부록: datasets 패키지의 데이터 셋
504 ▼a 참고문헌(p. 448-455)과 색인수록
945 ▼a KLPA

소장정보

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 005.74 2021z1 등록번호 121257563 도서상태 대출중 반납예정일 2021-12-13 예약 예약가능 R 서비스 M

컨텐츠정보

책소개

정형 데이터 분석, 비정형 데이터 분석, 데이터 시각화를 모두 포함하는 포괄적인 관점에서 R을 활용한 빅데이터 분석 방안을 소개하고 있다. 분석 도구인 R의 기초, R 프로그래밍과 그래프 작성 방법 그리고 빅데이터 수집 기술인 웹 스크래핑(web scraping), 오픈 API 등을 포함한다.

기술통계 및 추론통계, 데이터마이닝, 텍스트마이닝, 오피니언마이닝 그리고 소셜네트워크 분석 등의 다양한 빅데이터 분석 기법들을 다루고 있으며, 단순 베이즈 분류, K-최근접 이웃 분석. 서포트 벡터 머신, 의사결정나무 분석, 신경망 분석, 연관 분석, 계층적 군집 분석, K-평균 군집 분석 등의 다양한 데이터마이닝 알고리즘에 대한 실습도 다룬다.

<빅데이터 분석과 R 활용>은 대학의 빅데이터 분석 교육을 위한 학습 교재로써 입문자 수준의 학생들이 R을 활용하여 빅데이터 분석을 실무적으로 수행할 수 있는 능력을 배양시키는 데 초점을 맞추고 있다.

 이 책은 정형 데이터 분석, 비정형 데이터 분석, 데이터 시각화를 모두 포함하는 포괄적인 관점에서 R을 활용한 빅데이터 분석 방안을 소개하고 있다.
 이 책은 분석 도구인 R의 기초, R 프로그래밍과 그래프 작성 방법 그리고 빅데이터 수집 기술인 웹 스크래핑(web scraping), 오픈 API 등을 포함하고 있다.
 이 책은 기술통계 및 추론통계, 데이터마이닝, 텍스트마이닝, 오피니언마이닝 그리고 소셜네트워크 분석 등의 다양한 빅데이터 분석 기법들을 다루고 있다.
 이 책은 단순 베이즈 분류, K-최근접 이웃 분석. 서포트 벡터 머신, 의사결정나무 분석, 신경망 분석, 연관 분석, 계층적 군집 분석, K-평균 군집 분석 등의 다양한 데이터마이닝 알고리즘에 대한 실습을 다루고 있다.
 이 책은 막대그래프, 파이 차트와 같은 기본 시각화 기술은 물론 트리 맵, 히트 맵, 버블 차트, 체르노프 페이스, 인터랙티브 그래프(Interactive Graph) 그리고 지도 맵핑 등의 다양한 고급 시각화 기술들을 다루고 있다.
 이 책은 상기와 같은 다양한 빅데이터 분석을 통계학이나 프로그래밍에 대한 사전 지식이 없는 학습자들도 따라 하는 식으로 수행할 수 있도록 작성되었다.
 이 책은 다수의 현실 세계의 실무 예제를 제공하고 있어 학습자들의 흥미를 유도할 수 있도록 설계되었다.

이 책이 대학의 학부 및 대학원생들의 빅데이터 분석 실무 교육을 위한 목적으로 작성되었으나, R을 활용한 빅데이터 분석을 체계적으로 학습하려는 분들에게도 전문 도서로써 충분한 역할을 할 수 있다.

이 책의 구성 및 내용

본 책 <빅데이터 분석과 R 활용>은 빅데이터 분석에 대한 포괄적인 이해와 실무 역량을 제공하기 위하여 빅데이터와 R에 대한 소개와 빅데이터 분석 기법들인 정형 데이터 분석, 비정형 데이터 분석, 데이터 시각화 기법에 대한 4부 13장으로 구성되어 있다.

제1부는 ‘빅데이터와 R’ 소개 부분으로 빅데이터의 전반적인 소개와 R 기초 및 프로그래밍을 다루고 있다. 제2부는 ‘정형 데이터 분석’ 부분으로 데이터 기술통계, 데이터 추론통계 그리고 데이터마이닝 분석을 다루고 있다. 제3부는 ‘비정형 데이터 분석’ 부분으로 텍스트마이닝, 오피니언마이닝 그리고 소셜네트워크 분석을 다루고 있다. 마지막 제4부는 ‘데이터 시각화’ 부분으로 다양한 고급 시각화 분석 기법들을 다루고 있다.

1장. 빅데이터
빅데이터에 대한 전반적인 소개 부분으로 빅데이터의 정의, 특징 및 종류와 빅데이터 분석을 위한 기반 기술들을 소개하고 있다. 또한 빅데이터 분석에서의 R과 파이썬의 기능상의 비교도 다루고 있다.

2장. R 기초
R 활용을 위한 기초 부분으로 R의 설치 및 운영환경 설정 그리고 R 기초 사용을 위한 수치계산 기능, 변수 그리고 자료구조에 대하여 다루고 있다.

3장. R 프로그래밍과 그래프
R 프로그래밍과 그래프 작성 방법에 대한 부분으로 R 프로그래밍 개념과 산술ㆍ비교ㆍ논리 연산, 조건ㆍ반복문, 사용자 정의 함수 그리고 기본적으로 제공되는 다양하고 기초적인 R 그래프 작성 방법에 대하여 다루고 있다.

4장. R 자료관리 및 수집
R 자료관리 및 R을 이용한 빅데이터 자료 수집에 대한 부분으로 외부 데이터 불러오기, 데이터 탐색, 데이터 분리 및 병합과 같은 자료관리와 파일 데이터 셋, 웹 스크래핑(web scraping) 및 오픈 API를 이용하여 빅데이터를 수집하는 방법들에 대하여 다루고 있다.

5장. 데이터 기술통계
R을 활용하여 정형 데이터에 대한 기술통계 분석에 대한 부분으로 전통적인 기술통계 기법인 빈도분석, 기술 분석, 교차분석, 다차원 척도법과 최근 빅데이터에 대한 효과적인 기술 분석을 위하여 활용되고 있는 그룹 분석과 탐색적 자료 분석 도구들에 대하여 다루고 있다.

6장. 데이터 추론통계
R을 활용하여 정형 데이터에 대한 추론통계 분석에 대한 부분으로 평균 차이 분석, 비율 차이 분석, 분산분석과 변수 간의 관계성에 초점을 맞추고 있는 상관관계 분석, 회귀분석 방법에 대하여 다루고 있다.

7장. 데이터마이닝(Ⅰ)
R을 활용하여 정형 데이터에 대한 데이터마이닝의 소개 및 분류 분석(classification) 대한 부분으로 데이터마이닝에 대한 전반적인 소개와 주요 데이터마이닝 기법인 단순 베이즈 분석, K-최근접 이웃, 서포트 벡터 머신, 의사결정나무 및 신경망을 이용하여 분류 분석을 수행하는 방법에 대하여 다루고 있다.

8장. 데이터마이닝(Ⅱ)
R을 활용하여 정형 데이터에 대한 예측 분석, 연관 분석, 군집 분석에 대한 부분으로 의사결정나무와 신경망을 이용한 예측 분석 방법과 장바구니 분석으로 잘 알려진 연관 분석, 그리고 군집 분석 기법들인 계층적인 군집 분석과 K-평균 군집 분석을 수행하는 방법에 대하여 다루고 있다.

9장. 텍스트마이닝
R을 활용하여 비정형 데이터 분석인 텍스트마이닝에 대한 부분으로 텍스트마이닝 필수 기술인 자연어 처리 기술과 벡터 공간 모델링을 소개하고 주요 텍스트마이닝 기법들인 주제어 분석, 동시 출현 단어 분석, 토픽 모델링 등을 수행하는 방법에 대하여 다루고 있다.

10장. 오피니언마이닝
R을 활용하여 비정형 데이터 분석인 오피니언마이닝에 대한 부분으로 전통적인 감성 사전 기반의 오피니언 마이닝과 기계학습 기반의 오피니언마이닝을 수행하는 방법에 대하여 다루고 있다.

11장. 소셜네트워크 분석
소셜네트워크 분석에 대한 부분으로 R을 활용하여 원-모드 및 투-모드 소셜네트워크 분석하는 방법과 전문 소셜네트워크 분석 도구인 Gephi와 연계하여 소셜네트워크 분석을 수행하는 방법에 대하여 다루고 있다.

12장. 데이터 시각화
데이터의 시각화에 대한 부분으로 데이터 시각화에 대한 주요 개념에 대한 소개와 데이터 시각화를 위하여 R에서 가장 많이 사용되고 있는 ggplot 패키지를 이용하여 다양한 그래프를 작성하는 방법에 대하여 다루고 있다.

13장. 고급 데이터 시각화
R을 활용한 고급 데이터 시각화에 대한 부분으로 다양한 그래픽 패키지를 이용하여 트리 맵, 버블 차트, 체르노프 페이스, 히트 맵 그리고 지도 맵핑과 같은 고급 데이터 시각화 방법에 대하여 다루고 있다. 또한 웹과 연계된 인터랙티브 그래프 작성 방법에 대하여도 다루고 있다.


정보제공 : Aladin

저자소개

윤철호(지은이)

현재 국립목포대학교 경영학과 교수로 재직 중이며, R 프로그램을 근간으로 개발한 클라우드 사회과학연구 자동화(social science research automation, SSRA) 사이트를 운영하고 있다. Information & Management, Journal of Computer Information Systems, Journal of Business Ethics, Electronic Commerce Research and Applications, Computers in Human Behavior, Behaviour & Information Technology, Journal of Organizational Computing and Electronic Commerce, Journal of Information Systems Education, Information Technology & People, Information Technology and Management 등 수십여 편의 국제 저명 학술지와 경영학 연구, Asia Pacific Journal of Information Systems, 한국경영과학회지, 경영과학, Information Systems Reviews 등의 국내 학술지에 다수의 논문을 게재한 바 있으며, 『Concepts in Computer & Management』(한경사), 『SAP ERP를 중심으로 한 ERP 개론』(생능), 『R을 이용한 통계분석』(비앤엠북스) 등의 저서가 있다.

정보제공 : Aladin

목차

제1부 빅데이터와 R

Chapter 1 빅데이터
1.1 빅데이터의 정의
1.1.1 빅데이터란?
1.1.2 빅데이터 특징
1.1.3 빅데이터 종류
1.2 빅데이터 분석기술
1.2.1 빅데이터 분석 기법
1.2.2 빅데이터 분석 인프라 기술
1.3 빅데이터 분석과 R
1.3.1 R 개요
1.3.2 R의 탄생 및 발전 과정
1.3.3 R의 특징
1.3.4 R의 활용
1.3.5 빅데이터 분석에서 R과 파이썬의 비교
연습문제

Chapter 2 R 기초
2.1 R 설치 및 실행
2.1.1 윈도우 버전 R 설치 파일
2.1.2 R 실행
2.1.3 R 사용자 인터페이스
2.1.4 Rtools 소프트웨어 설치
2.2 R 운영환경 구성
2.2.1 R 운영환경 설정
2.2.2 R 패키지 설치 및 사용
2.2.3 빅데이터 분석을 위한 주요 R 패키지
2.3 R 기초
2.3.1 수치계산 기능
2.3.2 변수의 할당
2.3.3 데이터의 유형
2.3.4 함수
2.3.5 자료구조
연습문제

Chapter 3 R 프로그래밍과 그래프
3.1 R 프로그래밍
3.1.1 R 프로그래밍 개념
3.1.2 산술·비교·논리 연산
3.1.3 조건·반복문
3.1.4 R 사용자 정의 함수
3.2 R 그래프
3.2.1 R 그래프 개요
3.2.2 그래프 함수
3.2.3 기본 그래프 작성
3.2.4 그래프의 저장
연습문제

Chapter 4 R 자료관리 및 수집
4.1 R 자료관리
4.1.1 R 데이터 생성하기
4.1.2 외부 데이터 불러오기
4.1.3 데이터 탐색
4.1.4 데이터 관리
4.1.5 데이터 외부로 내보내기
4.1.6 R 내장 데이터 사용하기
4.2 빅데이터 자료수집
4.2.1 빅데이터 제공 기관
4.2.2 파일 데이터 셋 자료수집
4.2.3 웹 스크래핑 자료수집
4.2.4 오픈 API 기반 자료수집
연습문제

제2부 정형 데이터 분석

Chapter 5 데이터 기술통계
5.1 기술통계 개요
5.1.1 주요 기술통계 기법
5.1.2 통계 자료의 종류
5.2 빈도분석
5.2.1 빈도분석 예시
5.2.2 빈도분석 실행
5.3 기술 분석
5.3.1 기술 분석 예시
5.3.2 기술 분석 실행
5.4 교차분석
5.4.1 교차분석 예시
5.4.2 교차분석 실행
5.5 다차원 척도법
5.5.1 다차원 척도법 예시
5.5.2 다차원 척도법 실행
5.6 그룹 분석
5.6.1 그룹 분석 예시
5.6.2 그룹 분석 실행
5.7 탐색적 데이터 분석 도구
5.7.1 박스 플롯
5.7.2 산포도
5.7.3 줄기 잎 도표
5.7.4 Q-Q 도표
연습문제

Chapter 6 데이터 추론통계
6.1 추론통계 개요
6.1.1 주요 추론통계 분석 기법
6.1.2 추론통계의 통계적 추정 및 가설검정
6.2 평균 차이 분석
6.2.1 평균 차이 분석 예시
6.2.2 독립 표본 평균 차이 분석 실행
6.2.3 대응 표본 평균 차이 분석 실행
6.3 비율 차이 분석
6.3.1 비율 차이 분석 예시
6.3.2 비율 차이 분석 실행
6.4 분산분석
6.4.1 분산분석 예시
6.4.2 일원 배치 분산분석 실행
6.4.3 반복측정 분산분석 실행
6.5 상관관계 분석
6.5.1 상관관계 분석 예시
6.5.2 상관관계 분석 실행
6.6 회귀분석
6.6.1 회귀분석 예시
6.6.2 회귀분석 실행
연습문제

Chapter 7 데이터마이닝(Ⅰ)
7.1 데이터마이닝 개요
7.1.1 데이터마이닝 과정
7.1.2 데이터마이닝 분석 유형
7.1.3 데이터마이닝 주요 기법
7.1.4 기계학습과 데이터마이닝
7.1.5 데이터마이닝 활용
7.2 분류 분석
7.2.1 분류 분석의 개요
7.2.2 분류 분석의 절차
7.2.3 분류 분석을 위한 예시 데이터
7.2.4 단순 베이즈 분류
7.2.5 K-최근접 이웃 분석
7.2.6 서포트 벡터 머신
7.2.7 의사결정나무 분석
7.2.8 신경망 분석
7.2.9 비정규 자료 분류 분석
연습문제

Chapter 8 데이터마이닝(Ⅱ)
8.1 예측 분석
8.1.1 예측 분석의 개요
8.1.2 연속형 변수의 예측 분석의 절차
8.1.3 연속형 변수의 예측 분석을 위한 예시 데이터
8.1.4 연속형 변수 예측 의사결정나무 분석
8.1.5 연속형 예측 신경망 분석
8.1.6 이항형 변수의 예측 분석의 절차
8.1.7 이항형 예측 분석을 위한 예시 데이터
8.1.8 이항형 예측 의사결정나무 분석
8.2 연관 분석
8.2.1 연관 분석의 개요
8.2.2 연관 분석의 절차
8.2.3 연관 분석의 예시
8.2.4 연관 분석의 실행
8.3 군집 분석
8.3.1 군집 분석의 개요
8.3.2 계층적 군집 분석
8.3.3 K-평균 군집 분석
연습문제

제3부 비정형 데이터 분석

Chapter 9 텍스트마이닝
9.1 텍스트마이닝 개요
9.1.1 텍스트마이닝 과정
9.1.2 텍스트마이닝 기법
9.1.3 텍스트마이닝 주요 기술
9.2 주제어 분석
9.2.1 주제어 분석 개요
9.2.2 주제어 분석 절차
9.2.3 주제어 분석 예시 데이터
9.2.4 주제어 분석 실행
9.3 동시 출현 단어 분석
9.3.1 동시 출현 단어 분석 개요
9.3.2 동시 출현 단어 분석 절차
9.3.3 동시 출현 단어 분석 예시 데이터
9.3.4 동시 출현 단어 분석 실행
9.4 토픽 모델링
9.4.1 토픽 모델링 개요
9.4.2 토픽 모델링 절차
9.4.3 토픽 모델링 예시 데이터
9.4.4 토픽 모델링 실행
연습문제

Chapter 10 오피니언마이닝
10.1 오피니언마이닝
10.1.1 오피니언마이닝 개요
10.1.2 오피니언마이닝 과정
10.2 감성 분석
10.2.1 감성 분석의 개요
10.2.2 감성 사전
10.2.3 감성 분석의 절차
10.2.4 감성 분석 예시 데이터
10.2.5 감성 분석 실행
10.3 기계학습 기반 감성 분석
10.3.1 기계학습 기반 감성 분석의 개요
10.3.2 기계학습 기반의 감성 분석의 절차
10.3.3 기계학습 기반의 감성 분석 예시 데이터
10.3.4 기계학습 기반의 감성 분석 실행
연습문제

Chapter 11 소셜네트워크 분석
11.1 소셜네트워크 분석 개요
11.1.1 소셜네트워크 분석 과정
11.1.2 네트워크 분석
11.1.3 네트워크 분석 지표
11.1.4 소셜네트워크 분석 기법
11.2 원-모드 소셜네트워크 분석
11.2.1 원-모드 소셜네트워크 분석 개요
11.2.2 원-모드 소셜네트워크 분석 실행 절차
11.2.3 원-모드 소셜네트워크 예시 데이터
11.2.4 원-모드 소셜네트워크 분석 실행
11.2.5 소셜네트워크 시각화 분석 전용 프로그램 활용
11.3 투-모드 소셜네트워크 분석
11.3.1 투-모드 소셜네트워크 분석 개요
11.3.2 투-모드 소셜네트워크 분석 실행 절차
11.3.3 투-모드 소셜네트워크 예시 데이터
11.3.4 투-모드 소셜네트워크 분석 실행
연습문제

제4부 데이터 시각화

Chapter 12 데이터 시각화
12.1 데이터 시각화
12.1.1 데이터 시각화 개요
12.1.2 데이터 시각화 유형
12.2 빅데이터 시각화 기술
12.2.1 시간 시각화
12.2.2 분포 시각화
12.2.3 관계 시각화
12.2.4 비교 시각화
12.2.5 공간 시각화
12.3 R 데이터 시각화 분석
12.3.1 ggplot2 패키지
12.3.2 ggplot2 패키지를 이용하는 시각화
연습문제

Chapter 13 고급 데이터 시각화
13.1 R 고급 시각화 분석
13.1.1 다양한 그래픽 패키지를 이용하는 시각화
13.1.2 인터랙티브 그래프
13.2 R 지도 맵핑 시각화
13.2.1 R에서의 지도 맵핑 시각화 방법
13.2.2 SHP 파일을 이용한 지도 맵핑
13.2.3 구글맵을 이용한 지도 맵핑
연습문제

부록 datasets 패키지의 데이터 셋

관련분야 신착자료

Ramamurthy, Bina (2021)
윤관식 (2020)