HOME > Detail View

Detail View

R을 활용한 데이터 과학 : 데이터 불러오기, 정리하기, 변형하기, 시각화하기, 모델링하기

R을 활용한 데이터 과학 : 데이터 불러오기, 정리하기, 변형하기, 시각화하기, 모델링하기 (Loan 44 times)

Material type
단행본
Personal Author
Wickham, Hadley Grolemund, Garrett, 저 김설기, 역 최혜민, 역
Title Statement
R을 활용한 데이터 과학 : 데이터 불러오기, 정리하기, 변형하기, 시각화하기, 모델링하기 / 해들리 위컴, 개럿 그롤문드 지음 ; 김설기, 최혜민 옮김
Publication, Distribution, etc
서울 :   인사이트,   2019  
Physical Medium
xxvi, 469 p. : 천연색삽화 ; 25 cm
Series Statement
프로그래밍 인사이트
Varied Title
R for data science : import, tidy, transform, visualize, and model data
ISBN
9788966262359
General Note
색인수록  
Subject Added Entry-Topical Term
R (Computer program language) Data mining --Computer programs Information visualization --Computer programs Big data Databases
000 00000cam c2200205 c 4500
001 000045971741
005 20190225100017
007 ta
008 190222s2019 ulka 001c kor
020 ▼a 9788966262359 ▼g 93000
035 ▼a (KERIS)BIB000015021464
040 ▼a 211023 ▼c 211023 ▼d 211009
041 1 ▼a kor ▼h eng
082 0 4 ▼a 005.55 ▼a 006.312 ▼2 23
085 ▼a 005.55 ▼2 DDCK
090 ▼a 005.55 ▼b 2019
100 1 ▼a Wickham, Hadley ▼0 AUTH(211009)136127
245 1 0 ▼a R을 활용한 데이터 과학 : ▼b 데이터 불러오기, 정리하기, 변형하기, 시각화하기, 모델링하기 / ▼d 해들리 위컴, ▼e 개럿 그롤문드 지음 ; ▼e 김설기, ▼e 최혜민 옮김
246 1 9 ▼a R for data science : ▼b import, tidy, transform, visualize, and model data
260 ▼a 서울 : ▼b 인사이트, ▼c 2019
300 ▼a xxvi, 469 p. : ▼b 천연색삽화 ; ▼c 25 cm
440 0 0 ▼a 프로그래밍 인사이트
500 ▼a 색인수록
650 0 ▼a R (Computer program language)
650 0 ▼a Data mining ▼x Computer programs
650 0 ▼a Information visualization ▼x Computer programs
650 0 ▼a Big data
650 0 ▼a Databases
700 1 ▼a Grolemund, Garrett, ▼e▼0 AUTH(211009)89899
700 1 ▼a 김설기, ▼e▼0 AUTH(211009)28162
700 1 ▼a 최혜민, ▼e▼0 AUTH(211009)8892
900 1 0 ▼a 위컴, 해들리, ▼e
900 1 0 ▼a 그롤문드, 개럿, ▼e
945 ▼a KLPA

No. Location Call Number Accession No. Availability Due Date Make a Reservation Service
No. 1 Location Main Library/Monographs(3F)/ Call Number 005.55 2019 Accession No. 111805219 Availability In loan Due Date 2021-10-13 Make a Reservation Available for Reserve R Service M
No. 2 Location Main Library/Monographs(3F)/ Call Number 005.55 2019 Accession No. 111807726 Availability In loan Due Date 2021-10-16 Make a Reservation Service M
No. 3 Location Main Library/Monographs(3F)/ Call Number 005.55 2019 Accession No. 111807727 Availability In loan Due Date 2021-10-02 Make a Reservation Service M
No. 4 Location Sejong Academic Information Center/Science & Technology/ Call Number 005.55 2019 Accession No. 151345402 Availability Available Due Date Make a Reservation Service
No. Location Call Number Accession No. Availability Due Date Make a Reservation Service
No. 1 Location Main Library/Monographs(3F)/ Call Number 005.55 2019 Accession No. 111805219 Availability In loan Due Date 2021-10-13 Make a Reservation Available for Reserve R Service M
No. 2 Location Main Library/Monographs(3F)/ Call Number 005.55 2019 Accession No. 111807726 Availability In loan Due Date 2021-10-16 Make a Reservation Service M
No. 3 Location Main Library/Monographs(3F)/ Call Number 005.55 2019 Accession No. 111807727 Availability In loan Due Date 2021-10-02 Make a Reservation Service M
No. Location Call Number Accession No. Availability Due Date Make a Reservation Service
No. 1 Location Sejong Academic Information Center/Science & Technology/ Call Number 005.55 2019 Accession No. 151345402 Availability Available Due Date Make a Reservation Service

Contents information

Book Introduction

R을 활용하여 원 데이터로부터 지식과 통찰을 끌어내는, 데이터 과학의 분석 기법을 알려주는 책이다. R, RStudio와 R 패키지 모음인 tidyverse를 중심으로, 데이터 분석을 빠르고 능숙하고 재미있게 작업할 수 있도록 설명한다. 또한 데이터 과학의 전반적인 과정을 다루는 동시에 R의 주요 도구들의 사용법도 상세히 설명하고 있어, 처음R을 접하는 독자들도 이 도구들을 사용해, 데이터 과학을 빠르게 수행할 수 있도록 이끌어준다.

데이터 과학 분야의 전설 해들리 위컴의 대표작
데이터 분석 기법의 바이블!

R로 시작하는 데이터 과학의 여정

이 책은 R을 활용하여 원 데이터로부터 지식과 통찰을 끌어내는, 데이터 과학의 분석 기법을 알려주는 길잡이 책이다. R, RStudio와 R 패키지 모음인 tidyverse를 중심으로, 데이터 분석을 빠르고 능숙하고 재미있게 작업할 수 있도록 설명한다. 데이터 과학의 전반적인 과정을 다루는 동시에 R의 주요 도구들의 사용법도 상세히 설명하고 있어, 처음R을 접하는 독자들도 이 도구들을 사용해, 데이터 과학을 빠르게 수행할 수 있도록 이끌어준다.

데이터 과학자로서 사고하고 문제 해결책을 찾아가는 로드맵
데이터 과학 프로젝트의 전 과정을 단계별로 나누어 각 장마다 예제로 시작한 다음, 각절의 연습문제를 통해 학습한 내용을 확인할 수 있도록 짜여있어, 일련의 과정을 큰 그림으로 이해할 수 있게 돕는다. 이 책은 데이터 과학에 입문하는 이들에게는 훌륭한 안내서가, 이미 어느 정도 알고 있는 이들에게는 그 내용을 체계적으로 정리해 줄 핵심 활용서가 될 것이다.

* 이 책에서 다루는 내용
- 길들이기: 데이터셋을 분석에 편리한 방식으로 변형하기
- 프로그래밍: 데이터 분석 문제를 더 쉽고 명확하게 해결할 수 있는 강력한 R 도구 습득하기
- 탐색하기: 데이터를 탐색하고 가설을 생성하여 빠르게 테스트하기
- 모델링: 데이터셋에서 실제 ‘신호’를 포착하는 저차원의 요약 제공하기
- 의사소통: 설명글, 코드, 결과를 통합하는 R Markdown 배우기


Information Provided By: : Aladin

Author Introduction

해들리 위컴(지은이)

RStudio의 수석 과학자로서 30개가 넘는 R 패키지를 작성하였으며, 데이터 변형과 시각화에 관련된 도구를 개발하여 ‘John Chambers Award for Statistical Computing’을 수상하기도 하였다. 또한, 데이터 과학 분야에서 R 사용을 장려하는 작가이자 교육자인 동시에 영향력 높은 R 커뮤니티의 핵심 인물이기도 하다. 지은 책으로는 《해들리 위컴의 Advanced R》, 《R을 활용한 데이터 과학》, 《ggplot2》 등이 있다.

개럿 그롤문드(지은이)

통계학자이면서 가르치는 일도 하고 있는 RStudio의 R 개발자다. 그는 데이터과학 분야야말로 산업 분야와 학계 전반에 기여할 큰 가능성이 잠재되어 있다고 말한다. 가렛은 라이스 대학교의 해들리 위크햄 연구실에서 박사학위를 받았다. 인식론적 과정을 통해 데이터과학의 근원적인 부분에 대해 연구했고, 주의적이고 인식론적인 관심사가 어떻게 데이터분석에 영향을 주는지 알아보았다. 데이터과학을 공부하면서 그가 맛보았던 좌절감과 불필요한 과정을 다른 사람들이 겪지 않도록 돕는 일에 매우 열심이다. 박사학위 논문을 마치기도 전에 벌써 레볼루션 애널리틱스에서 잘나가는 기업들을 대상으로 R과 데이터분석을 교육하는 일을 시작했다. 그는 구글, 이베이, 로슈를 비롯한 다른 많은 기업에서 교육을 진행해왔고, 현재 RStudio를 사용하는 유용한 노하우를 더 이해하기 쉽도록 교육 커리큘럼을 개발하는 일을 한다. 교육과 관련된 일 외에도, 가렛은 임상 실험 연구, 법률 연구, 재무 분석을 하며 시간을 보낸다. 물론 R 소프트웨어도 개발 중이다. 날짜/시간 값을 파싱하고, 쉽게 다루고, 산술 연산까지 가능하게 하는 R 패키지 lubridate를 공동 개발했다. 그리고 ggplot2의 확장 패키지인 ggsubplot을 개발했다.

김설기(옮긴이)

서울대학교 통계학과에서 학부와 석사를 마치고 미국 케이스웨스턴 대학에서 생물통계 전공으로 박사학위를 받았다. 현재는 네이버에서 데이터 과학 업무를 하고 있으며, 일할 때 R과 다른 도구를 활용하고 있다.

최혜민(옮긴이)

통계학을 전공하며 자연스레 R을 활용한 시각화와 프로그래밍에 관심을 두게 되었다. 현재는 SK텔레콤에서 데이터 분석 업무를 담당하고 있으며, 데이터에서 가치 있는 정보를 발굴하고 이를 활용할 수 있는 방안에 대해 고민하고 연구하고 있다.

Information Provided By: : Aladin

Table of Contents

옮긴이의 말 
서문 

1부 탐색하기 
1장 데이터 시각화 
1.1 들어가기 
1.2 첫 단계 
1.3 심미성 매핑 
1.4 자주 일어나는 문제들 
1.5 facet 
1.6 기하 객체 
1.7 통계적 변환 
1.8 위치 조정 
1.9 좌표계 
1.10 그래프 레이어 문법 

2장 워크플로: 기초 
2.1 코딩 기초 
2.2 이름에 들어갈 것 
2.3 함수 호출하기 

3장 데이터 변형 
3.1 들어가기 
3.2 filter()로 행 필터링하기 
3.3 arrange()로 행 정렬하기 
3.4 select()로 열 선택하기 
3.5 mutate()로 새로운 변수 추가하기 
3.6 summarize()로 그룹화 요약하기 
3.7 그룹화 뮤테이트(와 필터링) 

4장 워크플로: 스크립트 
4.1 코드 실행하기 
4.2 RStudio 진단 

5장 탐색적 데이터 분석 
5.1 들어가기 
5.2 질문하기 
5.3 변동 
5.4 결측값 
5.5 공변동 
5.6 패턴과 모델 
5.7 ggplot2 표현 
5.8 더 배우기 

6장 워크플로: 프로젝트 
6.1 무엇이 진짜인가? 
6.2 분석 작업이 어디에 남아있는가? 
6.3 경로와 디렉터리 
6.4 RStudio 프로젝트 
6.5 요약 

2부 데이터 길들이기 
7장 tibble로 하는 티블 
7.1 들어가기 
7.2 티블 생성하기 
7.3 티블 vs 데이터프레임 
7.4 이전 코드와 상호작용 

8장 readr로 하는 데이터 불러오기 
8.1 들어가기 
8.2 시작하기 
8.3 벡터 파싱하기 
8.4 파일 파싱하기 
8.5 파일에 쓰기 
8.6 기타 데이터 유형 

9장 tidyr로 하는 타이디 데이터 
9.1 들어가기 
9.2 타이디 데이터 
9.3 Gather와 Spread 
9.4 Separate와 Unite 
9.5 결측값 
9.6 사례연구 
9.7 타이디하지 않은 데이터 

10장 dplyr로 하는 관계형 데이터 
10.1 들어가기 
10.2 nycflights13 
10.3 키 
10.4 뮤테이팅 조인 
10.5 필터링 조인 
10.6 조인 문제 
10.7 집합 연산 

11장 stringr로 하는 문자열 
11.1 들어가기 
11.2 문자열 기초 
11.3 정규표현식을 이용한 패턴 매칭 
11.4 도구 
11.5 기타 패턴 유형 
11.6 정규표현식의 기타 용도 
11.7 stringi 

12장 forcats로 하는 팩터형 
12.1 들어가기 
12.2 팩터형 생성하기 
12.3 종합사회조사 
12.4 팩터 순서 수정하기 
12.5 팩터 레벨 수정하기 

13장 lubridate로 하는 날짜와 시간 
13.1 들어가기 
13.2 날짜/시간 생성 
13.3 데이트-타임형 구성요소 
13.4 시간 범위 
13.5 시간대 

3부 프로그램 
14장 magrittr로 하는 파이프 
14.1 들어가기 
14.2 파이프 대안 
14.3 파이프를 사용하지 않아야 할 경우 
14.4 magrittr의 기타 도구 

15장 함수 
15.1 들어가기 
15.2 함수를 언제 작성해야 하나? 
15.3 함수는 사람과 컴퓨터를 위한 것 
15.4 조건부 실행 
15.5 함수 인수 
15.6 반환값 
15.7 환경 

16장 벡터 
16.1 들어가기 
16.2 벡터의 기초 
16.3 원자 벡터의 주요 유형 
16.4 원자 벡터 이용하기 
16.5 재귀 벡터(리스트) 
16.6 속성 
16.7 확장 벡터 

17장 purrr로 하는 반복작업 
17.1 들어가기 
17.2 For 루프 
17.3 For 루프 변형 
17.4 For 루프 vs 함수형 
17.5 맵 함수 
17.6 실패 다루기 
17.7 다중 인수로 매핑 
17.8 워크 
17.9 For 루프의 기타 패턴 

4부 모델 
18장 modelr을 이용한 모델의 기초 
18.1 들어가기 
18.2 간단한 모델 
18.3 모델 시각화하기 
18.4 수식과 모델 모음 
18.5 결측값 
18.6 다른 모델 모음 

19장 모델 생성 
19.1 들어가기 
19.2 낮은 품질의 다이아몬드가 더 비싼 이유는 무엇인가? 
19.3 일일 운항 횟수에 어떤 영향이 있는가? 
19.4 모델에 대해 더 학습하기 

20장 purrr와 broom을 이용한 많은 모델 
20.1 들어가기 
20.2 gapminder 데이터 
20.3 리스트-열(List-column) 
20.4 리스트-열 생성하기 
20.5 리스트-열 단순화하기 
20.6 broom으로 타이디 데이터 만들기 

5부 의사소통 
21장 R 마크다운 
21.1 들어가기 
21.2 R 마크다운 기초 
21.3 마크다운으로 텍스트 서식 지정하기 
21.4 코드 청크 
21.5 문제 해결 
21.6 YAML 헤더 
21.7 더 배우기 

22장 그래프를 통한 의사소통 
22.1 들어가기 
22.2 라벨 
22.3 주석 
22.4 스케일 
22.5 확대ㆍ축소 
22.6 테마 
22.7 플롯 저장하기 
22.8 더 배우기 

23장 R 마크다운 유형들 
23.1 들어가기 
23.2 출력 옵션 
23.3 문서 
23.4 노트북 
23.5 프리젠테이션 
23.6 대시보드 
23.7 대화형 동작 
23.8 웹사이트 
23.9 기타 유형 
23.10 더 배우기 

24장 R 마크다운 워크플로 

찾아보기

New Arrivals Books in Related Fields

Ramamurthy, Bina (2021)
윤관식 (2020)