HOME > 상세정보

상세정보

R과 데이터 사이언스 : 비즈니스 시각으로 본 R의 실전 활용법

R과 데이터 사이언스 : 비즈니스 시각으로 본 R의 실전 활용법

자료유형
단행본
개인저자
최현희 최영랑, 저
서명 / 저자사항
R과 데이터 사이언스 : 비즈니스 시각으로 본 R의 실전 활용법 / 최현희, 최영랑 지음
발행사항
서울 :   지앤선,   2017  
형태사항
187 p. : 천연색삽화, 도표 ; 23 cm
ISBN
9791187497103
서지주기
참고문헌: p. 186-187
000 00000cam c2200205 c 4500
001 000045926952
005 20180116131459
007 ta
008 180115s2017 ulkad b 000c kor
020 ▼a 9791187497103 ▼g 93010
035 ▼a (KERIS)BIB000014643104
040 ▼a 247009 ▼c 247009 ▼d 211009
082 0 4 ▼a 005.74 ▼2 23
085 ▼a 005.74 ▼2 DDCK
090 ▼a 005.74 ▼b 2017z5
100 1 ▼a 최현희
245 1 0 ▼a R과 데이터 사이언스 : ▼b 비즈니스 시각으로 본 R의 실전 활용법 / ▼d 최현희, ▼e 최영랑 지음
260 ▼a 서울 : ▼b 지앤선, ▼c 2017
300 ▼a 187 p. : ▼b 천연색삽화, 도표 ; ▼c 23 cm
504 ▼a 참고문헌: p. 186-187
700 1 ▼a 최영랑, ▼e
945 ▼a KLPA

소장정보

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 중앙도서관/제2자료실(3층)/ 청구기호 005.74 2017z5 등록번호 111784172 도서상태 대출가능 반납예정일 예약 서비스 B M

컨텐츠정보

책소개

R의 활용을 비즈니스 문제의 해결을 목적으로 하는 독자들에게 도움을 준다. 특히 다양한 상품과 수많은 브랜드를 준비하여 고객 성향이나 니즈 변화를 반영하고 시장의 트랜드와 시즌성에 맞춰서 상품 구색을 확대하거나 감소해야 하는 유통업 비즈니스에서의 상품 추천과 같은 주제를 중심으로 서술하였다.

데이터 분석은 유통업의 상품 추천 모델링을 염두에 두고, 기초 통계부터 추천 모델링 까지를 고려한, R을 활용한 데이터 분석 절차를 구현하는 데에 초점이 맞춰져 있다.

이 책은 R의 활용을 비즈니스 문제의 해결을 목적으로 하는 독자들에게 도움을 주고자하는 목적으로 집필되었다. 특히 저자는 본 서를 다양한 상품과 수많은 브랜드를 준비하여 고객 성향이나 니즈 변화를 반영하고 시장의 트랜드와 시즌성에 맞춰서 상품 구색을 확대하거나 감소해야 하는 유통업 비즈니스에서의 상품 추천과 같은 주제를 중심으로 서술하였다.

이 책의 데이터 분석은 유통업의 상품 추천 모델링을 염두에 두고, 기초 통계부터 추천 모델링 까지를 고려한, R을 활용한 데이터 분석 절차를 구현하는 데에 초점이 맞춰져 있다.

1장은 전반적인 데이터 분석 프로세스에 대하여 설명하고, R이라는 프로그램의 사용에 어려움이 있는 독자를 위하여 R의 설치부터 R 구동 방법까지의 과정을 설명하였다. 그리고, 비즈니스 요구 사항, 데이터 탐색 결과, 기초 통계 분석 결과에 따른 파생변수를 정의하고 생성된 파생변수에 대한 장표를 만드는 방법을 기술하였다.

2장에서는 유통업의 업태와 업무 특성을 고려하여 전사 관점의 고객 세분화시 주요변수 선정 및 세분화 방안을 설명하였고, 고객 세분화 이후에 특정 목적인 상세 세분화를 기술하되, 통계 모델 방법인 인자분석, 변수 클러스터링 (hclustvar), 지금까지 문서 분류를 위하여 많이 사용되어 왔던 LDA(잠재 디리슐레 할당) 의 활용 방법을 기술하였다.

3장에서는 개인화 추천을 수행하기 위한 모델링과 이의 검증을 위한 장으로 모델링 방법으로 연관성분석, 순차패턴분석, 협업필터링, 회귀분석을 포함한 확률 예측방법 등과 같은 모델링에 대하여 기술하였다.

4장은 머신 러닝과 알고리즘이라는 제목으로, 1~3장에서 언급되었으나 상세 기술이 없었던 머신 러닝 알고리즘을 간략하게 기술하였다.


정보제공 : Aladin

저자소개

최현희(지은이)

분석기업인 데이타솔루션내 데이터부문의 수석 컨설턴트로 근무해 왔으며, 고려대학교 통계학과 박사과정을 수료하였다. 데이터 사이언티스트로서 분석 이론 및 분석이론을 실무에 적용하는 데에 필요한 올바른 데이터 수집, 저장, 분석, 정보 제공의 전반적인 과정에 큰 관심을 가지고 있다. 통계학과 전산학의 기반 지식을 활용하여 데이터 마이닝 업무를 실무에 적용함에 있어 독자들에게 도움이 되고자 IBM Korea 의 소프트웨어 연구소 근무 당시 "Intelligent Miner Application Guide(공저)", "eCRM 실무지침(공저)"을 저술한 바 있다.

최영랑(지은이)

마케팅 전공 및 MIS부전공으로 경희대학교 경영학 박사학위를 받았으며, KMAC연구위원, 한국NCR 및 한국 테라데이타(Teradata) 상무를 거치면서 현재 기업의 대용량데이터(DW)기반의 CRM 전략 수립 및 마케팅 자동화 관련 컨설팅을 수행하고 있으며 최근에는 Big Data & Mobile기반의 개인화 마케팅 컨설팅을 하고 있다. 주요 프로젝트는 백화점(현대, 갤러리아, 롯데, 신세계 등)과 대형 마트 (이마트, 롯데마트, 한화유통 등)의 국내 유통업을 중심으로 보험업(현대해상, 삼성화재, 동부화재, 신동아화재 등)과 금융업(Standard Chartered은행, 우리투자증권 등) 및 기타 삼성전자, KT&G, 철도청, CJ- CGV 등의 제조 및 서비스업과 같은 다양한 업종에서 컨설팅을 수행하였다.

정보제공 : Aladin

목차

1. R기반의 데이터 탐색 및 통계분석 
1.1 데이터 분석 프로세스 
1.1.1 데이터의 이해 
1.1.2 분석 프로세스 
1.2 R과 분석입문 
1.2.1 R의 활용 
1.2.2 데이터의 입출력 
1.2.3 데이터 구조 
1.2.4 데이터 핸들링	
1.3 데이터 탐색 
1.3.1 GIGO(garbage in garbage out) 
1.3.2 그래프를 활용한 탐색 
1.4 통계분석 
1.4.1 교차표(cross table) 
1.4.2 카이제곱 검정(Chi-square test) 
1.4.3 분산분석(ANOVA) 
1.4.4 t-검정(평균비교) 
1.5 파생변수 생성 및 분석 데이터 만들기 
1.5.1 최근성 값은 날짜로 계산하여 생성 
1.5.2 zipcode를 area code로 변경 
1.5.3 구매 시간대 구간화 

2. 고객 세분화 모델링 
2.1 고객세분화 
2.1.1 고객 가치 분석 (RFM 스코어링) 
2.1.2 구매 상품 다양성 분석 
2.1.3 서비스 경험 분석 
2.2상세 세분화(MICRO SEGMENTATION) 모델 
2.2.1 잠재 요인에 따른 변수 군집 
2.2.2 LDA(latent dirichlet allocation)의 활용 

3. 모델 구축 유형 
3.1 모델 적용 전 고려해야 할 것들 
3.1.1 모델링을 위한 변수 선택과 유의확률(p-value) 
3.1.2 변수선택을 위한 상관계수 고려 
3.1.3 변수변환 
3.1.4 변수 변환을 통한 이상치 제거 
3.1.5 이상치 검증 
3.2 모델 구축 
3.2.1 연관성(association) 분석과 순차패턴(sequential pattern) 분석 
3.2.2 협업필터링(collaborative filtering) 
3.2.3 회귀분석(regression analysis) 
3.2.4 앙상블(ensemble) 
3.2.5 Adaboost 
3.3 모형검증 

4. 머신 러닝 기술과 알고리즘 
4.1 분류 
4.1.1 지지 벡터 기계(SVM) 
4.1.2 임의 숲(random forest) 
4.1.3 로지스틱 회귀(logistic regression) 
4.2 그룹화 
4.3 차원축소 
4.3.1 주성분 분석 
4.3.2 특이값 분해(SVD) 
4.4 시계열 분석	235 

참고문헌

관련분야 신착자료

한국데이터산업진흥원 (2020)