HOME > 상세정보

상세정보

하이브 완벽 가이드 : 하둡을 이용한 SQL 기반 빅데이터 분석 도구 (20회 대출)

자료유형
단행본
개인저자
Capriolo, Edward Wampler, Dean, 저 Rutherglen, Jason, 저 오세봉, 역 박영근, 역 양권국, 역 우성한, 역 이종희, 역 이준섭, 역 장정호, 역 김민우, 역
서명 / 저자사항
하이브 완벽 가이드 : 하둡을 이용한 SQL 기반 빅데이터 분석 도구 / 에드워드 카프리올로, 딘 웜플러, 제이슨 러더글렌 지음 ; 오세봉 [외] 옮김
발행사항
서울 :   한빛미디어,   2013  
형태사항
504 p. : 삽화 ; 24 cm
원표제
Programming Hive
ISBN
9788968480072
일반주기
공역자: 박영근, 양권국, 우성한, 이종희, 이준섭, 장정호, 김민우  
부록: A. 오라클 마이그레이션, B. 오픈소스 R하이브, C. 용어  
서지주기
참고문헌(p. 491-493)과 색인수록
일반주제명
Hive QL (Computer program language) Data warehousing Database management
000 01593camcc2200493 c 4500
001 000045796904
005 20140422092049
007 ta
008 140219s2013 ulka b 001c kor
020 ▼a 9788968480072 ▼g 13000
035 ▼a (KERIS)BIB000013127877
040 ▼a 247017 ▼d 211009
041 1 ▼a kor ▼h eng
082 0 4 ▼a 005.745 ▼a 005.75 ▼2 23
085 ▼a 005.745 ▼2 DDCK
090 ▼a 005.745 ▼b 2013
100 1 ▼a Capriolo, Edward
245 1 0 ▼a 하이브 완벽 가이드 : ▼b 하둡을 이용한 SQL 기반 빅데이터 분석 도구 / ▼d 에드워드 카프리올로, ▼e 딘 웜플러, ▼e 제이슨 러더글렌 지음 ; ▼e 오세봉 [외] 옮김
246 1 9 ▼a Programming Hive
260 ▼a 서울 : ▼b 한빛미디어, ▼c 2013
300 ▼a 504 p. : ▼b 삽화 ; ▼c 24 cm
500 ▼a 공역자: 박영근, 양권국, 우성한, 이종희, 이준섭, 장정호, 김민우
500 ▼a 부록: A. 오라클 마이그레이션, B. 오픈소스 R하이브, C. 용어
504 ▼a 참고문헌(p. 491-493)과 색인수록
630 0 0 ▼a Apache Hive (Data warehouse system)
630 0 0 ▼a Apache Hadoop
650 0 ▼a Hive QL (Computer program language)
650 0 ▼a Data warehousing
650 0 ▼a Database management
700 1 ▼a Wampler, Dean, ▼e
700 1 ▼a Rutherglen, Jason, ▼e
700 1 ▼a 오세봉, ▼e
700 1 ▼a 박영근, ▼e
700 1 ▼a 양권국, ▼e
700 1 ▼a 우성한, ▼e
700 1 ▼a 이종희, ▼e
700 1 ▼a 이준섭, ▼e
700 1 ▼a 장정호, ▼e
700 1 ▼a 김민우, ▼e
900 1 0 ▼a 카프리올로, 에드워드, ▼e
900 1 0 ▼a 웜플러, 딘, ▼e
900 1 0 ▼a 러더글렌, 제이슨, ▼e
945 ▼a KLPA

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 005.745 2013 등록번호 121229499 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 2 소장처 세종학술정보원/과학기술실/ 청구기호 005.745 2013 등록번호 151320608 도서상태 대출가능 반납예정일 예약 서비스
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 005.745 2013 등록번호 121229499 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 세종학술정보원/과학기술실/ 청구기호 005.745 2013 등록번호 151320608 도서상태 대출가능 반납예정일 예약 서비스

컨텐츠정보

책소개

예제를 중심으로 여러분의 환경에서 하이브를 어떻게 설치하고 설정하는지 보여주는 책. 하둡과 맵리듀스에 대해 간략하게 설명하고 하이브가 하둡 생태계에서 어떻게 동작하는지도 보여준다. 또한 많은 회사가 테라바이트 데이터를 다루면서 겪었던 문제를 풀기 위해 어떻게 하이브를 이용했는지도 실제 사례를 통해서 엿볼 수 있다. 넥스알에서 개발한 'R하이브'와 '오라클에서 하이브로의 마이그레이션'을 부록으로 추가했다.

♣ SQL로 친숙하게 만나는 빅데이터 분석하기!
이 책은 예제를 중심으로 여러분의 환경에서 하이브를 어떻게 설치하고 설정하는지 보여준다. 하둡과 맵리듀스에 대해 간략하게 설명하고 하이브가 하둡 생태계에서 어떻게 동작하는지도 보여준다. 또한 많은 회사가 테라바이트 데이터를 다루면서 겪었던 문제를 풀기 위해 어떻게 하이브를 이용했는지도 실제 사례를 통해서 엿볼 수 있다. 넥스알에서 개발한 'R하이브'와 '오라클에서 하이브로의 마이그레이션'을 부록으로 추가했다.

♣ 페이스북이 만든 SQL 호환 언어, 하이브!
하이브는 페이스북에서 대용량 데이터셋을 간편하게 사용하고자 만들었고, 이미 수많은 기업에서 사용한다. 하둡 분산 파일시스템이나 하둡과 연동하는 다른 파일시스템(MapR-FS, 아마존의 S3, HBase와 카산드라 같은 데이터베이스)에 저장된 데이터를 쿼리할 수 있는 SQL 호환 언어를 제공하는 하둡 생태계의 필수 도구인 하이브에 대해 알아보자.

♣ 대상 독자
- 데이터베이스를 업무상 사용하는 사람
- NoSQL을 사용하는 개발자
- 클라우드 관련 개발자
- 분산 시스템과 데이터베이스를 연구하는 석사 이상

♣ 간략한 이 책의 내용
- 데이터베이스, 테이블, 뷰, 함수, 색인을 생성, 변경, 삭제하기
- 파일 및 데이터베이스의 데이터 포맷과 저장소 옵션 최적화
- 그룹핑, 필터링, 조인 및 기타 쿼리 메소드
- 사용자 정의 함수 생성하기
- 하이브 패턴과 안티-패턴
- 하이브와 다른 데이터 처리 프로그램과의 연동
- NoSQL DB와 다른 데이터 저장소를 연결하는 스토리지 핸들러 이용
- 아마존 Elastic MapReduce에서 하이브 실행하기


정보제공 : Aladin

저자소개

에드워드 카프리올로(지은이)

Media6degrees 사에서 인터넷 광고 업계를 위한 분산 데이터 저장 시스템을 설계하고 유지하는 시스템 관리자로 일한다. 아파치 소프트웨어 재단의 구성원이자 하둡-하이브 프로젝트의 커미터로 활동 중이다. 그는 리눅스 및 네트워크 관리자뿐만 아니라 개발자로서의 경력을 가지고 있으며 오픈소스 소프트웨어의 다양한 세상을 즐기고 있다.

딘 웜플러(지은이)

Think Big Analytics 사에서 '빅데이터' 문제와 하둡이나 머신 러닝 같은 도구들을 전문적으로 다루는 수석 컨설턴트다. 빅데이터뿐만 아니라 스칼라, JVM 생태계, 자바스크립트, 루비, 함수 프로그래밍, 객체 지향 프로그래밍, 애자일 방법론 관련 분야의 전문가이다. 딘은 이러한 주제와 관련된 산학 컨퍼런스에서 꾸준히 연설하고 있다. 그는 워싱턴 대학교에서 물리학 박사 학위를 받았다.

제이슨 러더글렌(지은이)

Think Big Analytics 사에서 빅데이터, 하둡, 검색, 보안 관련 분야를 전문적으로 다루는 소프트웨어 아키텍처이다.

오세봉(옮긴이)

티맥스 소프트에서 웹 어플리케이션 서버를 개발하다 빅데이터에 관심이 생겨 KT 넥스알에 입사했다. 재직 중에 『하이브 완벽 가이드』(한빛미디어, 2013), 『케스케이딩 완벽 가이드』(한빛미디어, 2014)와 『MVC 구조의 확실한 해답 AngularJS 디렉티브』(에이콘, 2016)을 번역했다. KT 넥스알을 나와 어린이용 스마트워치(LINE 키즈폰)를 출시했으며 이때부터 안드로이드 개발을 시작했다. 대학 때부터 웹을 비롯한 UI에 관심이 많아 안드로이드 UI에 적응하는 데 오래 걸리지는 않았지만 SQLite를 비롯한 안드로이드 서비스는 자료가 많지 않아 시행착오를 많이 겪어야 했다. 현재는 SK텔레콤에서 빅데이터를 이용한 데이터 분석과 관련된 일을 하고 있다.

박영근(옮긴이)

티맥스소프트 WAS실에서 근무하다 현재 넥스알에서 빅데이터 플랫폼을 개발한다. 분산, 실시간, 스트림 등과 관련된 오픈소스에 관심이 많으며 세상을 바꿀 수 있는 소프트웨어를 만들기 위해 항상 고민하는 불혹의 새내기 소프트웨어 엔지니어다.

이종희(옮긴이)

귀여운 손자, 손녀들이 생길 때까지 즐겁게 소프트웨어를 개발하며 살고 싶은 대한민국의 평범한 개발자 중 한 명이다. 자바 오피스를 개발을 시작으로 개발자의 길에 들어섰고, 지난 5년간 하둡을 이용한 빅데이터 솔루션 개발을 해왔다. 현재는 IoT 스타트업에서 제품 출시를 위해 밤낮없이 개발 중이다.

장정호(옮긴이)

네이버 검색 소프트웨어 엔지니어. 2006년에 티맥스에서 애플리케이션/시스템 간 데이터 전송 시스템 개발을 시작으로, 다음 커뮤니케이션에서 데이터 마이닝 업무, SAP에서 칼럼 기반의 인메모리 RDBMS인 HANA 개발에 동참했으며, 그 후 빅데이터 저장/분석 시스템 영역에 관한 연구를 통해 네이버에서 데이터 분석 시스템을 개발을 담당하고 있다.

이준섭(옮긴이)

KT 클라우드웨어에서 빅데이터 본부 내 팀장을 역임하다 최근에 LG전자 스마트 비즈니스 전략 센터로 이직하여 빅데이터 전략 프로젝트를 담당하고 있다. ETRI 콘텐츠 연구본부에서 지식 플랫폼 및 증강현실, 비전처리, 실시간 렌더링 연구를 수행했다. 한국과학기술원에서 전산학 석사로 보안을 전공했다.

양원국(옮긴이)

빅데이터 솔루션 전문업체인 KT NexR에서 데이터 플랫폼을 개발했고, 현재 SK 테크엑스 플랫폼 개발 본부의 데이터 엔지니어다. 머신 러닝 기반 추천 서비스 외 사내 하둡 Eco 관련 업무를 담당하고 있다.

우성한(옮긴이)

현재 빅데이터 솔루션 전문업체인 KT NexR의 책임 연구원으로 재직 중이다. 다수의 기업에서 모바일 게임, SNS 서비스, 결제 시스템 등 다양한 S/W 분야의 개발 경험이 있으며, 2011년 빅데이터의 매력에 빠져 빅데이터 분야의 오픈소스들을 다루기 시작했다. KT NexR의 대표적인 빅데이터 분석 솔루션 NDAP 개발에 참여했으며, 지금은 아키텍처 설계부터 프론트엔드/백엔드 개발까지 수행하는 풀 스택 엔지니어로서 실시간 빅데이터 처리 및 분석 솔루션인 Lean Stream 개발에 참여하고 있다.

정보제공 : Aladin

목차

목차
추천의 말 = 4
지은이 소개 = 5
옮긴이 소개 = 6
옮긴이의 말 = 8
지은이의 말 = 12
이 책에 대하여 = 14
코드 예제 사용하기 = 15
감사의 글 = 16
표지 설명 = 17
CHAPTER 1 소개 
 1.1 하둡과 맵리듀스 개요 = 38
  1.1.1 맵리듀스 = 38
 1.2 하둡 생태계에서의 하이브 = 41
  1.2.1 피그 = 43
  1.2.2 HBase = 44
  1.2.3 캐스케이딩, 크런치, 그 외 도구 = 45
 1.3 자바 vs. 하이브 : 단어 세기 알고리즘 = 47
CHAPTER 2 시작하기 
 2.1 하둡과 하이브가 미리 설정된 가상 머신 설치하기 = 51
 2.2 자세한 설치 방법 알아보기 = 53
  2.2.1 자바 설치하기 = 53
  2.2.2 하둡 설치하기 = 55
  2.2.3 로컬 모드, 의사 분산 모드, 분산 모드 = 56
  2.2.4 하둡 테스트하기 = 57
  2.2.5 하이브 설치하기 = 60
 2.3 하이브는 어떻게 구성되어 있는가? = 61
 2.4 하이브 시작하기 = 62
 2.5 하둡 환경 설정하기 = 63
  2.5.1 로컬 모드 설정 = 64
  2.5.2 분산과 의사 분산 모드 설정 = 66
  2.5.3 JDBC를 사용하는 메타스토어 = 68
 2.6 하이브 명령 = 70
  2.6.1 명령 옵션 = 70
 2.7 명령행 인터페이스 = 71
  2.7.1 CLI 옵션 = 71
  2.7.2 변수와 속성 = 72
  2.7.3 하이브 원 샷 명령 = 76
  2.7.4 파일로 하이브 쿼리 실행하기 = 77
  2.7.5 .hiverc 파일 = 79
  2.7.6 CLI의 다른 기능들 = 79
  2.7.7 명령 히스토리 = 80
  2.7.8 셸 실행 = 81
  2.7.9 하이브에서 하둡 dfs 명령 수행하기 = 81
  2.7.10 하이브 스크립트에서 주석 달기 = 82
  2.7.11 쿼리 컬럼 헤더 = 82
CHAPTER 3 데이터형과 파일 포맷 
 3.1 원시 데이터형 = 83
 3.2 컬렉션 데이터형 = 86
 3.3 데이터값의 텍스트 파일 인코딩 = 88
 3.4 Schema on Read = 92
CHAPTER 4 HiveQL : 데이터 정의 
 4.1 하이브에서의 데이터베이스 = 94
 4.2 데이터베이스 변경 = 98
 4.3 테이블 생성 = 98
  4.3.1 매니지드 테이블 = 102
  4.3.2 외부 테이블 = 103
 4.4 파티션닝된 매니지드 테이블 = 105
  4.4.1 파티셔닝된 외부 테이블 = 109
  4.4.2 테이블 저장 포맷 사용자화 = 112
 4.5 테이블 삭제 = 115
 4.6 테이블 변경 = 116
  4.6.1 테이블명 변경 = 116
  4.6.2 테이블 파티션 추가, 변경, 삭제 = 116
  4.6.3 컬럼 변경 = 117
  4.6.4 컬럼 추가 = 118
  4.6.5 컬럼 삭제 및 교체 = 118
  4.6.6 테이블 속성 변경 = 119
  4.6.7 저장소 속성 변경 = 119
  4.6.8 기타 테이블 변경 문 = 120
CHAPTER 5 HiveQL : 데이터 조작 
 5.1 매니지드 테이블에 데이터 로딩하기 = 123
 5.2 쿼리 결과를 테이블에 넣기 = 125
  5.2.1 동적 파티션 삽입 = 127
 5.3 쿼리 하나로 테이블을 생성하고 데이터 로딩하기 = 129
 5.4 데이터 꺼내기 = 129
CHAPTER 6 HiveQL : 쿼리 
 6.1 SELECT ... FROM 절 = 133
  6.1.1 정규표현식으로 컬럼 선택하기 = 136
  6.1.2 컬럼값으로 계산하기 = 136
  6.1.3 산술 연산자 = 137
  6.1.4 함수 사용하기 = 138
  6.1.5 LIMIT 절 = 147
  6.1.6 컬럼 별칭 = 148
  6.1.7 중첩 SELECT 문 = 148
  6.1.8 CASE ... WHEN ... THEN 문 = 149
  6.1.9 하이브가 맵리듀스를 사용하지 않을 때 = 149
 6.2 WHERE 절 = 150
  6.2.1 술어 연산자 = 152
  6.2.2 부동소수점수 비교의 잠재적 문제 = 153
  6.2.3 LIKE와 RLIKE = 155
 6.3 GROUP BY 절 = 156
  6.3.1 HAVING 절 = 157
 6.4 조인 문 = 158
  6.4.1 내부 조인 = 158
  6.4.2 조인 최적화 = 160
  6.4.3 왼쪽 외부 조인 = 162
  6.4.4 외부 조인의 잠재적 문제 = 162
  6.4.5 오른쪽 외부 조인 = 165
  6.4.6 완전 외부 조인 = 165
  6.4.7 왼쪽 세미 조인 = 166
  6.4.8 카타시안 프로덕트 조인 = 167
  6.4.9 맵 사이드 조인 = 168
 6.5 ORDER BY와 SORT BY = 170
 6.6 SORT BY와 함께 사용하는 DISTRIBUTE BY = 171
 6.7 CLUSTER BY = 172
 6.8 형변환 = 173
  6.8.1 BINARY값 형변환 = 173
 6.9 데이터 표본을 만드는 쿼리 = 174
  6.9.1 블록으로 표본 만들기 = 175
  6.9.2 버킷 테이블들에 대한 입력 푸루닝 = 176
 6.10 UNION ALL = 177
CHAPTER 7 HiveQL : 뷰 
 7.1 쿼리의 복잡함을 줄여주는 뷰 = 179
 7.2 조건을 기반으로 데이터를 제한하는 뷰 = 180
 7.3 동적 테이블을 위한 뷰와 MAP 데이터형 = 181
 7.4 기타 = 182
CHAPTER 8 HiveQL : 색인 
 8.1 색인 생성 = 186
  8.1.1 비트맵 색인 = 187
 8.2 색인 재구축 = 187
 8.3 색인 보기 = 188
 8.4 색인 삭제 = 188
 8.5 사용자 정의 색인 핸들러 구현 = 189
CHAPTER 9 스키마 설계 
 9.1 날짜별 테이블 = 191
 9.2 파티션 설계 시 고려사항 = 192
 9.3 고유 키와 정규화 = 194
 9.4 동일 데이터에 대한 다중 패스 만들기 = 195
 9.5 임시 테이블 파티셔닝하기 = 196
 9.6 테이블 저장소 버킷팅하기 = 197
 9.7 테이블에 컬럼 추가하기 = 199
 9.8 컬럼 기반 테이블 사용하기 = 200
  9.8.1 반복 데이터 = 201
  9.8.2 다수의 컬럼 = 201
 9.9 압축하기 = 202
CHAPTER 10 튜닝 
 10.1 EXPLAIN 사용하기 = 203
 10.2 EXPLAIN EXTENDED = 207
 10.3 LIMIT 튜닝 = 208
 10.4 최적화된 조인 = 209
 10.5 로컬 모드 = 209
 10.6 병렬 수행 = 210
 10.7 strict 모드 = 211
 10.8 맵퍼와 리듀서 수의 최적화 = 213
 10.9 자바 가상 머신 재사용 = 215
 10.10 색인 = 216
 10.11 동적 파티셔닝 튜닝 = 216
 10.12 투기적 실행 = 217
 10.13 다수의 GROUP BY 연산 결합하기 = 219
 10.14 가상 컬럼 = 219
CHAPTER 11 기타 파일 포맷과 압축 
 11.1 설치된 코덱 확인= 222 
 11.2 압축 코덱 선택 = 222
 11.3 중간 과정 압축 = 224
 11.4 최종 출력 압축 = 225
 11.5 시퀀스파일 = 225
 11.6 압축하기 = 226
 11.7 파티션 아카이빙하기 = 231
 11.8 정리하기 = 234
CHAPTER 12 개발 
 12.1 Log4J 속성 변경 = 235
 12.2 하이브 디버깅하기 = 236
 12.3 소스로부터 하이브 빌드하기 = 237
  12.3.1 다양한 하이브 테스트 케이스 실행하기 = 237
  12.3.2 후크 실행 = 239
 12.4 이클립스와 하이브 설정 = 239
 12.5 메이븐 프로젝트에서 하이브 = 241
 12.6 hive test와 함께하는 하이브 테스트 = 241
 12.7 새로운 플러그인 개발 킷 = 244
CHAPTER 13 함수 
 13.1 함수 탐색 및 설명 = 246
 13.2 함수 호출 = 246
 13.3 표준 함수 = 247
 13.4 집계 함수 = 247
 13.5 테이블 생성 함수 = 248 
 13.6 생일로 별자리를 찾는 UDF = 249
 13.7 UDF vs. GenericUDF = 253
 13.8 영구적 사용을 위한 함수 등록 = 256
 13.9 사용자 정의 집계 함수 = 257
  13.9.1 GROUP CONCAT을 따라 하는 COLLECT UDAF 함수 생성 = 258
 13.10 사용자 정의 테이블 생성 함수 = 264
  13.10.1 다중 로우 생성 UDTF = 264
  13.10.2 다중 컬럼을 이용한 단일 로우 생성 UDTF = 266
  13.10.3 복합 데이터형 효과를 내는 UDTF = 267
 13.11 UDF에서 분산 캐시 접근 = 271
 13.12 함수 어노테이션 = 273
  13.12.1 결정성 = 273
  13.12.2 상태 유지 = 274
  13.12.3 distinctLike = 275
 13.13 매크로 = 275
CHAPTER 14 스트리밍 
 14.1 항등 변환 = 278
 14.2 데이터형 변환 = 279
 14.3 투사 변환 = 279
 14.4 조작 변환 = 280
 14.5 분산 캐시 사용 = 280
 14.6 로우 하나를 여러 로우로 변환하기 = 281
 14.7 스트리밍을 이용한 집계 계산 = 283
 14.8 CLUSTER BY, DISTRIBUTE BY, SORT BY = 284
 14.9 자바 스트리밍을 위한 GenericMR 도구들 = 287
 14.10 그룹 간 계산 = 290
CHAPTER 15 하이브 파일과 레코드 포맷 사용자화 
 15.1 파일 vs. 레코드 포맷 = 291
 15.2 CREATE TABLE 문 파헤치기 = 292
 15.3 파일 포맷 = 294
  15.3.1 시퀀스파일 = 294
  15.3.2 RCFile = 295
  15.3.3 사용자 정의 입력 포맷 예제 : DualInputFormat = 296
 15.4 레코드 포맷: SerDe = 299
 15.5 CSV와 TSV SerDe = 300
 15.6 ObjectInspector = 301
 15.7 Think Big 하이브 리플렉션 ObjectInspector = 301
 15.8 XML UDF = 301
 15.9 XPath 관련 함수 = 302
 15.10 JSON SerDe = 303
 15.11 에이브로 하이브 SerDe = 304
  15.11.1 테이블 속성을 이용한 에이브로 스키마 정의 = 305
  15.11.2 URI로 스키마 정의 = 306
  15.11.3 스키마 진화 = 306
 15.12 바이너리 출력 = 307
CHAPTER 16 하이브 쓰리프트 서비스 
 16.1 쓰리프트 서버 구동하기 = 310
 16.2 그루비로 연결하기 = 310
 16.3 하이브 서버에 연결하기 = 311
 16.4 클러스터 상태 얻기 = 312
 16.5 결과 집합 스키마 = 312
 16.6 결과 가져오기 = 313
 16.7 쿼리 플랜 반환 = 313
 16.8 메타스토어 메소드 = 314
  16.8.1 예제 테이블 검사기 = 314
 16.9 하이브 서버 관리 = 315
  16.9.1 하둡 서비스 운영 = 316
  16.9.2 디렉터리 비우기 = 317
 16.10 하이브 쓰리프트 메타스토어 = 317
  16.10.1 쓰리프트 메타스토어 설정 = 318
  16.10.2 클라이언트 설정 = 318
CHAPTER 17 스토리지 핸들러와 NoSQL 
 17.1 스토리지 핸들러 배경 지식 = 319
 17.2 하이브 스토리지 핸들러 = 320
 17.3 HBase = 321
 17.4 카산드라 = 322
  17.4.1 정적 컬럼 매핑 = 323
  17.4.2 동적 컬럼 맵핑 = 323
  17.4.3 카산드라 SerDe 속성 = 324
 17.5 다이나모디비 = 324
CHAPTER 18 보안 
 18.1 하둡 보안과 통합 = 328
 18.2 하이브 인증 = 329
 18.3 하이브 권한 = 330
  18.3.1 사용자, 그룹, 역할 = 331
  18.3.2 특권 부여와 회수 = 332
  18.3.3 파티션 레벨 특권 = 335
  18.3.4 자동 권한 부여 = 336
CHAPTER 19 잠금 
 19.1 주키퍼를 이용한 하이브 잠금 제공 = 340
 19.2 명시적 배타적 잠금 = 343
CHAPTER 20 우지와 하이브 통합 
 20.1 우지 액션 = 346
  20.1.1 하이브 쓰리프트 서비스 액션 = 346
 20.2 두 개의 쿼리를 실행하는 워크플로우 = 347
 20.3 우지 웹 콘솔 = 349
 20.4 워크플로우 내의 변수 = 350
 20.5 출력 캡처 = 351
 20.6 변수로 출력 캡처 = 351
CHAPTER 21 하이브와 아마존 웹 서비스 
 21.1 왜 EMR인가? = 353
 21.2 인스턴스 = 354
 21.3 시작하기 앞서 = 354
 21.4 EMR 하이브 클러스터 관리하기 = 355
 21.5 EMR 하이브에서 쓰리프트 서버 = 356
 21.6 EMR에서 인스턴스 그룹 = 356
 21.7 EMR 클러스터 설정하기 = 357
  21.7.1 hive-site.xml 배치 = 357
  21.7.2 .hiverc 스크립트 배치 = 358
  21.7.3 메모리 집약적인 설정 = 359
 21.8 EMR에서의 지속성과 메타스토어 = 359
 21.9 EMR 클러스터 상의 HDFS와 S3 = 361
 21.10 S3에 리소스, 설정, 부트스트랩 스크립트 올리기 = 362
 21.11 S3에 로그 남기기 = 362
 21.12 스팟 인스턴스 = 363
 21.13 보안 그룹 = 365
 21.14 EMR vs. EC2, 그리고 아파치 하이브 = 365
 21.15 정리하기 = 366
CHAPTER 22 HCatalog 
 22.1 소개 = 367
 22.2 맵리듀스 = 368
  22.2.1 데이터 읽기 = 368
  22.2.2 데이터 쓰기 = 371
 22.3 명령행 = 374
 22.4 보안 모델 = 375
 22.5 아키텍처 = 376
CHAPTER 23 사례 연구 
 23.1 m6d.com (Media6Degrees) = 379
  23.1.1 하이브와 R을 활용한 M6D의 데이터 분석 = 379
  23.1.2 M6D Pseudorank 사용자 정의 함수 = 385
  23.1.3 다수의 맵리듀스 클러스터에서 하이브 데이터 관리 = 391
 23.2 아웃브레인 = 396
  23.2.1 사이트 내 유입 경로 식별 = 396
  23.2.2 고유 값 세기 = 399
  23.2.3 사용자 활동 분석 = 402
 23.3 NASA 제트 추진 연구소 = 410
  23.3.1 지역 기후 모델 분석 시스템 = 410
  23.3.2 하이브를 선택한 이유 = 413
  23.3.3 도전과 극복 = 413
 23.4 포토버킷 = 415
  23.4.1 포토버킷의 빅데이터 = 415
  23.4.2 하이브를 위하여 어떤 하드웨어를 사용했나? = 416
  23.4.3 하이브로 이관할 데이터 = 416
  23.4.4 누가 사용하나? = 416
 23.5 심플리치 = 417
 23.6 카르마스피어 관점에서 고객사의 경험과 요구사항 = 420
  23.6.1 소개 = 420
  23.6.2 사례 = 421
부록 A 오라클 마이그레이션 = 431
 A.1 들어가기 앞서 = 431
 A.2 HiveQL = 433
 A.3 DDL 쿼리 변환 = 434
  A.3.1 데이터형 = 434
  A.3.2 실수형 데이터 변환 = 436
  A.3.3 날짜형 데이터 변환 = 437
  A.3.4 문자열형 데이터 변환 = 440
  A.3.5 바이너리형 데이터 변환 = 440
 A.4 조인 변환 = 440
  A.4.1 기본 조인 쿼리 = 441
  A.4.2 셀프 조인 = 441
  A.4.3 크로스 조인 = 442
  A.4.4 왼쪽 외부 조인 = 442
  A.4.5 오른쪽 외부 조인 = 443
  A.4.6 완전 외부 조인 = 443
 A.5 조건 함수비교 = 444
  A.5.1 DECODE = 444
  A.5.2 CASE = 444
 A.6 색인 = 444
 A.7 테이블 압축 = 445
 A.8 파티셔닝 = 446
 A.9 분석 함수 = 446
  A.9.1 오라클 분석 함수 = 446
  A.9.2 분석 함수 기본 변환 규칙 = 448
  A.9.3 하이브 분석 함수 UDF = 449
  A.9.4 분석 함수 변환 예제 = 450
  A.9.5 SAP의 하리쉬 부타니 해결책 = 453
 A.10 복잡한 서브쿼리 = 453
  A.10.1 IN/EXISTS 서브쿼리 = 454
  A.10.2 NOT IN/NOT LIKE = 454
  A.10.3 NOT EXISTS = 455
 A.11 스칼라 서브쿼리 = 456
  A.11.1 인텔의 Panthera 프로젝트 = 458
 A.12 고급 분석 함수 = 458
  A.12.1 ROLLUP = 458
  A.12.2 CUBE = 460
  A.12.3 GROUPING SETS = 461
 A.13 기타 변환 = 463
  A.13.1 문자열 연결 = 463
  A.13.2 IN, NOT IN 문 = 463
  A.13.3 CREATE TABLE ... AS SELECT ... FROM ... 문 = 463
  A.13.4 SELECT ... WHERE〈column〉NOT LIKE ... 문 = 463
  A.13.5 TRUNCATE TABLE 문 = 463
부록 B 오픈소스 R하이브 = 467
 B.1 R하이브란 무엇인가? = 467
  B.1.1 R하이브개발배경 = 467
  B.1.2 R하이브특징 = 468
  B.1.3 R하이브 장점과 한계 = 469
  B.1.4 R하이브 현재 버전과 개발 현황 = 469
  B.1.5 R하이브 활용 사례 = 470
 B.2 R하이브 구조 = 470
 B.3 R하이브 설치 및 실행 = 471
  B.3.1 워킹 클라이언트 환경 설치 = 471
  B.3.2 하둡 클러스터 환경 설치 = 472
  B.3.3 설치 성공 확인 및 R하이브 실행 = 473
 B.4 R하이브 함수 소개와 예제 = 474
  B.4.1 하이브와 연동 함수 = 474
  B.4.2 R하이브의 기본 통계 함수 = 476
  B.4.3 빅데이터 처리를 위한 apply 함수 = 477
  B.4.4 하둡 파일시스템 지원 함수 = 478
 B.5 R하이브 샘플 프로그램 = 479
 B.6 R하이브와 유사 패키지의 비교 = 480
부록 C 용어 = 483
부록 D 참고 문헌 = 491
찾아보기 = 494

관련분야 신착자료

이창현 (2021)