HOME > Detail View

Detail View

(빅 데이터 시대의) 하둡 완벽 입문 : 오픈 소스 분산 처리 환경 구축 가이드 (Loan 35 times)

Material type
단행본
Personal Author
太田一樹, 저 岩崎正剛, 저 猿田浩輔, 저 下垣徹, 저 藤井達朗, 저 山下眞一, 저 김완섭, 역
Title Statement
(빅 데이터 시대의) 하둡 완벽 입문 : 오픈 소스 분산 처리 환경 구축 가이드 / 오오타 카스기 [외]지음 ; 김완섭 옮김
Publication, Distribution, etc
파주 :   제이펍,   2014  
Physical Medium
xvi, 640 p. : 삽화, 도표 ; 25 cm
Series Statement
제이펍의 클라우드 시리즈 = Jpub's cloud series ; 09
Varied Title
Hadoop徹底入門 : オ-プンソ-ス分散處理環境の構築 (第2版)
ISBN
9788994506968
General Note
초보자부터 고급 사용자까지 모두 아우를 수 있는 빅 데이터 시대의 최신 해설서!  
공저자: 이와사키 마사타케(岩崎正剛), 사루타 코우스케(猿田浩輔), 시모가키 토오루(下垣徹), 후지이 타츠로우(藤井達朗), 야마시타 신이치(山下眞一)  
감수: 하마노 켄이치로(濱野賢一朗)  
색인수록  
000 01897camcc2200529 c 4500
001 000045802646
005 20140624155248
007 ta
008 140623s2014 ggkad 001c kor
020 ▼a 9788994506968 ▼g 93000
035 ▼a (KERIS)BIB000013500735
040 ▼a 211062 ▼c 211062 ▼d 211062 ▼d 211009
041 1 ▼a kor ▼h jpn
082 0 4 ▼a 005.74 ▼2 23
085 ▼a 005.74 ▼2 DDCK
090 ▼a 005.74 ▼b 2014z2
245 2 0 ▼a (빅 데이터 시대의) 하둡 완벽 입문 : ▼b 오픈 소스 분산 처리 환경 구축 가이드 / ▼d 오오타 카스기 [외]지음 ; ▼e 김완섭 옮김
246 1 9 ▼a Hadoop徹底入門 : ▼b オ-プンソ-ス分散處理環境の構築 ▼g (第2版)
246 3 ▼a Hadupu tettei nyumon : ▼b opun sosu bunsan shori kankyo no kochiku
260 ▼a 파주 : ▼b 제이펍, ▼c 2014
300 ▼a xvi, 640 p. : ▼b 삽화, 도표 ; ▼c 25 cm
440 0 0 ▼a 제이펍의 클라우드 시리즈 = ▼x Jpub's cloud series ; ▼v 09
500 ▼a 초보자부터 고급 사용자까지 모두 아우를 수 있는 빅 데이터 시대의 최신 해설서!
500 ▼a 공저자: 이와사키 마사타케(岩崎正剛), 사루타 코우스케(猿田浩輔), 시모가키 토오루(下垣徹), 후지이 타츠로우(藤井達朗), 야마시타 신이치(山下眞一)
500 ▼a 감수: 하마노 켄이치로(濱野賢一朗)
500 ▼a 색인수록
700 1 ▼a 太田一樹, ▼e▼0 AUTH(211009)1287
700 1 ▼a 岩崎正剛, ▼e▼0 AUTH(211009)118777
700 1 ▼a 猿田浩輔, ▼e▼0 AUTH(211009)132030
700 1 ▼a 下垣徹, ▼e▼0 AUTH(211009)46721
700 1 ▼a 藤井達朗, ▼e▼0 AUTH(211009)1288
700 1 ▼a 山下眞一, ▼e▼0 AUTH(211009)59868
700 1 ▼a 김완섭, ▼e
900 1 0 ▼a 오오타 카스기, ▼e
900 1 0 ▼a Ota, Kazuki, ▼e
900 1 0 ▼a 이와사키 마사타케, ▼e
900 1 0 ▼a Iwasaki, Masatake, ▼e
900 1 0 ▼a 사루타 코우스케, ▼e
900 1 0 ▼a Saruta, Kosuke, ▼e
900 1 0 ▼a 시모가키 토오루, ▼e
900 1 0 ▼a Shimogaki, Toru, ▼e
900 1 0 ▼a 후지이 타츠로우, ▼e
900 1 0 ▼a Fujii, Tatsuro, ▼e
900 1 0 ▼a 야마시타 신이치, ▼e
900 1 0 ▼a Yamashita, Shin'ichi, ▼e
945 ▼a KLPA

No. Location Call Number Accession No. Availability Due Date Make a Reservation Service
No. 1 Location Main Library/Monographs(3F)/ Call Number 005.74 2014z2 Accession No. 111719873 Availability Available Due Date Make a Reservation Service B M
No. 2 Location Science & Engineering Library/Sci-Info(Stacks1)/ Call Number 005.74 2014z2 Accession No. 121230720 Availability Available Due Date Make a Reservation Service B M
No. 3 Location Sejong Academic Information Center/Course Reserves/ Call Number 컴퓨터정보학과 005.74 2014z2 Accession No. 151324107 Availability Loan can not(reference room) Due Date Make a Reservation Service
No. Location Call Number Accession No. Availability Due Date Make a Reservation Service
No. 1 Location Main Library/Monographs(3F)/ Call Number 005.74 2014z2 Accession No. 111719873 Availability Available Due Date Make a Reservation Service B M
No. Location Call Number Accession No. Availability Due Date Make a Reservation Service
No. 1 Location Science & Engineering Library/Sci-Info(Stacks1)/ Call Number 005.74 2014z2 Accession No. 121230720 Availability Available Due Date Make a Reservation Service B M
No. Location Call Number Accession No. Availability Due Date Make a Reservation Service
No. 1 Location Sejong Academic Information Center/Course Reserves/ Call Number 컴퓨터정보학과 005.74 2014z2 Accession No. 151324107 Availability Loan can not(reference room) Due Date Make a Reservation Service

Contents information

Book Introduction

I♥Cloud 9권. Hadoop은 다수의 컴퓨터를 연결하여 대용량 처리를 가능케 하는 오픈 소스 소프트웨어이며, MapReduce라는 자바 프레임워크를 사용해 프로그래밍이 가능하다. 또한, 표준 입출력을 사용할 수 있는 HadoopStreaming, 플로(flow) 기술 환경 Pig, SQL 방식 인터페이스인 Hive 등 다양한 개발 환경을 제공하고 있다. 뿐만 아니라 행 지향 데이터베이스인 HBase나 로그 수집기 Fluentd의 기반 시스템으로도 사용할 수 있어서 높은 범용성을 자랑한다.

이 책은 1판에 비해 Hadoop에 관해 전혀 모르는 사람들도 이해하는 데 좀 더 도움이 되도록 개요 부분을 더욱 쉽게 구성했으며, MapReduce 애플리케이션 개발 내용을 추가하고 초보자부터 고급 사용자까지 모두 활용할 수 있도록 했다.

운용성, 가용성 측면도 보강하고 새로운 기술 이슈에 대해서도 추가하였다. 또한, 실제 시스템에서 많이 사용되고 있는 클라우데라(Cloudera)의 CDH 4를 기준으로 시스템 확장, 감시, 운영 방법 등 현장에서 바로 적용할 수 있는 최신 노하우까지 담았다.

Hadoop의 다양한 애플리케이션 개발 환경을 상세히 설명하고 구축과 운영에 관한 자세한 정보 수록!
A부터 Z까지 Hadoop에 관한 거의 모든 것!


IT 시스템 세계에서 ‘Hadoop’이라는 소프트웨어 사용이 늘어나고 있다. 이 책을 가지고 있다는 것은 적어도 Hadoop에 관심이 있다는 것이다. 아직 Hadoop에 관해 잘 몰라도 소프트웨어 이름이라는 것 정도는 알고 있겠지만, ‘도대체 용도가 뭐야?’, ‘뭐 하는 거지?’ 등과 같은 초보적인 질문을 하는 사람도 적지 않을 것이다. 또한, 어떤 데이터를 취급하기 위한 미들웨어라는 것은 알고 있더라도 ‘관계형 데이터베이스랑은 어떻게 달라?’, ‘파일시스템이랑 달라?’, ‘처리를 위한 새로운 개념인가?’ 등 다양한 의문이 많을 거라고 생각된다.

Hadoop은 다수의 컴퓨터를 연결하여 대용량 처리를 가능케 하는 오픈 소스 소프트웨어이며, MapReduce라는 자바 프레임워크를 사용해 프로그래밍이 가능하다. 또한, 표준 입출력을 사용할 수 있는 HadoopStreaming, 플로(flow) 기술 환경 Pig, SQL 방식 인터페이스인 Hive 등 다양한 개발 환경을 제공하고 있다. 뿐만 아니라 행 지향 데이터베이스인 HBase나 로그 수집기 Fluentd의 기반 시스템으로도 사용할 수 있어서 높은 범용성을 자랑한다.

이 책은 1판에 비해 Hadoop에 관해 전혀 모르는 사람들도 이해하는 데 좀 더 도움이 되도록 개요 부분을 더욱 쉽게 구성했으며, MapReduce 애플리케이션 개발 내용을 추가하고 초보자부터 고급 사용자까지 모두 활용할 수 있도록 했다. 운용성, 가용성 측면도 보강하고 새로운 기술 이슈에 대해서도 추가하였다. 또한, 실제 시스템에서 많이 사용되고 있는 클라우데라(Cloudera)의 CDH 4를 기준으로 시스템 확장, 감시, 운영 방법 등 현장에서 바로 적용할 수 있는 최신 노하우까지 담았다.


Information Provided By: : Aladin

Table of Contents

목차
옮긴이 머리말 = XII
머리말 = XIV
베타리더 후기 = XV
PART 1 Hadoop 기초 = 1
 Chapter 1 Hadoop 기초 지식 = 3
  1.1 Hadoop이란? = 4
  1.2 Hadoop 개요 = 4
  1.3 Hadoop 적용 분야 = 15
  1.4 Hadoop 시스템 구성과 아키텍처 = 19
  1.5 Hadoop 적용 사례 = 30
 Chapter 2 MapReduce 애플리케이션 활용 예 = 35
  2.1 블로그 접속 수 집계 = 36
  2.2 비슷한 사람을 찾아내자 = 41
  2.3 검색 엔진 인덱스 작성 = 43
  2.4 이미지 데이터 분산 처리 = 46
  2.5 MapReduce로 구현할 수 있는 처리 특성과 활용 포인트 = 48
 Chapter 3 Hadoop 도입 = 51
  3.1 구축 환경 조건 = 52
  3.2 실행 환경 구축 = 55
  3.3 동작 확인 = 59
  3.4 샘플 애플리케이션 실행 = 63
 Chapter 4 HDFS = 65
  4.1 Hadoop의 파일 시스템 = 66
  4.2 HDFS의 구조 = 68
  4.3 HDFS의 파일 I/O 흐름 = 73
  4.4 파일 시스템의 메타데이터 = 77
  4.5 HDFS 설정과 시작/중지 = 81
  4.6 SecondaryNameNode = 92
  4.7 CLI 기반 파일 조작 = 94
 Chapter 5 MapReduce 프레임워크 = 109
  5.1 MapReduce 처리 = 110
  5.2 MapReduce 아키텍처 = 114
  5.3 MapReduce와 HDFS의 관계 = 118
  5.4 MapReduce 프레임워크 설정 = 123
  5.5 MapReduce 프레임워크 시작과 정지 = 129
  5.6 CLI 기반 MapReduce 관리 = 136
 Chapter 6 Hadoop 애플리케이션 실행 = 143
  6.1 테스트 애플리케이션 = 144
  6.2 MapReduce 애플리케이션(자바) = 144
  6.3 HadoopStreaming 애플리케이션 = 150
  6.4 Pig 애플리케이션 = 153
  6.5 Hive 애플리케이션 = 160
 Chapter 7 Hadoop 클러스터 구축 = 167
  7.1 완전 분산 클러스터 = 168
  7.2 환경 구축의 전제 조건 = 168
  7.3 Hadoop 클러스터 환경 구축 = 169
  7.4 웹 인터페이스를 통한 동작 확인 = 178
  7.5 샘플 애플리케이션 실행 = 181
PART 2 MapReduce 애플리케이션 개발 = 185
 Chapter 8 MapReduce 프로그래밍 기초 - 자바를 사용한 개발 (1) = 187
  8.1 자바를 사용한 MapReduce 개발 = 188
  8.2 소스 코드 단계에서 프로그램 실행 = 190
  8.3 Mapper = 194
  8.4 Reducer = 197
  8.5 Writable = 199
  8.6 InputFormat/OutputFormat = 203
  8.7 main 프로그램 = 207
 Chapter 9 MapReduce 프로그래밍 응용 - 자바를 사용한 개발 (2) = 215
  9.1 MapReduce 프로그램 커스터마이즈 = 216
  9.2 입력 데이터 조작을 제어한다 = 216
  9.3 출력 데이터 제어 = 226
  9.4 독자 데이터형을 정의한다 = 229
  9.5 Shuffle 단계 동작 제어 = 231
  9.6 MapReduce 애플리케이션 테스트 및 디버깅 = 235
 Chapter 10 MapReduce 개발 팁 - 자바를 사용한 개발 (3) = 243
  10.1 이 장에서 소개할 내용 = 244
  10.2 압축 데이터 다루기 = 244
  10.3 MapReduce 처리에 적합한 파일 포맷 = 247
  10.4 한 번에 복수의 파일 포맷 처리 = 249
  10.5 분산 캐시 이용 = 252
  10.6 Map 태스크/Reduce 태스크 실행 Context 처리 = 254
  10.7 처리 중에 발생한 이벤트를 집계 = 256
  10.8 MapReduce 애플리케이션 설정을 제어 = 259
 Chapter 11 HadoopStreaming = 263
  11.1 HadoopStreaming이란? = 264
  11.2 HadoopStreaming 애플리케이션 구성 = 264
  11.3 HadoopStreaming 활용 예 = 270
  11.4 HadoopStreaming 명령어 옵션 = 275
 Chapter 12 데이터 흐름형 처리 언어 Pig = 283
  12.1 Pig란? = 284
  12.2 Pig 실행 방법 = 286
  12.3 Pig의 데이터 관리 = 288
  12.4 Pig에서의 처리 방법 = 290
  12.5 함수 = 298
  12.6 애플리케이션 개발 = 301
  12.7 Pig Latin 처리 구현 = 303
  12.8 사용자 정의 함수 구현 = 306
  12.9 Pig 디버그 = 313
  12.10 Pig를 활용하기 위한 포인트 = 315
 Chapter 13 SQL 유사 인터페이스 Hive = 319
  13.1 Hive 개요 = 320
  13.2 Hadoop과 Hive = 321
  13.3 HiveQL = 324
  13.4 효율적인 Hive 활용법 = 347
PART 3 Hadoop 클러스터 구축과 운영 = 359
 Chapter 14 환경 구축 효율화 = 361
  14.1 환경 구축과 설정 자동화 = 362
  14.2 환경 구축 서버 설치 = 365
  14.3 OS 자동 설치 = 373
  14.4 Puppet을 사용한 환경 설정 = 377
  14.5 PSSH를 이용한 운영 = 388
  14.6 Hadoop 설정의 베스트 환경 = 392
 Chapter 15 가용성 향상 = 395
  15.1 고가용성의 기본 = 396
  15.2 HDFS 고가용성 = 401
  15.3 MapReduce 고가용화 = 413
 Chapter 16 클러스터 모니터링 = 425
  16.1 Hadoop 모니터링 = 426
  16.2 Ganglia를 통한 Hadoop 클러스터 메트릭스 취득 = 437
  16.3 Hadoop 클러스터 감시 = 445
 Chapter 17 클러스터 운영 = 459
  17.1 Hadoop 운영이란? = 460
  17.2 운영 시 구체적인 작업 = 462
  17.3 정기적으로 실시해야 할 작업 = 474
  17.4 Hadoop 클러스터 확장 = 479
  17.5 클러스터 장애 대응 = 481
 Chapter 18 복수 사용자에 의한 리소스 제어 = 493
  18.1 리소스 제어 도입 = 494
  18.2 기본 설정 = 495
  18.3 스케줄러를 사용한 리소스 분배 제어 = 500
PART 4 Hadoop 활용 기술 = 521
 Chapter 19 Hadoop 튜닝 = 523
  19.1 튜닝이 필요한 케이스 = 524
  19.2 MapReduce 잡 동작에 영향을 주는 설정 = 524
  19.3 Map 태스크 튜닝 = 527
  19.4 Reduce 태스크 튜닝 = 532
  19.5 자바 VM 튜닝 = 535
  19.6 OS 튜닝 = 545
 Chapter 20 분산형 데이터베이스 HBase = 551
  20.1 HBase란? = 552
  20.2 HBase 데이터 모델 = 554
  20.3 아키텍처 = 555
  20.4 설치 방법 = 558
  20.5 HBase Shell = 563
  20.6 MapReduce 잡 활용 = 572
  20.7 HBase 테이블 설계 = 578
 Chapter 21 Fluentd 로그 수집기 = 581
  21.1 로그 수집기 등장 배경 = 582
  21.2 Fluentd란? = 584
  21.3 모든 로그를 JSON으로 = 587
  21.4 Fluentd 설치 = 588
  21.5 Fluentd 기본 = 590
  21.6 HDFS에 기록하기 위한 설정 예 = 593
  21.7 Fluentd 내부 구조 = 595
  21.8 Fluentd HA 구성 = 598
  21.9 Fluentd 튜닝 = 601
  21.10 Fluentd 모니터링 = 602
  21.11 Fluentd와 유사한 소프트웨어 = 604
 Chapter 22 YARN = 605
  22.1 YARN 기초 지식 = 606
  22.2 YARN 아키텍처 = 611
  22.3 Hadoop/MapReduce/YARN과 기존 Hadoop/MapReduce의 차이 = 613
  22.4 YARN을 이용한 MapReduce 실행 = 615
찾아보기 = 629

New Arrivals Books in Related Fields