HOME > 상세정보

상세정보

(Do it! 직접 해보는) 하둡 프로그래밍 (42회 대출)

자료유형
단행본
개인저자
한기용
서명 / 저자사항
(Do it! 직접 해보는) 하둡 프로그래밍 / 한기용 지음
발행사항
서울 :   이지스퍼블리싱,   2013  
형태사항
382 p. : 삽화 ; 25 cm
총서사항
(세상의 속도를 따라잡고 싶다면) do it!
ISBN
9788997390144
일반주기
하둡, 이론에 그치지 않고 빅데이터로 실습하며 익힌다! ; 하둡을 만든 더그 커팅과 함께 일한 저자가 직접 집필!  
부록: MS 윈도우에서 하둡 설치하기  
000 00874camcc2200265 c 4500
001 000045747443
005 20130410182704
007 ta
008 130410s2013 ulka 000c kor
020 ▼a 9788997390144 ▼g 13560
035 ▼a (KERIS)BIB000013084830
040 ▼a 211062 ▼c 211062 ▼d 211009
082 0 4 ▼a 004.36 ▼2 23
085 ▼a 004.36 ▼2 DDCK
090 ▼a 004.36 ▼b 2013z1
100 1 ▼a 한기용
245 2 0 ▼a (Do it! 직접 해보는) 하둡 프로그래밍 / ▼d 한기용 지음
246 1 1 ▼a Do it! Hadoop wiht big data
260 ▼a 서울 : ▼b 이지스퍼블리싱, ▼c 2013
300 ▼a 382 p. : ▼b 삽화 ; ▼c 25 cm
440 1 0 ▼a (세상의 속도를 따라잡고 싶다면) do it!
500 ▼a 하둡, 이론에 그치지 않고 빅데이터로 실습하며 익힌다! ; 하둡을 만든 더그 커팅과 함께 일한 저자가 직접 집필!
500 ▼a 부록: MS 윈도우에서 하둡 설치하기
945 ▼a KLPA

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 004.36 2013z1 등록번호 121224554 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 2 소장처 세종학술정보원/과학기술실/ 청구기호 004.36 2013z1 등록번호 151320964 도서상태 대출가능 반납예정일 예약 서비스
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 004.36 2013z1 등록번호 121224554 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 세종학술정보원/과학기술실/ 청구기호 004.36 2013z1 등록번호 151320964 도서상태 대출가능 반납예정일 예약 서비스

컨텐츠정보

책소개

하둡을 만든 더그 커팅과 함께 일한 저자가 집필한 하둡 입문서. 방대한 하둡의 핵심을 정확하게 짚어 체계적으로 설명한 후, 하둡의 기초부터 고급 프로그래밍까지 단계별로 따라할 수 있도록 구성했다. 특히 하둡을 수박 겉핥기로 설명하지 않고 저자가 제시한 실습용 데이터를 가지고 직접 따라해볼 수 있도록 구성된 것도 장점이다. 기존의 검색 프로그램과 하둡 프로그램의 비교를 통해 하둡의 우수함을 확인할 수 있도록 1GB의 대용량 데이터를 사용하여 빅데이터를 체험할 수 있을 것이다. 이 책의 예제 곳곳에서 저자의 실무 경험이 배어나온다.

실리콘밸리 야후 개발자의 경험을 공개한다!
이 책은 하둡 설치부터 하둡 프로그래밍까지 단계적으로 명쾌하게 설명한 책이다.
총 세 개의 마당과 총 10장(부록 포함)으로 구성되어 있는데, 첫째마당은 빅데이터와 하둡에 대한 개론적인 설명이고 둘째, 셋째 마당은 프로그래밍 중심으로 소스 코드에 대한 로직과 설명이다. 빅데이터나 하둡에 대한 경험이 거의 없는 독자를 위해 어렵거나 생소한 용어는 ‘노트’ 코너를 통해 추가 설명하여 이해를 도왔다.
각 장의 마무리는 도전 퀴즈와 미션으로 장의 내용을 완벽히 이해했는지 확인하고 다른 응용력도 키울 수 있도록 구성하여 교재로 사용하기에도 적합하다. 이 책의 명쾌한 설명들은 하둡이 탄생할 때부터 함께한 저자의 노하우뿐 아니라 실리콘밸리에서 일하기 전, 한국에서 했던 강의와 집필 경험 덕분이기도 하다.

첫째마당의 1장에서는 빅데이터가 무엇인지 정의부터 시작해서 빅데이터의 예를 들고 빅데이터 시스템의 구성과 성공 사례, 관련 기업 등에 대해 설명한다. 2장에서는 빅데이터를 처리하는 근간이 되는 하둡이 무엇인지에 대해 조금 더 기술적인 측면에서 분산파일 시스템인 HDFS(Hadoop Distributed File System)와 분산처리 시스템인 MapReduce 프레임워크에 대해 소개한다. 3장에서는 실제로 리눅스 우분투 환경에서 하둡을 설치하는 과정을 설명한다. MS 윈도우 컴퓨터만 있는 독자라면 부록을 참고해서 VM 매니저의 설치 후에 우분투를 게스트 운영체제로 설치하고 그 다음에 3장의 설치과정을 반복하면 된다. 4장에서는 하둡 환경에서 처음 프로그래밍으로 주어진 텍스트에서 단어들의 빈도수를 계산하는 WordCount라는 프로그램을 자바로 구현한다.

둘째마당에서는 자바를 기반으로 하둡 MapReduce 프로그래밍에 대해 더 자세히 배운다. 5장에서는 4장에서 만든 WordCount를 바탕으로 하둡 MapReduce의 내부동작에 대해 좀더 자세히 배우며 하둡의 소스를 바탕으로 내부 동작을 설명한다. 6장과 7장에서는 위키피디아 영문 문서들을 대상으로 다양한 하둡 프로그래밍(MapReduce)을 한다. 6장에서는 보다 기본적인 프로그래밍들을 배우고 7장에서는 조금 더 진보된 주제들(2차 소팅, ElasticSearch와의 연동 등)을 다룬다.

셋째마당의 8장에서는 자바가 아닌 다른 MapReduce 프로그래밍 언어로는 어떤 것이 있는지 알아본다. 하둡 스트리밍과 Pig에 대해서는 WordCount 프로그램을 실제로 구현해보고 실행해보면서 하둡의 또 다른 예를 자세히 소개한다. 9장에서는 아마존의 AWS에서 제공하는 클라우드 하둡 서비스인 ElasticMapReduce에 대해서 설명한다.
마지막으로 부록에서는 MS 윈도우에서 VM 머신을 설치하고 그 위에 우분투를 설치하는 방법에 대해 단계별로 설명한다.

이 책의 피드백 사이트 운영 - http://cafe.naver.com/cloudbigdata
이 책에 사용된 소스와 프로젝트 파일 제공
- https://s3.amazonaws.com/hadoopkr/source.tar.gz
이 책에 사용된 대용량 데이터 파일 제공
- https://s3.amazonaws.com/hadoopkr/data.tar.gz
이 책의 강의 자료 제공 - 메일(nlrose@easyspub.co.kr )로 문의, 접수


정보제공 : Aladin

저자소개

한기용(지은이)

서울대학교 컴퓨터공학과 석사 과정을 밟으며 비트교육센터에서 강의했다. 소프트웨어 지식을 쉽게 설명해 풀어가는 습관은 이때부터 시작되어 석사 과정을 마치고 삼성전자에서 소프트웨어 엔지니어로 일하면서 《비주얼 C++》와 《윈도우 프로그래밍》 책을 집필했다. 당시 방대한 윈도우 프로그래밍 방법을 쉽고 간단하게 풀어쓴 덕분에 많은 컴퓨터공학 관련 학부의 대표적인 교재로 채택되기도 했다. 2004년부터 야후, 실리콘밸리 본사의 웹 검색엔진 개발팀에 근무하기 시작했다. 2006년 초 하둡을 만든 더그 커팅이 같은 부서로 들어오면서 야후 검색엔진 모듈을 하둡으로 포팅하기 시작했다. 이때 하둡을 처음 접했고 2008년에 야후 내에 천 대 규모의 하둡 클러스터가 생기면서 야후 검색엔진으로 들어오는 검색어 로그와 웹 검색 결과 클릭 로그를 하둡으로 처리하는 일을 했다. 오픈소스 프로젝트로 시작한 하둡이 빅데이터와 함께 널리 확산되는 추세에 맞추어 필자는 2011년에 야후를 그만두고 2012년부터 하둡 관련 컨설팅 일을 시작했고 지금은 실리콘밸리 소재 유망한 소셜커머스 벤처기업인 Polyvore에서 하둡 기반 추천 엔진 아키텍트로 일하고 있다. * 대표 저서 한번 더 생각한 비주얼 C++와 MFC 프로그래밍 집필 (대림) 한번 더 생각한 윈도우 프로그래밍 집필 (대림) 클릭하세요 닷넷 API 프로그래밍 집필 (대림) 프로그래머 그들만의 이야기 집필 (영진)

정보제공 : Aladin

목차

목차
첫째마당 : 빅데이터와 하둡 이해하기 
 01장 빅데이터란? = 14
  01-1 빅데이터의 정의 = 15
  01-2 빅데이터의 예 = 19
  01-3 빅데이터 시스템의 구성 = 24
  01-4 몇 가지 성공 스토리들 = 31
  01-5 빅데이터 시스템 도입에서 얻은 교훈과 문제점 = 34
  01-6 빅데이터 시장에서 중요한 역할을 하는 기관/회사들 = 38
  마무리 = 42
 02장 하둡 이해하기 = 45
  02-1 하둡이란? = 46
  02-2 하둡 아키텍처 = 53
  02-3 HDFS 개요 = 55
  02-4 MapReduce 프레임워크 = 66
  02-5 MapReduce 사용 적합 분야와 부적합 분야 = 77
  마무리 = 80
 03장 하둡 설치하기 = 83
  03-1 설치 환경 = 84
  03-2 하둡 다운로드 및 필요 소프트웨어 설치 = 87
  03-3 독자 모드 설치와 확인 = 94
  03-4 의사 분산 모드 설치와 확인 = 101
  마무리 = 115
 4장 첫 번째 MapReduce 프로그래밍 - WordCount = 118
  04-1 맵과 리듀스 = 119
  04-2 WordCount 프로그램이란? = 122
  04-3 자바 MapReduce 프로그램의 기본 골격 = 125
  04-4 WordCount 소스 프로그램 보기 = 129
  04-5 WordCount 프로그램의 컴파일과 실행 = 136
  04-6 전체 소스 코드 리스트 = 146
  마무리 = 147
둘째마당 : 자바 MapReduce 프로그래밍 
 05장 WordCount 프로그램 자세히 보기 = 152
  05-1 맵 클래스 다시 살펴보기 = 153
  05-2 MapReduce 프로그래밍에서 사용되는 변수 타입들 = 158
  05-3 입력 포맷의 역할 = 163
  05-4 컴바이너란? = 170
  05-5 셔플링과 소팅 = 172
  05-6 리듀스 클래스 자세히 보기 = 179
  05-7 출력 포맷 = 183
  05-8 카운터 = 189
  05-9 MRUnit과 메이븐 = 192
  05-10 잡 트래커 웹 인터페이스 = 198
  마무리 = 201
 06장 기본 MapReduce 프로그래밍 = 204
  06-1 사용 데이터 설명 = 205
  06-2 WordCount 2 프로그램 = 211
  06-3 TopN 프로그램 = 218
  06-4 Count Trigram 프로그램 = 229
  06-5 Count Citation 프로그램 = 236
  06-6 Join ID&Title 프로그램 = 240
  마무리 = 249
 07장 고급 MapReduce 프로그래밍 = 252
  07-1 MapReduce 프레임워크를 이용한 문자열 소팅 - StringSort 프로그램 = 253
  07-2 분산 캐시를 이용한 조인 - JoinIDTitle2 = 260
  07-3 역색인 만들기 - Inverted Index 버전 1 = 267
  07-4 역색인 만들기 - Inverted Index 버전 2 = 273
  07-5 역색인 만들기 - Inverted Index 버전 3 = 277
  07-6 검색엔진 색인 만들기 - CreateESIndex = 290
  마무리 = 305
셋째마당 : Pig, 스트리밍, 아마존 ElasticMapReduce 프로그래밍 
 08장 Pig, 스트리밍 MapReduce 프로그래밍 언어 = 310
  08-1 자바 이외의 다른 프로그래밍 언어들 = 311
  08-2 스트리밍 프로그래밍 = 314
  08-3 Pig 프로그래밍 = 322
  마무리 = 339
 09장 아마존 ElasticMapReduce 사용해보기 = 342
  09-1 클라우드 컴퓨팅이란? = 343
  09-2 아마존의 AWS 소개 = 345
  09-3 ElasticMapReduce 소개 = 354
  09-4 ElasticMapReduce : 위저드 = 358
  09-5 ElasticMapReduce : 루비 클라이언트 = 363
  마무리 = 371
1장∼9장 마무리 = 374
부록 - MS 윈도우에서 하둡 설치하기 = 375

관련분야 신착자료

김종원 (2020)