HOME > Detail View

Detail View

(이클립스 환경에서의) 빅데이터 프로그래밍

(이클립스 환경에서의) 빅데이터 프로그래밍 (Loan 13 times)

Material type
단행본
Personal Author
황세규
Title Statement
(이클립스 환경에서의) 빅데이터 프로그래밍 = Big data programming / 황세규
Publication, Distribution, etc
고양 :   지앤선,   2015  
Physical Medium
xv, 373 p. : 삽화, 도표 ; 23 cm
ISBN
9788993827897
000 00000cam c2200205 c 4500
001 000045823362
005 20150212095213
007 ta
008 150212s2015 ggkad 000c kor
020 ▼a 9788993827897 ▼g 93560
035 ▼a (KERIS)BIB000013685015
040 ▼a 211062 ▼c 211062 ▼d 211009
082 0 4 ▼a 005.74 ▼2 23
085 ▼a 005.74 ▼2 DDCK
090 ▼a 005.74 ▼b 2015z1
100 1 ▼a 황세규
245 2 0 ▼a (이클립스 환경에서의) 빅데이터 프로그래밍 = ▼x Big data programming / ▼d 황세규
260 ▼a 고양 : ▼b 지앤선, ▼c 2015
300 ▼a xv, 373 p. : ▼b 삽화, 도표 ; ▼c 23 cm
945 ▼a KLPA

Holdings Information

No. Location Call Number Accession No. Availability Due Date Make a Reservation Service
No. 1 Location Science & Engineering Library/Sci-Info(Stacks1)/ Call Number 005.74 2015z1 Accession No. 121232091 Availability Available Due Date Make a Reservation Service B M

Contents information

Book Introduction

Hadoop 프레임워크의 이론에 대한 설명과 더불어 예제를 Hadoop 2.2 용 Eclipse 플러그인을 사용하여 Eclipse 통합 환경의 맵리듀스 퍼스펙티브 환경에서 Hadoop 프로젝트를 개발, 구현하고 배포하는 데 목적을 둔다. 또한 대표적인 NoSQL인 HBase와 MongoDB를 다루는 챕터에서도 NoSQL의 운영과 관리보다는 Hadoop을 다룬 챕터와 같이 Eclipse 환경의 맵리듀스 퍼스펙티브 환경에서 Java 프로그래밍에 초점을 맞추었다.

HBase와 MongoDB의 개념과 API를 이해한다면 이 책의 NoSQL 예제의 난이도는 Eclipse 환경에서 일반 관계형 데이터베이스의 Java 프로그래밍과 큰 차이를 보이지 않을 것이다. 또한 모든 예제는 프로젝트 생성 시 맵리듀스 퍼스펙티브가 자동으로 빌드 경로로 Hadoop 패키지를 추가한다. 따라서 예제에서 사용되는 클래스와 인터페이스를 Eclipse 개발 환경의 코드 어시스턴스(code assistance) 기능으로 손 쉽게 구현할 수 있다.

처음 빅데이터 프로그래밍에 발을 들이는 개발자는 맵리듀스 프레임워크의 개념 이해와 함께 개발 환경에서 어려움을 겪는 일이 있다. 주로 Java로 맵리듀스와 Hive, NoSQL인 HBase, MongoDB 등을 프로그래밍 하는데 이전에 익숙해져 있던 Eclipse 통합 개발 환경과의 연계가 명료하지 못하였다. 이 책은 Hadoop 프레임워크의 이론에 대한 설명과 더불어 예제를 Hadoop 2.2 용 Eclipse 플러그인을 사용하여 Eclipse 통합 환경의 맵리듀스 퍼스펙티브 환경에서 Hadoop 프로젝트를 개발, 구현하고 배포하는 데 목적을 둔다. 또한 대표적인 NoSQL인 HBase와 MongoDB를 다루는 챕터에서도 NoSQL의 운영과 관리보다는 Hadoop을 다룬 챕터와 같이 Eclipse 환경의 맵리듀스 퍼스펙티브 환경에서 Java 프로그래밍에 초점을 맞추었다.

HBase와 MongoDB의 개념과 API를 이해한다면 이 책의 NoSQL 예제의 난이도는 Eclipse 환경에서 일반 관계형 데이터베이스의 Java 프로그래밍과 큰 차이를 보이지 않을 것이다. 또한 모든 예제는 프로젝트 생성 시 맵리듀스 퍼스펙티브가 자동으로 빌드 경로로 Hadoop 패키지를 추가한다. 따라서 예제에서 사용되는 클래스와 인터페이스를 Eclipse 개발 환경의 코드 어시스턴스(code assistance) 기능으로 손 쉽게 구현할 수 있다. 이전의 Eclipse 통합 개발 환경에서 Java 프로그래밍을 구현한 개발자는 동일한 환경에서 Hadoop 2.2의 파일 시스템과 맵리듀스의 개념을 이해하고 실습 및 배포를 할 수 있다. 그리고 Hive와 NoSQL의 HBase와 MongoDB에 대해서도 관계형 데이터베이스와 거의 비슷한 과정과 난이도로 Java를 이용한 맵리듀스 프로그래밍이 가능하다. 이 책은 Hadoop 2.2와 맵리듀스, Hive, 그리고 NoSQL의 HBase와 MongoDB의 초심자들과 대규모 프로젝트에 앞서 소규모 파일럿 프로젝트 수행자들에게 추천할 만한 내용이 될 것이다.

[이 책의 구성]

<1장 빅데이터의 개요>에서는 빅 데이터의 정의 및 역사와 적용 사례를 통하여 개념을 공부한다. 이미 빅 데이터에 대한 사전지식을 가지고 있는 독자라면 가벼운 마음으로 읽어 봐도 좋을 것이다. 관계형 데이터베이스와의 차이와 장단점을 비교 분석하였고 구축 개념의 차이도 설명하였다.

<2장 Hadoop 2.0>에서는 이전의 Hadoop 1.x보다 진일보한 Hadoop 2의 특징을 간단하게 설명하였다.

<3장 Hadoop 2.2 개발 환경>은 이 책의 예제 개발 환경을 설명하였다.

<4장 HDFS 프로그래밍>은 Hadoop 분산 파일 시스템에 대한 설명과 API 소개, 그리고 예제를 다루었다.

<5장 기본 Map-Reduce 프로그래밍>과 <6장 고급 Map-Reduce 프로그래밍>에서는Hadoop의 맵리듀스 프레임워크와 API, Eclipse 맵리듀스 퍼스펙티브에서의 예제 프로그래밍에 대해 설명을 하고 있다.

<7장 Hive 프로그래밍>에서는 Hadoop 생태계의 데이터 웨어하우스 용 SQL on Hadoop 프로젝트인 Hive에 대해 설명한다. 예제는 앞 절의 맵리듀스 예제를 HiveQL로 동일하게 구현하였다.

<8장 NoSQL 등장>에서는 빅데이터 데이터베이스인 NoSQL의 개념과 구조에 대해 설명하였다. 관계형 데이터베이스와의 내부적인 구현 이론을 비교 분석하였고 구조의 NoSQL 데이터베이스에 대해서 설명한다.

<9장 HBase 프로그래밍>에서는 Hadoop 생태계의 대표적인 NoSQL 데이터베이스인 HBase에 대해 설명하였다. 기본 구조와 데이터베이스 관리적인 측면은 개념적으로만 설명하였고 Eclipse 환경에서 HBase의 Java 프로그래밍에 대해 API 설명과 함께 예제를 중점적으로 설명하였다.

<10장 MongoDB 프로그래밍>에서는 현재 NoSQL중 가장 많은 점유율을 갖는 MongoDB에 대해 설명하였다. 9장과 마찬가지로 데이터베이스의 개념과 관리는 개념적인 설명으로 정리하였고 책의 요지에 맞게 Java API 설명과 Eclipse 환경에서 Java를 이용한 MongoDB 프로그래밍에 중점을 두었다.


Information Provided By: : Aladin

Author Introduction

황세규(지은이)

연세대학교에서 기계공학을 전공하였고 대학원에서 석사학위를 취득하였다. 2000 년 부터 IT업무를 시작하였지만 현재는 재충전의 시간을 갖고 있다. 주로 Business Intelligence(BI) 솔루션 개발 경력을 가지고 있으며 지금도 새로운 개념의 BI 솔루션에 대해 연구하고 있다. DW/BI와 더불어 빅데이터와 클라우드 환경에 대한 솔루션을 계속 공부하고 있으며 이를 아우르는 비즈니스에 많은 관심을 가지고 있다. 한국 JBoss User Group의 회원으로 활동하고 있으며, 저서로 이 있다.

Information Provided By: : Aladin

Table of Contents

목차
CHAPTER 01 빅데이터 개요 = 1
 1.1 빅데이터의 정의 및 배경 = 1
 1.2 빅데이터 역사 = 6
 1.3 빅데이터 기술 = 8
 1.4 적용 사례 = 10
  1.4.1 구글 감기 트렌드 분석 = 10
  1.4.2 아마존 추천 검색 = 11
  1.4.3 미국 오바마 선거 캠프 = 11
  1.4.4 서울시 심야버스 노선 = 12
CHAPTER 02 Hadoop 2.0 = 13
 2.1 Hadoop 2.0 특징 = 13
 2.2 HDFS 2 = 14
 2.3 YARN = 17
CHAPTER 03 Hadoop 2.2 개발환경 = 21
 3.1 Hadoop 2.2 설치 = 21
  3.1.1 SSH 설정 = 21
  3.1.2 Hadoop 2.2 설치 및 환경설정 = 23
 3.2 Hadoop Eclipse Plugin 설치 = 28
 3.3 실습 데이터 준비 = 31
  3.3.1 데이터 다운로드 = 31
  3.3.2 데이터 분석 = 33
  3.3.3 데이터 추출 함수 = 34
CHAPTER 04 HDFS 프로그래밍 = 37
 4.1 HDFS 명령어 설명 = 37
  4.1.1 파일 조회 = 38
  4.1.2 파일 조작 = 40
  4.1.3 파일 관리 = 44
 4.2 HDFS API 설명 = 46
  4.2.1 Configuration 클래스 = 46
  4.2.2 Path 클래스 = 46
  4.2.3 FileSystem 클래스 = 47
  4.2.4 FileStatus 클래스 = 48
 4.3 실습 = 48
CHAPTER 05 기본 Map/Reduce 프로그래밍 = 55
 5.1 개요 = 55
 5.2 API 설명 = 58
  5.2.1 Map Reduce 기본 데이터 타입 클래스 = 58
  5.2.2 Map 클래스 = 62
  5.2.3 Reduce 클래스 = 64
  5.2.4 Job 클래스 = 65
  5.2.5 InputFormat 클래스 = 67
  5.2.6 OutputFormat 클래스 = 68
 5.3 기본 예제 = 68
  5.3.1 글자수 계산 예제(WordCount) = 68
   5.3.1.1 Map/Reduce 프로세스 = 68
   5.3.1.2 실습 = 71
  5.3.2 데이터 추출 실습 예제(MapredDataETL) = 79
   5.3.2.1 Map/Reduce 프로세스 = 79
   5.3.2.2 실습 = 84
CHAPTER 06 고급 Map/Reduce 프로그래밍 = 95
 6.1 사용자 정의 복합키 = 95
  6.1.1 개념 = 95
  6.1.2 API 설명 = 95
  6.1.3 복합키 예제(MapredDataSort) = 97
   6.1.3.1 Map/Reduce 프로세스 = 97
   6.1.3.2 실습 = 98
 6.2 다중 출력 = 114
  6.2.1 개념 = 114
  6.2.2 API 설명 = 115
  6.2.3 다중 출력 예제(MapredDataMultioutputs) = 116
 6.3 Join = 138
  6.3.1 개념 = 138
  6.3.2 API 설명 = 140
  6.3.3 Join 예제(MapredDataJoin) = 141
   6.3.3.1 Map/Reduce 프로세스 = 141
   6.3.3.2 실습 = 143
 6.4 Chain Map/Reduce = 167
  6.4.1 개념 = 167
  6.4.2 API 설명 = 169
  6.4.3 Chain Map Reduce 예제(MapredDataChain) = 170
   6.4.3.1 Map/Reduce 프로세스 = 170
   6.4.3.2 실습 = 173
CHAPTER 07 Hive 프로그래밍 = 201
 7.1 개요 및 아키텍처 = 201
  7.1.1 Hive 개요 및 아키텍처 = 201
  7.1.2 설치 및 Eclipse 연동 = 203
 7.2 HiveQL = 206
  7.2.1 데이터 형 = 206
   7.2.1.1 원시 데이터 형 = 206
   7.2.1.2 컬렉션 데이터 형 = 207
  7.2.2 데이터 정의 언어 = 208
   7.2.2.1 데이터베이스 정의 = 208
   7.2.2.2 테이블 정의 = 209
  7.2.3 데이터 조작 언어 = 211
   7.2.3.1 LOAD DATA 문 = 211
   7.2.3.2 INSERT 문 = 211
  7.2.4 데이터 쿼리 언어 = 212
   7.2.4.1 SELECT 문 = 212
   7.2.4.2 칼럼 값 계산 및 관련 함수 = 212
   7.2.4.3 내장함수= 214
   7.2.4.4 GROUP BY 와 HAVING 절 = 215
   7.2.4.5 JOIN 문 = 215
   7.2.4.6 ORDER BY 와 SORT BY 절 = 215
 7.3 실습 = 216
CHAPTER 08 NoSQL 등장  
 8.1 NoSQL의 정의와 개요 = 227
 8.2 NoSQL의 데이터 모델 및 종류 = 229
  8.2.1 Key-Value 형 = 230
  8.2.2 Column 형 = 230
 8.3. Document 형 = 232
CHAPTER 09 HBase 프로그래밍 = 235
 9.1 HBase 개요 = 235
  9.1.1 HBase 개념 및 구조 = 235
  9.1.2 HBase 설치 및 설정 = 241
  9.1.3 기본 관리 = 245
 9.2 HBase Java API = 250
  9.2.1 기본 API 설명 = 250
   9.2.1.1 Cell 인터페이스 = 250
   9.2.1.2 CellUtil 클래스 = 251
   9.2.1.3 Delete 클래스 = 252
   9.2.1.4 Get 클래스 = 252
   9.2.1.5 HTable 클래스 = 253
   9.2.1.6 Put 클래스 = 255
   9.2.1.7 Result 클래스 = 255
   9.2.1.8 ResultScanner 인터페이스 = 256
   9.2.1.9 Scan 클래스 = 256
   9.2.1.10 Filter 클래스 = 258
  9.2.1. Bytes 클래스 = 259
  9.2.2 관리 기능 API 설명 = 260
   9.2.2.1 HBaseConfiguration 클래스 = 260
   9.2.2.2 HColumnDescriptor 클래스 = 260
   9.2.2.3 HTableDescriptor 클래스 = 262
   9.2.2.4 TableName 클래스 = 263
   9.2.2.5 HBaseAdmin 클래스 = 264
  9.2.3 Map/Reduce API 설명 = 267
   9.2.3.1 ImmutableBytesWritable 클래스 = 267
   9.2.3.2 TableMapper 클래스 = 267
   9.2.3.3 TableReducer 클래스 = 267
   9.2.3.4 TableMap/ReduceUtil 클래스 = 268
   9.2.3.5 TableInputFormat/TableOutputFormat 클래스 = 268
 9.3 HBase Java 예제 = 269
  9.3.1 HBase Java API 예제 1 = 269
  9.3.2 HBase Map/Reduce 예제 1 = 280
   9.3.2.1 Map/Reduce 프로세스 = 281
   9.3.2.2 실습 = 281
  9.3.3 HBase Map/Reduce 예제 2 = 293
   9.3.3.1 Map/Reduce 프로세스 = 294
   9.3.3.2 실습 = 295
CHAPTER 10 MongoDB 프로그래밍 = 307
 10.1 MongoDB 개요 = 307
  10.1.1 MongoDB 개념 및 구조 = 307
  10.1.2 MongoDB 설치 및 설정 = 310
  10.1.3 기본 관리 = 320
 10.2 Mongo Java API = 320
  10.2.1 API 설명 = 321
   10.2.1.1 BasicDBList 클래스 = 321
   10.2.1.2 BasicDBObject 클래스 = 322
   10.2.1.3 BasicDBObjectBuilder 클래스 = 322
   10.2.1.4 DB 클래스 = 323
   10.2.1.5 DBAddress 클래스 = 323
   10.2.1.6 DBCollection 클래스 = 324
   10.2.1.7 DBCursor 클래스 = 325
   10.2.1.8 Mongo 클래스 = 326
   10.2.1.9 MongoClient 클래스 = 326
   10.2.1.10 WriteConcern 클래스 = 327
   10.2.1.11 Map/ReduceCommand 클래스 = 328
   10.2.1.12 Map/ReduceOutput 클래스 = 328
  10.2.2 Mongo Java API 예제 1(MongoJavaClient) = 328
  10.2.3 Mongo Java API 예제 2(MongoJavaMapred) = 337
   10.2.3.1 Map/Reduce 프로세스 = 337
   10.2.3.2 실습 = 341
 10.3 Mongo Hadoop API = 348
  10.3.1 API 설명 = 348
   10.3.1.1 BSONWritable 클래스 = 348
   10.3.1.2 MongoUpdateWritable 클래스 = 348
   10.3.1.2 MongoInputFormat/MongoOutputFormat 클래스 = 348
  10.3.2 Mongo Hadoop API 예제 1 (MongoHadoopDBIn-sert) = 349
   10.3.2.1 Map/Reduce 프로세스 = 350
   10.3.2.2 실습 = 350
 10.3.3 Mongo Hadoop API 예제 2(MongoHadoop-Mapred) = 365
   10.3.3.1 Map/Reduce 프로세스 = 365
   10.3.3.2 실습 = 366

New Arrivals Books in Related Fields