HOME > Detail View

Detail View

HBase 클러스터 구축과 관리 : NoSQL 데이터베이스 관리를 위한 하둡과 HBase 클러스터설치에서 고급 튜닝까지 (Loan 14 times)

Material type
단행본
Personal Author
Jiang, Yifeng 김기성, 역
Title Statement
HBase 클러스터 구축과 관리 : NoSQL 데이터베이스 관리를 위한 하둡과 HBase 클러스터설치에서 고급 튜닝까지 / 이펑 지앙 지음 ; 김기성 옮김
Publication, Distribution, etc
의왕 :   에이콘,   2013  
Physical Medium
385 p. : 삽화 ; 24 cm
Series Statement
acorn + PACKT technical book 시리즈
Varied Title
HBase administration cookbook : master HBase configuration and administration for optimum database performance
ISBN
9788960773790 9788960772106 (set)
General Note
기술 감수자: 마사타케 이와사키(Masatake Iwasaki), 타츠야 카와노(Tastuya Kawano), 마이클 모렐로(Michael, Morello), 신이치 야마시타(Shinichi Yamashita)  
색인수록  
Subject Added Entry-Topical Term
Electronic data processing -- Distributed processing Database management
000 01355camcc2200349 c 4500
001 000045766067
005 20130924101924
007 ta
008 130918s2013 ggka 001c kor
020 ▼a 9788960773790 ▼g 94560
020 1 ▼a 9788960772106 (set)
035 ▼a (KERIS)BIB000013016712
040 ▼a 222001 ▼c 222001 ▼d 211009
041 1 ▼a kor ▼h eng
082 0 4 ▼a 005.7585 ▼2 23
085 ▼a 005.7585 ▼2 DDCK
090 ▼a 005.7585 ▼b 2013z2
100 1 ▼a Jiang, Yifeng
245 1 0 ▼a HBase 클러스터 구축과 관리 : ▼b NoSQL 데이터베이스 관리를 위한 하둡과 HBase 클러스터설치에서 고급 튜닝까지 / ▼d 이펑 지앙 지음 ; ▼e 김기성 옮김
246 1 9 ▼a HBase administration cookbook : ▼b master HBase configuration and administration for optimum database performance
246 3 ▼a 에이치베이스 클러스터 구축과 관리
260 ▼a 의왕 : ▼b 에이콘, ▼c 2013
300 ▼a 385 p. : ▼b 삽화 ; ▼c 24 cm
440 0 0 ▼a acorn + PACKT technical book 시리즈
500 ▼a 기술 감수자: 마사타케 이와사키(Masatake Iwasaki), 타츠야 카와노(Tastuya Kawano), 마이클 모렐로(Michael, Morello), 신이치 야마시타(Shinichi Yamashita)
500 ▼a 색인수록
650 0 ▼a Electronic data processing ▼x Distributed processing
650 0 ▼a Database management
700 1 ▼a 김기성, ▼e
900 1 0 ▼a 지앙, 이펑, ▼e
945 ▼a KLPA

Holdings Information

No. Location Call Number Accession No. Availability Due Date Make a Reservation Service
No. 1 Location Science & Engineering Library/Sci-Info(Stacks1)/ Call Number 005.7585 2013z2 Accession No. 121226620 Availability Available Due Date Make a Reservation Service B M

Contents information

Book Introduction

HBase는 빅데이터 관리와 분석을 위해 개발된 클러스터 기반의 NoSQL 데이터베이스다. 이 책은 HBase 클러스터의 설치와 관리 방법에서 시작해 고급 튜닝 기법까지, HBase 클러스터를 운영하기 위한 전반적인 내용을 다룬다. HBase 클러스터에 필요한 하둡(Hadoop) 클러스터 및 주키퍼(ZooKeeper) 등의 설치 방법도 소개하며 이를 기반으로 HBase를 설치하는 방법을 쉽게 설명한다.

또한, HBase 클러스터의 데이터 백업 및 복구, 모니터링과 같은 관리 방법을 다루며 클러스터 운영에 매우 중요한 보안 이슈도 다룬다. 그리고 최적의 HBase 클러스터를 운영하기 위한 저자의 노하우가 담긴 고급 튜닝 기법도 전수해준다. 이 책을 통해 빅데이터 시대의 데이터베이스 관리에 필수적인 저자의 오랜 실전 경험과 노하우를 전수받을 수 있을 것이다.

HBase는 오픈소스 분산 빅데이터 저장소로 상용 머신으로 구성된 클러스터에서 수백만 개의 컬럼(column)을 가진 수십억 개의 로우(row)를 처리할 수 있다. 실시간으로 대량의 데이터를 저장하고 액세스할 방법을 찾고 있다면 HBase가 최고의 선택이 될 것이다.

『HBase 클러스터 구축과 관리』는 실제적이며 쉬운 단계별 예제를 통해 HBase를 쉽게 관리하도록 도와준다. 하둡(Hadoop)과 HBase의 관계를 이해하는 것이 HBase를 사용하는 데에 매우 중요하다. 이 책은 하둡 클러스터를 설치하고 하둡과 HBase가 같이 동작하게 설정하는 방법과 클러스터의 성능을 튜닝하는 방법을 소개한다.


★ 이 책에서 다루는 내용 ★

■ 고가용성을 지닌 분산 HBase 클러스터를 설치하고 클라이언트 API나 맵리듀스(MapReduce) 잡을 이용해 데이터를 로드한다.
■ HBase 셸 또는 SQL 유사 질의 언어를 이용한 하이브(Hive)를 사용해 HBase의 데이터를 액세스한다.
■ HBase 테이블의 데이터뿐만 아니라 데이터의 분포까지 백업하고 복구한다. 그리고 서로 다른 HBase 클러스터 사이에 데이터를 옮기고 복사한다.
■ 커널 설정과, JVM GC, 하둡, HBase 설정을 튜닝해 최대의 성능을 얻는다.
■ 문제해결 툴을 사용해 HBase를 사용하며 자주 발생하는 문제를 해결한다.
■ 읽기 또는 쓰기가 많은 클러스터를 튜닝하기 위한 고급 설정과 튜닝 방법을 소개한다.


★ 이 책의 대상 독자 ★

이 책은 HBase 관리자, 개발자를 위한 책이며, 하둡 관리자에게도 도움이 될 것이다. HBase에 대한 경험은 필요치 않으나 하둡과 맵리듀스에 대한 기본적인 이해는 필요하다.


★ 이 책의 구성 ★

1장, HBase 클러스터 설치: 1장에서는 HBase 클러스터를 셋팅하는 방법을 설명한다. 기본적인 스탠드얼론 HBase 인스턴스를 구축하는 것에서부터 아마존 EC2에 분산, 고가용성 HBase 클러스터를 설치하는 것까지 다룬다.

2장, 데이터 마이그레이션: 2장에서는 우선, HBase의 Put API를 사용해 MySQL에서 HBase로 데이터를 임포트하는 간단한 작업에 대해 설명한다. 그 후, TSV 데이터 파일을 로드하는 importtsv와 벌크 로드 툴의 사용법을 설명한다. 또한 맵리듀스 샘플을 사용해 다른 파일 포맷에서 데이터를 임포트하는 방법도 소개할 것이다. 여기서는 HBase 테이블에 데이터를 바로 적재하는 것과 하둡 분산 파일 시스템(HDFS)에 HFile 포맷 파일을 작성하는 방법도 다룬다. 그리고 마지막으로 HBase에 데이터를 적재하기 전에 영역을 미리 생성하는 방법을 설명한다.
2장에는 자바로 작성된 예제가 여러 개 있다. 독자가 자바의 기초적인 사용방법을 알고 있다고 가정하며 예제의 샘플 자바 코드를 컴파일하고 패키지화하는 방법은 다루지 않았다.

3장, 관리 도구 사용 방법: 3장에서는 HBase 웹 UI, HBase 셸, HBase hbck 등의 여러 가지 관리 툴의 사용법을 설명한다. 툴의 목적과 특정 작업을 해결하기 위한 툴의 사용법을 설명한다.

4장, HBase 데이터 백업과 복구: 4장에서는 HBase 데이터를 백업하는 다양한 방법을 설명하고, 각 방법의 장단점과 데이터셋의 크기, 자원, 요구사항에 따라 어떤 방법을 선택해야 하는지 설명한다.

5장, 모니터링과 진단: 5장에서는 Ganglia, OpenRSDB, Nagios 등의 툴을 사용해 HBase 클러스터를 모니터하고 진단하는 방법을 설명한다. 먼저 HBase 테이블의 디스크 사용량을 확인하는 방법부터 소개한다. Ganglia를 설치하고 HBase를 모니터하도록 설정하고 Ganglia 그래프의 사용방법을 보여줄 것이다. 또한 OpenTSDB도 설치하는데, OpenTSDB는 Ganglia와 비슷하지만 HBase를 사용하기 때문에 좀더 확장성이 있다.
Nagios를 설치해 HBase 관련 데몬의 상태, 하둡/HBase 로그, HBase 일관성 상태, HDFS의 상태와 사용량 등을 체크할 것이다.
마지막으로 핫 스팟 영역 이슈를 진단하고 고치는 방법을 설명한다.

6장, 관리 유지와 보안: 6장에서 소개되는 처음의 여섯 개의 예제에서는 결함을 찾고 고치는 작업, 클러스터 크기 변경, 설정 변경 등과 같은 여러 가지 HBase 관리 작업에 대해 배울 것이다.
6장에서는 보안 관련 이슈들도 살펴본다. 마지막 세 개의 예제에서는 커버로스(Kerberos)를 설치하고 이를 이용해 HDFS 보안을 설정하는 방법과 마지막으로 HBase 클라이언트 접근을 설정하는 방법을 다룬다.

7장, 문제 해결: 7장에서는 여러 가지 자주 부딪히는 문제들에 대해 살펴본다. 각 이슈들의 에러 메시지를 설명하고, 문제의 원인과 툴을 사용해 해결하는 방법을 설명한다.

8장, 기본 성능 튜닝: 8장에서는 좀더 좋은 성능을 얻기 위한 HBase 튜닝 방법을 설명한다. 우리는 또한 하둡 설정, JVM 가비지 콜렉션, OS 커널 파라미터와 같은 튜닝 포인트를 조절하는 방법도 설명한다.

9장, 고급 설정과 튜닝: 9장은 이 책에서 두 번째 성능 튜닝과 관련된 장이다. 8장에서는 HBase의 전반적인 성능 향상을 위한, 하둡 그리고 OS 설정, 자바, HBase 자체를 튜닝하는 방법을 설명했다. 이들은 많은 경우에 적용할 수 있는 일반적인 방법이다. 9장에서는 좀더 특수한 케이스를 다룬다. 그 중에서는 쓰기가 많은 클러스터에 특화되거나 클러스터의 읽기 성능 개선을 목표로 하는 방법들도 있다.


★ 저자 서문 ★

HBase는 오픈소스 분산 빅데이터 저장소로, 수백만 개의 컬럼(column)을 가진 수십억 개의 로우(row)를 처리할 수 있으며, 일반 범용 컴퓨터로 구성된 클러스터에서 동작한다. 대용량 데이터를 저장하고 실시간으로 액세스하고 싶다면 HBase가 최적의 선택이 될 것이다.

HBase Administration Cookbook은 HBase를 쉽게 관리하기 위한 실제적인 예제와 단계별로 수행할 수 있는 지시사항을 제공한다. 각 예제들은 클라우드상에서 동작하는 분산, 고가용성 HBase 클러스터를 관리하는데 필요한 다양한 프로세스를 다룬다. 이와 같은 대용량 데이터를 다루는데 있어서 가장 중요한 것은 조직화되고 관리 가능한 프로세스이며, 이 책은 독자가 이것 들을 확립할 수 있는데 도움을 줄 것이다.

이 책은 분산 HBase 클러스터를 설정하고 데이터를 옮기는 것에서부터 시작한다. 독자는 일상적인 관리에 필요한 모든 툴의 사용법뿐만 아니라, 가장 최상의 성능을 얻기 위해 클러스터를 효율적으로 관리하고 모니터링 하는 방법까지 배우게 될 것이다. 하둡과 HBase와의 관계를 이해하면 HBase를 더 잘 활용할 수 있다. 따라서 이 책은 하둡 클러스터를 셋팅하고, 하둡이 HBase와 연동되도록 설정하는 방법, 그리고 성능을 튜닝하는 방법도 다룬다.

★ 옮긴이의 말 ★

최근 IT의 가장 큰 화두로 빅데이터가 부상하고 있습니다. 이는 최근의 데이터의 개념과 관리 기술의 변화를 보여줍니다. 모바일 디바이스의 발달은 사용자가 생성하는 데이터가 폭발적으로 증가시켰습니다. 또한, 스토리지 기술의 발달은 기업이 이전에 생각지 못한 대량의 비즈니스 데이터를 축적할 수 있게 했습니다. 이와 더불어 클러스터 기술의 발달은 이런 대용량 데이터에 대한 실시간 처리 및 분석을 가능케 했습니다. 이제 모든 것이 데이터로 표현되고 저장되며 이런 데이터를 누가 얼마나 잘 관리하고 이로부터 얼마나 가치 있는 정보를 이끌어내는지가 비즈니스의 성패를 좌우하는 시대가 됐습니다.

이와 같은 빅데이터 시대에 HBase는 가장 주목 받는 오픈소스 NoSQL 데이터베이스입니다. HBase는 2006년 구글이 발표한 빅테이블(BigTable)이라는 논문에서 시작했습니다. 빅테이블은 빅데이터를 처리하기 위해 여러 상용 머신을 클러스터로 구축한 클러스터를 기반으로 동작합니다. 이런 빅테이블을 오픈소스로 구현한 구현체가 HBase입니다. HBase의 등장은 기존의 데이터베이스 패러다임을 RDBMS에서 NoSQL로 변화시킨 계기가 됐고, 그 이후로 많은 오픈소스 NoSQL 데이터베이스가 등장하게 된 시작점이 됐습니다.

이 책은 HBase를 실제로 운영하는 관리자나 HBase를 공부하려는 초심자 모두에게 매우 유용한 내용을 담고 있습니다. 저자는 자신이 근무하는 회사에서 실제로 대규모의 HBase 클러스터를 운영하고 있으며 이를 기반으로 운영되는 서비스를 관리하고 있습니다. 이 책은 이와 같은 저자의 다년간 경험을 바탕으로 HBase 운영에 가장 필요한 핵심 내용을 예제 형식으로 제공합니다.

이 책의 예제는 HBase 클러스터의 설치와 관리 방법에서 시작해 고급 튜닝 기법까지, HBase 클러스터를 운영하기 위한 전반적인 내용을 풍부하게 다룹니다. 시작은 초보자를 위해 실제 HBase 클러스터를 구축하기 위한 하둡(Hadoop) 클러스터 및 주키퍼(ZooKeeper) 등을 설치하고 이를 기반으로 HBase를 설치하는 방법을 쉽게 설명합니다. 이후에는 HBase 클러스터의 데이터 백업 및 복구, 모니터링과 같은 관리 방법을 다루며 클러스터 운영에 매우 중요한 보안 이슈도 다룹니다. 또한, 최적의 HBase 클러스터를 운영하기 위한 저자의 경험이 담긴 고급 튜닝 기법도 전수해줍니다. 이와 같은 내용은 모두 예제 형식으로 구성되어 초보자도 쉽게 실습하고 이해할 수 있으며, 예제마다 단계별 지시 사항뿐만 아니라 예제의 바탕에 깔린 핵심 원리도 자세히 설명하고 있습니다. 각 예제는 모두 HBase 관리자라면 꼭 알아야 할 핵심 내용을 다루고 있으며 예제를 실습하는 동안 자신도 모르는 사이에 HBase 전문가가 될 수 있다고 생각합니다. 이 책을 통해 빅데이터 시대의 데이터베이스 관리에 필수적인 저자의 오랜 실전 경험과 노하우를 전수받을 수 있을 것입니다.


Information Provided By: : Aladin

Author Introduction

이펑 지앙(지은이)

일본의 가장 큰 전자 상거래 회사인 라쿠텐(Rakuten)에서 하둡(Hadoop)과 HBase 관리자이자 개발자로 일하고 있다. 중국 과학 기술 대학에서 정보 관리 시스템을 전공한 후 자바 전문 소프트웨어 엔지니어로서 경력을 시작했다. 2008년 하둡 프로젝트에 관심을 갖기 시작했고, 2009년에는 이전 직장에서 하둡과 하이브(Hive) 를 사용해 디스플레이 광고 데이터 인프라 개발을 주도했다. 2010년 현재 직장에서 일을 시작했고, 하둡과 HBase를 기반으로 한 대용량 아이템 랭킹 시스템을 디자인하고 구현했다. 회사의 하둡/HBase 클러스터를 운영하는 하둡 팀의 맴버이기도 하다.

김기성(옮긴이)

서울대학교 응용화학부를 졸업하고, 서울대학교 컴퓨터공학부 대학원에서 박사학위를 받았다. 2007년부터 2009년까지 티맥스소프트에서 근무하며, 티베로 관계형 데이터베이스 개발에 참여했다. 박사 과정 동안에는 대용량 그래프 데이터를 처리하는 기법을 연구했으며, 현재는 비트나인의 연구소장을 맡고 있으며 새로운 그래프 데이터베이스 엔진 개발에 몰두하고 있다. 에이콘출판사에서 출간한 『HBase 클러스터 구축과 관리』와 『정보 스토리지와 관리』를 번역했다.

Information Provided By: : Aladin

Table of Contents

목차
acorn+PACKT 시리즈를 시작하며 = 4
저자 소개 = 6
리뷰어 소개 = 7
옮긴이의 말 = 8
옮긴이 소개 = 10
들어가며 = 16
1장. 무선 실습 환경 구축 = 23
 하드웨어 요구 사항 = 24
 소프트웨어 요구 사항 = 24
 백트랙 설치 = 25
  실습 예제|백트랙 설치 = 25
 액세스 포인트 설정 = 28
  실습 예제|액세스 포인트 설정 = 28
 무선 랜 카드 설정 = 31
  실습 예제|무선 랜 카드 설정 = 31
 액세스 포인트에 연결 = 33
  실습 예제|무선 랜 카드 설정 = 33
 요약 = 38
2장. 무선 랜의 근본적인 취약점 = 39
 무선 랜의 프레임 = 40
  실습 예제|모니터 모드 인터페이스 생성 = 42
  실습 예제|무선 패킷 스니핑 = 45
  실습 예제|관리, 제어, 데이터 프레임 분석 = 47
  실습 예제|데이터 패킷 스니핑 = 51
  실습 예제|패킷 인젝션 = 54
 무선 랜 스니핑과 인젝션 시 주의해야 할 사항 = 56
  실습 예제|채널 설정과 채널 호핑 = 56
 무선 네트워크에서의 규제 도메인 = 59
  실습 예제|알파 무선 랜 카드를 이용한 실습 = 59
 요약 = 63
3장. 무선 랜 인증 우회 = 65
 숨겨진 SSID = 65
  실습 예제|숨겨진 SSID 알아내기 = 66
 맥 필터링 = 71
  실습 예제|맥 필터링 우회 = 71
 공개 인증 = 74
  실습 예제|공개 인증 우회 = 74
 공유 키 인증 = 76
  실습 예제|공유 인증 우회 = 77
 요약 = 84
4장. 무선 랜 암호화의 결점 = 87
  무선 랜 암호화 = 88
 WEP 암호화 = 88
  실습 예제|WEP 크랙 = 89
 WPA/WPA2 = 97
  실습 예제|취약한 WPA-PSK 암호 크랙 = 99
 WPA/WPA2 PSK 크랙 가속화 = 104
  실습 예제|크랙 과정 가속화 = 104
 WEP와 WPA 패킷 복호화 = 108
  실습 예제|WEP와 WPA 패킷 복호화 = 108
 WEP와 WPA 네트워크로의 연결 = 110
  실습 예제|WEP 네트워크로의 연결 = 110
  실습 예제|WPA 네트워크로의 연결 = 111
 요약 = 113
5장. 무선 랜 인프라 공격 = 115
 액세스 포인트의 기본 계정과 암호 = 115
  실습 예제|액세스 포인트의 기본 계정 크랙 = 116
 서비스 거부 공격 = 118
  실습 예제|인증 해제 DoS 공격 = 118
 이블 트윈과 액세스 포인트 맥 스푸핑 = 121
  실습 예제|이블 트윈과 맥 스푸핑 = 122
 로그 액세스 포인트 = 126
  실습 예제|로그 액세스 포인트 = 126
 요약 = 130
6장. 클라이언트 공격 = 131
 허니팟과 오결합 공격 = 132
  실습 예제|오결합 공격 수행 = 132
 카페 라테 공격 = 138
  실습 예제|카페 라테 공격 = 138
 인증 해제와 결합 해제 공격 = 143
  실습 예제|클라이언트 인증 해제 = 143
 히어테 공격 = 148
  실습 예제|히어테 공격을 이용한 WEP 크랙 = 148
 AP가 필요 없는 WPA 개인 방식의 크랙 = 150
  실습 예제|AP가 필요 없는 WPA 크랙 = 152
 요약 = 155
7장. 고급 무선 랜 공격 = 157
 중간자 공격 = 158
  실습 예제|중간자 공격 = 158
 중간자 공격을 이용한 무선 도청 = 163
  실습 예제|무선 도청 = 163
 무선 세션 하이재킹 = 168
  실습 예제|무선 세션 하이재킹 = 168
 클라이언트의 보안 설정 탐색 = 172
  실습 예제|무선 보안 프로필 탐색 = 172
 요약 = 177
8장. WPA-기업 방식과 래디어스 공격 = 179
 프리래디어스-WPE 구축 = 180
  실습 예제|프리래디어스-WPE를 이용한 AP 구축 = 180
 PEAP 공격 = 184
  실습 예제|PEAP 크랙 = 185
 EAP-TTLS 공격 = 189
  실습 예제|EAP-TTLS 크랙 = 190
 기업용 보안 베스트 프랙티스 = 192
 요약 = 193
9장. 무선 랜 침투 테스트 방법론 = 195
 무선 침투 테스트 = 195
 계획 = 196
 발견 = 197
   실습 예제|무선 장치 탐색 = 197
 공격 = 199
  로그 액세스 포인트 탐색 = 200
   실습 예제|로그 액세스 포인트 탐색 = 200
  비인가 클라이언트 탐색 = 202
   실습 예제|비인가 클라이언트 = 202
  암호 크랙 = 203
   실습 예제|WPA 크랙 = 203
  클라이언트 장악 = 206
 보고 = 208
 요약 = 209
결론과 전하는 말 = 211
깜짝 퀴즈 정답 = 216
찾아보기 = 219

New Arrivals Books in Related Fields