HOME > 상세정보

상세정보

케스케이딩 완벽 가이드

케스케이딩 완벽 가이드 (2회 대출)

자료유형
단행본
개인저자
Nathan, Paco 오세봉, 역 장정호, 역
서명 / 저자사항
케스케이딩 완벽 가이드 / 파코 네이선 지음 ; 오세봉, 장정호 옮김
발행사항
서울 :   한빛미디어,   2014  
형태사항
220 p. : 삽화 ; 23 cm
원표제
Enterprise data workflows with Cascading
ISBN
9788968480775
일반주기
색인수록  
부록: 워크플로우 문제 해결  
빅데이터 분석을 위한 하둡 워크플로우 관리 도구  
일반주제명
File organization (Computer science) Enterprise application integration (Computer systems)
000 01056camcc2200325 c 4500
001 000045798920
005 20140605132933
007 ta
008 140203s2014 ulka 001c kor
020 ▼a 9788968480775 ▼g 13000
035 ▼a (KERIS)BIB000013368801
040 ▼a 211062 ▼c 211062 ▼d 211062 ▼d 244002
041 1 ▼a kor ▼h eng
082 0 4 ▼a 005.741 ▼2 23
085 ▼a 005.741 ▼2 DDCK
090 ▼a 005.741 ▼b 2014
100 1 ▼a Nathan, Paco
245 1 0 ▼a 케스케이딩 완벽 가이드 / ▼d 파코 네이선 지음 ; ▼e 오세봉, ▼e 장정호 옮김
246 1 9 ▼a Enterprise data workflows with Cascading
260 ▼a 서울 : ▼b 한빛미디어, ▼c 2014
300 ▼a 220 p. : ▼b 삽화 ; ▼c 23 cm
500 ▼a 색인수록
500 ▼a 부록: 워크플로우 문제 해결
500 ▼a 빅데이터 분석을 위한 하둡 워크플로우 관리 도구
650 0 ▼a File organization (Computer science)
650 0 ▼a Enterprise application integration (Computer systems)
700 1 ▼a 오세봉, ▼e
700 1 ▼a 장정호, ▼e
900 1 0 ▼a 네이선, 파코, ▼e

소장정보

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 세종학술정보원/과학기술실/ 청구기호 005.741 2014 등록번호 151320961 도서상태 대출가능 반납예정일 예약 서비스 C

컨텐츠정보

책소개

하둡 에코시스템을 워크플로우 기반으로 손쉽게 관리하는 케스케이딩으로 애플리케이션을 작성하는 방법을 보여주는 책. 이 책 전반에서 다루는 간단한 예제들을 통해 대규모 클러스터에서 대규모 데이터셋을 효과적으로 분석하는 방법을 배우게 될 것이다. 또한 엔터프라이즈 데이터 워크플로우의 모범 사례에 대해 논의한다.

이 책에서는 간단한 프로그램 예제들을 통해 케스케이딩과 관련된 오픈소스 프로젝트들을 살펴본다. 자바 프로그래밍에 익숙해야 한다. 클로저, 스칼라, SQL, R로 작성된 코드들도 보게 될 것이다. 모든 예제 애플리케이션은 기트허브의 소스 코드 저장소에서 내려받을 수 있다.

이 책은 하둡 기반으로 빠르고 쉽게 견고한 애플리케이션을 개발하고자 하는 개발자나 빅데이터에서 워크플로우 관리를 통해 쉽고 빠르게 필요한 가치를 추출하고자 하는 개발자와 기획자를 대상으로 하고 있다.

이 책은 하둡 에코시스템을 워크플로우 기반으로 손쉽게 관리하는 케스케이딩으로 애플리케이션을 작성하는 방법을 보여준다. 이 책 전반에서 다루는 간단한 예제들을 통해 대규모 클러스터에서 대규모 데이터셋을 효과적으로 분석하는 방법을 배우게 될 것이다. 또한 엔터프라이즈 데이터 워크플로우의 모범 사례에 대해 논의한다.

* 케스케이딩(Cascading )이란?
엄격히 말해서 케스케이딩은 엔터프라이즈 데이터 워크플로우의 비즈니스 프로세스 관리를 위한 패턴 언어다. 패턴 언어는 크고 복잡한 설계 문제를 풀기 위한 정형화된 방법을 제공하며 이는 모범 사례 사용을 추천하는 문법을 제공한다. 예를 들어 케스케이딩에서 파이프와 연산자를 '배관'에 비유하는 것은 특정 시점에 어떤 알고리즘을 사용하고 어떤 아키텍처 트레이드 오프가 적절한지, 어디서 프레임워크의 통합이 필요한지 등을 알려주는 데 도움을 준다. 이러한 접근 방식은 컴파일 시점이나 플로우 계획 단계에서 많은 잠재적 문제를 알아낼 수 있다는 장점을 제공해준다.

이 책의 특징과 장점

* 이 책에서 다루는 예제
이 책 전반에서는 간단한 프로그램 예제들을 통해 케스케이딩과 관련된 오픈소스 프로젝트들을 살펴본다. 자바 프로그래밍에 익숙해야 한다. 클로저, 스칼라, SQL, R로 작성된 코드들도 보게 될 것이다. 모든 예제 애플리케이션은 기트허브의 소스 코드 저장소에서 내려받을 수 있다.

* 이 책의 내용
새로운 분야의 데이터를 하둡에 저장하는 것은 이 책의 주제를 벗어난다. 우리가 이 책에서 보여주려 한 것은 엔터프라이즈 애플리케이션을 설계하는 새로운 사고 방식이다. 케스케이딩을 어떻게 시작해야 하는지 보여주고 엔터프라이즈 데이터 워크플로우의 모범 사례에 대해 논의할 것이다.

어떤 독자를 위한 책인가?

하둡 기반으로 빠르고 쉽게 견고한 애플리케이션을 개발하고자 하는 개발자
빅데이터에서 워크플로우 관리를 통해 쉽고 빠르게 필요한 가치를 추출하고자 하는 개발자와 기획자

도서 특징(책 표지 글)

* 더 빠르게 하둡 애플리케이션을 구현하고 빅데이터를 처리하라!
하둡 오픈 소스 프레임워크인 케스케이딩을 이용하면 복잡한 맵리듀스 프로그래밍을 배우지 않고도 엔터프라이즈 급 데이터를 처리하는 강력한 애플리케이션을 쉽게 만들고 관리할 수 있다. 자바와 JVM에서 동작하는 언어를 기반으로 작성된 예제 애플리케이션을 통해 케스케이딩이 얼마나 간결하고 빠르게 데이터 처리, 필터링, 워크플로우 최적화하는지 배우게 될 것이다.

다양한 데이터 소스와 비정형 데이터에 대한 모델링과 분석
링구알(Lingual)을 통한 ANSI SQL 지원
익숙한 구조와 재사용 가능한 컴포넌트로 애플리케이션 구축과 테스트
스콜딩(Scalding)과 케스칼로그Cascalog) 도메인 특화 언어를 이용한 작업
클러스터의 위치와 데이터 크기에 상관없는 쉬운 애플리케이션 배치
여러 빅데이터 프레임워크와 프로세스를 통합한 워크플로우 구축
일반적인 예제를 통해 살펴보는 케스케이딩의 특징과 도구
오픈 데이터 이니셔티브의 데이터셋을 이용한 사례 연구 검토


정보제공 : Aladin

저자소개

파코 네이선(지은이)

Concurrent에서 개발자 지원 프로그램을 이끌고 있는 데이터 과학자다. 스탠포드 대학에서 수학/통계와 분산 컴퓨팅을 복수 전공했으며 IT업체에서 25년간 일해왔다. 하둡, R, 예측 분석, 머신 러닝 그리고 자연어 처리 분야의 전문가로서 대규모 클라우드 기반의 데이터 인프라와 함께 여러 전문 데이터 과학팀을 만들고 이끌어 왔다. 'AWS Start-Up Tour'에서 두 차례 강연했으며, 하둡과 데이터 과학 그리고 클라우드 컴퓨팅에 대해 자주 이야기한다.

오세봉(옮긴이)

티맥스 소프트에서 웹 어플리케이션 서버를 개발하다 빅데이터에 관심이 생겨 KT 넥스알에 입사했다. 재직 중에 『하이브 완벽 가이드』(한빛미디어, 2013), 『케스케이딩 완벽 가이드』(한빛미디어, 2014)와 『MVC 구조의 확실한 해답 AngularJS 디렉티브』(에이콘, 2016)을 번역했다. KT 넥스알을 나와 어린이용 스마트워치(LINE 키즈폰)를 출시했으며 이때부터 안드로이드 개발을 시작했다. 대학 때부터 웹을 비롯한 UI에 관심이 많아 안드로이드 UI에 적응하는 데 오래 걸리지는 않았지만 SQLite를 비롯한 안드로이드 서비스는 자료가 많지 않아 시행착오를 많이 겪어야 했다. 현재는 SK텔레콤에서 빅데이터를 이용한 데이터 분석과 관련된 일을 하고 있다.

장정호(옮긴이)

네이버 검색 소프트웨어 엔지니어. 2006년에 티맥스에서 애플리케이션/시스템 간 데이터 전송 시스템 개발을 시작으로, 다음 커뮤니케이션에서 데이터 마이닝 업무, SAP에서 칼럼 기반의 인메모리 RDBMS인 HANA 개발에 동참했으며, 그 후 빅데이터 저장/분석 시스템 영역에 관한 연구를 통해 네이버에서 데이터 분석 시스템을 개발을 담당하고 있다.

정보제공 : Aladin

목차

목차
지은이/옮긴이 소개 = 4
옮긴이의 말 = 5
CHAPTER P 프롤로그  
 P.1 요구 사항 = 13
 P.2 엔터프라이즈 데이터 워크플로우 = 13
 P.3 거대함 그 이상의 복잡성 = 18
 P.4 케스케이딩 API의 탄생 배경 = 22
 P.5 예제 코드 사용 = 26
CHAPTER 1 시작하기  
 1.1 프로그램 개발 환경 준비 = 27
 1.2 [예제 1] 초간단 케스케이딩 애플리케이션 = 29
 1.3 빌드와 실행 = 32
 1.4 케스케이딩의 분류 체계 = 35
 1.5 [예제 2] 흔한 단어 세기 = 37
 1.6 플로우 다이어그램 = 41
 1.7 대규모 환경에서의 케스케이딩 = 45
CHAPTER 2 파이프 어셈블리 확장  
 2.1 [예제 3] 사용자 정의 연산 = 49
 2.2 토큰 다듬기 = 55
 2.3 [예제 4] 복제 조인 = 57
 2.4 불용어와 복제 조인 = 60
 2.5 아파치 피그와 비교 = 62
 2.6 아파치 하이브와 비교 = 65
CHAPTER 3 테스트 주도 개발  
 3.1 [예제 5] TF-IDF 구현 = 71
 3.2 [예제 6] 테스트가 포함된 TF-IDF = 80
 3.3 테스트에 관한 부언 = 89
CHAPTER 4 케스케이딩용 스칼라 DSL  
 4.1 스콜딩을 사용하는 이유 = 93
 4.2 스콜딩 시작하기 = 95
 4.3 스콜딩으로 작성한 [예제 3] 사용자 정의 연산 = 97
 4.4 함수형 프로그래밍에 관한 부언 = 102
 4.5 스콜딩으로 작성한 [예제 4] 복제 조인 = 105
 4.6 그레이들로 스콜딩 애플리케이션 빌드하기 = 107
 4.7 아마존 AWS에서 수행 = 109
CHAPTER 5 케스칼로그-케스케이딩을 위한 클로저 DSL  
 5.1 케스칼로그를 사용하는 이유 = 113
 5.2 케스칼로그 시작하기 = 115
 5.3 케스칼로그로 작성한 [예제 1] 초간단 애플리케이션 = 119
 5.4 케스케이딩으로 작성한 [예제 4] 복제 조인 = 122
 5.5 케스칼로그로 작성한 [예제 6] 테스트가 포함된 TF-IDF = 125
 5.6 케스칼로그 기술적 내용과 사례 = 132
CHAPTER 6 맵리듀스 그 이상  
 6.1 애플리케이션과 조직 = 137
 6.2 링구알, ANSI SQL을 위한 도메인 특화 언어 = 141
  6.2.1 SQL 명령행 사용하기 = 142
  6.2.2 JDBC 드라이버 사용하기 = 145
  6.2.3 데스크톱 도구와 통합 = 148
 6.3 패턴, 예측 모델 마크업 언어를 위한 DSL = 151
  6.3.1 패턴 시작하기 = 154
  6.3.2 PMML을 위한 내장 애플리케이션 = 155
  6.3.3 케스케이딩 애플리케이션 내 패턴 통합 = 162
  6.3.4 고객 실험 = 163
  6.3.5 패턴 기술 로드맵 = 167
CHAPTER 7 워크플로우 추상화  
 7.1 핵심 통찰력 = 171
 7.2 패턴 언어 = 173
 7.3 문학적 프로그래밍 = 175
 7.4 관심사 분리 = 176
 7.5 함수형 관계형 프로그래밍 = 177
 7.6 엔터프라이즈 대 스타트업 = 180
CHAPTER 8 사례 연구 : 팰로앨토시의 오픈 데이터  
 8.1 왜 오픈 데이터인가? = 183
 8.2 팰로앨토시 = 184
 8.3 원시 데이터 소스에서 데이터 제품으로 이동 = 185
 8.4 추천기를 위한 매트릭 보정 = 195
 8.5 공간 색인 = 198
 8.6 개인화 = 203
 8.7 추천 = 205
 8.8 빌드와 실행 = 207
 8.9 추천기 워크플로우 요점 = 208
APPENDIX : 워크플로우 문제 해결 = 213
찾아보기 = 217

관련분야 신착자료

Ramamurthy, Bina (2021)