HOME > 상세정보

상세정보

머신 러닝 인 자바 : 자바 기반 머신 러닝

머신 러닝 인 자바 : 자바 기반 머신 러닝 (5회 대출)

자료유형
단행본
개인저자
Kaluža, Boštjan Banerjee, Abhik, 감수 Di, Wei, 감수 Narayana, Manjunath, 감수 Sharma, Ravi, 감수 동준상, 역
서명 / 저자사항
머신 러닝 인 자바 : 자바 기반 머신 러닝 / 보스티얀 칼루자 지음 ; 동준상 옮김
발행사항
서울 :   에이콘,   2016  
형태사항
306 p. : 삽화 ; 24 cm
총서사항
acorn+PACKT technical book
원표제
Machine Learning in Java : design build and deploy your own machine learning applications
ISBN
9788960779297 9788960772106(세트)
일반주기
기술감수자: 아비크 배너지, 웨이 디, 만주나스 나라야나, 라비 샤르마  
서지주기
참고문헌(p. 295-299)과 색인수록
000 00000cam c2200205 c 4500
001 000045891158
005 20170116173742
007 ta
008 161226s2016 ulka b 001c kor
020 ▼a 9788960779297 ▼g 94000
020 1 ▼a 9788960772106(세트)
035 ▼a (KERIS)BIB000014256243
040 ▼a 211043 ▼c 211043 ▼d 244002
041 1 ▼a kor ▼h eng
082 0 4 ▼a 006.31 ▼2 23
085 ▼a 006.31 ▼2 DDCK
090 ▼a 006.31 ▼b 2016z17
100 1 ▼a Kaluža, Boštjan
245 1 0 ▼a 머신 러닝 인 자바 : ▼b 자바 기반 머신 러닝 / ▼d 보스티얀 칼루자 지음 ; ▼e 동준상 옮김
246 1 9 ▼a Machine Learning in Java : ▼b design build and deploy your own machine learning applications
260 ▼a 서울 : ▼b 에이콘, ▼c 2016
300 ▼a 306 p. : ▼b 삽화 ; ▼c 24 cm
440 0 0 ▼a acorn+PACKT technical book
500 ▼a 기술감수자: 아비크 배너지, 웨이 디, 만주나스 나라야나, 라비 샤르마
504 ▼a 참고문헌(p. 295-299)과 색인수록
700 1 ▼a Banerjee, Abhik, ▼e 감수
700 1 ▼a Di, Wei, ▼e 감수
700 1 ▼a Narayana, Manjunath, ▼e 감수
700 1 ▼a Sharma, Ravi, ▼e 감수
700 1 ▼a 동준상, ▼e
900 1 0 ▼a 칼루자, 보스티얀, ▼e
900 1 0 ▼a 배너지, 아비크, ▼e 감수
900 1 0 ▼a 디, 웨이, ▼e 감수
900 1 0 ▼a 나라야나, 만주나스, ▼e 감수
900 1 0 ▼a 샤르마, 라비, ▼e 감수
900 1 0 ▼a Kaluza, Bostjan, ▼e

소장정보

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 세종학술정보원/과학기술실/ 청구기호 006.31 2016z17 등록번호 151332864 도서상태 대출가능 반납예정일 예약 서비스 C

컨텐츠정보

책소개

acorn+PACKT 시리즈. 자바로 작성된 예제 코드를 중심으로, 복잡한 데이터에서 신속하게 필요한 정보와 인사이트를 얻기 위한 다양한 기술과 도구를 소개한다. 데이터 과학의 공통 임무라 할 수 있는 분류, 예측, 마켓 바스켓 분석, 클러스터링과 같은 머신 러닝 기법에 대해 살펴보고, 이상 행동이나 사기 행동의 감지, 동작 인식, 이미지 인식, 텍스트 분석 방법을 설명한다. 책의 후반부에서는 머신 러닝과 관련된 주요한 자료원, 각종 글로벌 경진대회, 관련 기술을 소개한다.

★ 이 책에서 다루는 내용 ★

■ 응용 머신 러닝 기법의 기초와 다양한 머신 러닝 기법 간의 차이 이해
■ 자바 기반 주요 머신 러닝 라이브러리의 종류와 특성 및 해결할 수 있는 문제 유형
■ 분류, 회귀분석, 클러스터링 알고리즘 구현 방법
■ 재구매 고객의 예측을 통해 지속 가능한 고객 관계 전략 개발
■ 아파치 마홋(Apache Mahout)을 이용한 대규모 추천 엔진 개발
■ 머신 러닝을 통한 사기, 이상 행동, 이상점 감지
■ 딥 러닝 또는 심층 학습의 개념과 알고리즘, 구현 도구
■ 스마트폰 센서를 활용한 동작 인식 모델의 개발 및 eHealth 애플리케이션 구현

★ 이 책의 대상 독자 ★

데이터를 통해 인사이트를 얻고자 하는 사용자를 위해 자바 기반 머신 러닝 라이브러리의 사용 방법을 설명하기 위한 책이다. 자바를 사용해본 적은 없지만 머신 러닝의 개념을 아는 사람도 있을 것이고, 그와 반대로 머신 러닝에 대해서는 잘 모르지만 자바를 잘 아는 사람도 있을 것이다. 어떤 경우든, 실생활에 활용할 수 있는 머신 러닝 애플리케이션을 성공적으로 만들고, 수정하고, 배포할 수 있는 방법을 빠른 시간 내에 배울 수 있도록 구성했다. 기본적인 프로그래밍 기법과 데이터 마이닝의 개념에 대해 알고 있다면 이 책을 읽기가 좀 더 쉬울 것이지만, 데이터 마이닝을 모른다고 해도 큰 어려움은 없을 것이다.

★ 이 책의 구성 ★

1장, '응용 머신 러닝의 개요'에서는 머신 러닝의 공통 콘셉트, 머신 러닝 구현 원칙, 응용 머신 러닝 업무 흐름 등 머신 러닝의 기본 개념을 소개한다.
2장, '머신 러닝을 위한 자바 라이브러리와 플랫폼'에서는 머신 러닝을 위해 만들어진 다양한 자바 라이브러리와 플랫폼을 소개하며, 각 라이브러리의 주요 기능과 이들을 통해 어떤 문제를 해결할 수 있는지 설명한다. 주요 라이브러리로서 Weka, 자바-ML, Apache Mahout, Apache Spark, deeplearning4j, Mallet을 소개한다.
3장, '기본 알고리즘: 분류, 회귀분석, 클러스터링'에서는 머신 러닝 알고리즘의 핵심 수행 임무인 분류, 회귀분석, 클러스터링 알고리즘을 간단하고 이해하기 쉬운 데이터세트를 이용해 설명한다.
4장, '앙상블을 이용한 고객 관계 예측'에서는 실제 기업의 마케팅 데이터베이스를 활용해서 churn, upsell, cross-sell 등 기업의 마케팅 활동에 대한 고객의 반응 행동을 예측하는 모델을 만든다. 이번 예제는 KDD 컵 우승 해법인 앙상블 기법을 이용해서 문제를 해결한다.
5장, '친밀도 분석'에서는 연관 규칙 마이닝을 통해 동시 발생 관계를 분석한다. 고객의 구매 행동을 이해하기 위한 마켓 바스켓 분석 방법을 살펴보고 친밀도 분석과 관련된 다른 영역의 접근 방식에 대해서도 알아본다.
6장, '아파치 마홋을 이용한 추천 엔진 구현'에서는 추천 엔진의 원칙을 이해하기 위한 기본 개념을 설명하고, 콘텐트 기반 필터링, 협업적 추천 알고리즘 등 아파치 마홋을 이용한 두 개의 애플리케이션을 만든다.
7장, '사기와 이상 행동 감지'에서는 이상 행동, 의심 행동 패턴 감지의 배경에 대해 설명하며, 사기에 의한 보험 청구 행위의 감지, 웹사이트 트래픽에서의 이상 행동 감지 등 두 개의 실용적인 애플리케이션 개발 방법에 대해 알아본다.
8장, 'Deeplearning4j를 활용한 이미지 인식'에서는 이미지 인식과 신경망 구조에 대한 기본 지식을 설명한다. deeplearning4j 라이브러리를 이용해서 심층 학습 구조를 구현하고, 이를 통해 수기로 작성된 숫자 인식 기법에 대해서도 알아본다.
9장, '스마트폰 센서를 활용한 동작 인식'에서는 센서 데이터를 이용해서 패턴 인식 문제를 해결한다. 동작 인식의 절차와 안드로이드 기기에서 데이터 수집 방법, 일상적인 동작의 인식을 위한 분류 모델 구현에 대해 알아본다.
10장, '멜릿을 이용한 텍스트 마이닝: 토픽 모델링과 스팸 감지'에서는 텍스트 마이닝의 기본 개념에 대해 소개하고 텍스트 처리 파이프라인을 통해 토픽 모델링과 문서 분류라는 실무 문제를 해결하는 방법에 대해 알아본다.
11장, '머신 러닝을 향한 다음 여정'에서는 모델의 배포에 대한 실용적인 조언과 머신 러닝 학습을 위한 자료원, 온라인 강의 사이트, 컨퍼런스, 관련 기술에 대해 소개한다.


정보제공 : Aladin

저자소개

보스티얀 칼루자(지은이)

인공 지능과 머신 러닝을 연구한다. IT 운영 분석 전문 회사인 Evolven의 책임 데이터 과학자로서 연구 프로젝트의 운영 환경 분석과 운영 정책 변경 분석을 담당했다. 머신 러닝, 예측적 분석, 패턴 마이닝, 이상 행동 감지 관련 데이터를 비즈니스 연관 정보 또는 그에 대한 행동을 취할 수 있는 인사이트로 바꾸는 일을 한다. Evolven 이전엔, 슬로베니아의 대표 과학 연구 기관인 Jozef Stefan Institute의 인텔리전트 시스템 부서에서 선임 연구원으로 일했고, 연관 패턴, 이상 행동 감지, 유비쿼터스 컴퓨팅, 멀티 에이전트 시스템의 연구를 이끌었다. 보스티얀은 남캘리포니아 대학교에 방문 연구자로 있는 동안, 보안 애플리케이션 맥락에서의 의심 행동, 이상 행동에 대해 연구했다. 그는 연구를 통해 자바와 파이썬을 오랜 기간 사용해왔으며, 교단에서는 Weka 라이브러리에 대해 강의한다. 머신 러닝과 데이터 과학 관련 전문지에 다수의 기고문을 게재했으며, 컨퍼런스 발표 논문 작성에 참여하고 이 분야의 특허도 다수 확보하고 있다. 2013년, 팩트출판사에서 데이터 과학 분야의 첫 번째 책이자, Weka를 이용한 머신 러닝 실무 활용서인 『Instant Weka How-to』를 출간했다. 그에 관한 좀 더 자세한 정보는 그의 웹사이트 http://bostjankaluza.net에서 확인하자.

동준상(옮긴이)

클라우드, 인공지능 부문 강연자이자 컨설턴트이며, AWS 테크놀로지 파트너, 한국생산성본부 인공지능 전문가위원이다. 한국생산성본부, 서울대학교, 삼성전자, 고려대학교, 국가정보자원관리원, 포항공대에서 관련 주제로 강연을 했다. 소프트웨어 엔지니어링과 오픈소스에 관심이 많고 에이콘출판사에서 출간한 『AWS 공인 솔루션스 아키텍트 올인원 스터디 가이드 - 어소시에이트』(2020), 『기업용 블록체인』(2019), 『자바 머신 러닝 마스터』(2019), 『스위프트 데이터 구조와 알고리즘』(2017) 외 십여 권을 번역했다. ■ 웹페이지: http://www.nxp24.com ■ 링크드인: https://www.linkedin.com/in/junsang-dong/

정보제공 : Aladin

목차

1장. 응용 머신 러닝의 개요 
__머신 러닝과 데이터 과학 
____머신 러닝으로 해결할 수 있는 문제의 종류는? 
____응용 머신 러닝 개발 절차 
__데이터와 문제의 정의 
____측정 단위 
__데이터 수집 
____데이터의 발견과 관찰 
____데이터 생성 
____데이터 샘플링의 오류 
__데이터 전처리 
____데이터 클리닝 
____누락된 값 채우기 
____이상점 (아웃라이어) 제거 
____데이터 변환 
____데이터 축소 
__비지도 학습 
____유사한 아이템 찾기 
______유클리드 거리 측정법 
______비유클리드 거리 측정법 
______차원수의 저수 
____클러스터링 
__지도 학습 
____분류 
______의사결정 트리 학습 
______확률적 분류기 
______커널 기법 
______인공신경망 
______앙상블 학습 
______분류 체계의 평가 
____회귀분석 
______선형 회귀분석 
______회귀분석식 모델의 평가 
__일반화와 평가 
____언더핏과 오버핏 
______학습 데이터와 검증 데이터의 구분 
______교차 평가 
______리브 원 아웃 교차 평가 
______계층화 
__정리 


2장. 머신 러닝을 위한 자바 라이브러리와 플랫폼 
__자바의 필요성 
__머신 러닝 라이브러리 
____Weka 
____자바 머신 러닝 
____Apache Mahout 
____Apache Spark 
____Deeplearning4j 
____MALLET 
____라이브러리 비교 
__머신 러닝 애플리케이션 만들기 
____전통적인 머신 러닝 아키텍처 
____빅데이터 처리하기 
______빅데이터 애플리케이션 아키텍처 
__정리 


3장. 기본 알고리즘: 분류, 회귀분석, 클러스터링 
__시작에 앞서 
__분류 
____데이터 
____데이터 로딩 
____속성 선택 
____알고리즘 학습 
____새로운 데이터의 분류 
____모델 평가 및 예측 오류 메트릭스 
____혼합 매트릭스 
____분류 알고리즘의 선택 
__회귀분석 
____데이터 로딩 
____속성 분석 
____회귀분석 모델 개발 및 평가 
______선형 회귀분석 
______회귀분석 트리 
____회귀분석과 관련된 보편적인 문제의 해결책 
__클러스터링 
____클러스터링 알고리즘 
____모델의 평가 
__정리 


4장. 앙상블을 이용한 고객 관계 예측 
__고객 관계 데이터베이스 
____챌린지 개요 
____도전 과제를 위한 데이터세트 
____평가 
__나이브 베이즈 분류법에 따른 기본 점수 
____데이터 가져오기 
____데이터 로딩 
__기본적인 모델링 
____평가 모델 
____기본적인 나이브 베이즈 알고리즘 구현 
__앙상블을 이용한 고급 모델 구현 
____시작하기에 앞서 
____데이터 전처리하기 
____속성 선택 
____모델 선택 
____성능 평가 
__정리 


5장. 친밀도 분석 
__마켓 바스켓 분석 
____친밀도 분석 
__연관 규칙 학습 
____기본 개념 
______거래 데이터베이스 
______아이템세트와 규칙 
______지지도 
______신뢰도 
____아프리오리 알고리즘 
____FP-성장 알고리즘 
__슈퍼마켓 데이터세트 
__패턴 발견하기 
____아프리오리 알고리즘 
____FP-성장 알고리즘 
__다양한 영역에서 활용되는 애플리케이션 
____의료 진단 
____단백질 서열 분석 
____인구총조사 데이터 
____고객 관계 관리 
____IT 운영 분석 
__정리 


6장. 아파치 마홋을 이용한 추천 엔진 구현 
__추천 엔진의 기본 개념 
____추천 엔진의 주요 개념 
____사용자 기반 분석과 아이템 기반 분석 
____유사성 계산을 위한 방법 
______협업적 필터링 
______콘텐트 기반 필터링 
______하이브리드 기법 
____데이터 채굴과 데이터 탐험 
__아파치 마홋 다운로드와 설정 
____이클립스에서 메이븐 플러그인을 통한 마홋 환경 설정 
__추천 엔진 만들기 
____책 평가를 위한 데이터세트 
____데이터 로딩 
______파일에서 데이터 로딩하기 
______데이터베이스에서 데이터 로딩하기 
______인메모리 데이터베이스 
____협업적 필터링 
______사용자 기반 필터링 
______아이템 기반 필터링 
______추천 알고리즘에 커스텀 규칙 추가하기 
______추천 모델의 평가 
______온라인 러닝 엔진 
__콘텐트 기반 필터링 
__정리 


7장. 사기와 이상 행동 감지 
__이상하고 의심스러운 행동의 감지 
____무엇을 모르는지 모른다는 것, 언노운-언노운 
__의심스러운 패턴 감지 
__이상 행동 패턴의 감지 
____분석의 유형 
______패턴 분석 
______거래 분석 
____계획 인지 
__보험 청구 사기 사건의 감지 
____데이터세트 
____의심스러운 행동 패턴의 모델링 
______바닐라 기법 
______데이터세트 밸런스 재조절 
__웹사이트 트래픽의 이상 행동 감지 
____데이터세트 
____시계열 데이터에서의 이상 행동 감지 
______히스토그램 기반 이상 행동 감지 
______데이터 로딩 
______히스토그램 만들기 
______밀집도 기반 k-최인접 이웃 알고리즘 
__정리 


8장. Deeplearning4j를 활용한 이미지 인식 
__이미지 인식 기법의 개요 
____신경망 알고리즘 
______퍼셉트론 
______피드포워드 신경망 
______오토인코더 
______제한 볼츠만 머신 
______심층 나선형 신경망 
__이미지 분류 
____Deeplearning4j 
______DL4J 가져오기 
____MNIST 데이터세트 
____데이터 로딩 
____모델 만들기 
______단일층 회귀분석 모델 만들기 
______심층 신뢰 신경망 만들기 
______다층 나선형 신경망 만들기 
__정리 


9장. 스마트폰 센서를 활용한 동작 인식 
__동작 인식의 개요 
____스마트폰 센서 
____동작 인식 파이프라인 
____앱 개발 기획 
__스마트폰에서 데이터 수집하기 
____안드로이드 스튜디오 설치 
____데이터 콜렉터 프로젝트 로딩하기 
______특성 데이터의 추출 
____훈련 데이터의 수집 
__분류기 알고리즘의 개발 
____이상 동작 데이터 감소시키기 
____모바일 앱에 분류기 적용하기 
__정리 


10장. 멜릿을 이용한 텍스트 마이닝: 토픽 모델링과 스팸 감지 
__텍스트 마이닝의 개요 
____토픽 모델링 
____텍스트 분류 
__Mallet 설치 
__텍스트 데이터의 활용 
____데이터 임포트하기 
______디렉토리에서 임포트하기 
______파일에서 임포트하기 
____텍스트 데이터의 전처리 
__BBC 뉴스에서 토픽 모델링 구현하기 
____BBC 데이터세트 
____모델링 
____모델의 평가 
____모델의 재사용 
______모델 저장하기 
______모델 복구하기 
__이메일 스팸 감지 
____이메일 스팸 데이터세트 
____특성값 생성 
____훈련 및 테스트 
______모델의 성능 평가 
__정리 


11장. 머신 러닝을 향한 다음 여정 
__실무적인 문제 해결 방법으로서의 머신 러닝 
____노이즈 데이터 
____클래스의 불균형 
____특성 선택의 까다로움 
____모델 연쇄 
____평가의 중요성 
____서비스 또는 제품에 러닝 모델 적용하기 
____모델의 유지 보수 
__표준 언어와 마크업 언어 
____CRISP-DM 
____SEMMA 방법론 
____예측 모델 마크업 언어 
__클라우드 기반의 머신 러닝 
____서비스로서의 머신 러닝 
__웹 자료원과 경진대회 
____데이터세트 
____온라인 학습 과정 
____머신 러닝 경진 대회 
____머신 러닝 관련 웹사이트와 블로그 
____머신 러닝 컨퍼런스 
__정리

관련분야 신착자료

Cartwright, Hugh M. (2021)
한국소프트웨어기술인협회. 빅데이터전략연구소 (2021)