HOME > 상세정보

상세정보

검색을 위한 딥러닝 : 심층 신경망을 활용하는 차세대 검색 엔진 개발 (5회 대출)

자료유형
단행본
개인저자
Teofili, Tommaso. 박진수, 역
서명 / 저자사항
검색을 위한 딥러닝 : 심층 신경망을 활용하는 차세대 검색 엔진 개발 / 토마소 테오필리 지음 ; 박진수 옮김
발행사항
파주 :   제이펍,   2020  
형태사항
xxv, 358 p. : 삽화 ; 25 cm
총서사항
제이펍의 인공지능 시리즈 ;26
원표제
Deep learning for search
ISBN
9791188621972
일반주기
색인수록  
일반주제명
Machine learning Neural networks (Computer science) Web search engines Web sites --Design
000 00000cam c2200205 c 4500
001 000046021390
005 20200320140559
007 ta
008 200319s2020 ggka 001c kor
020 ▼a 9791188621972 ▼g 93000
035 ▼a (KERIS)BIB000015537588
040 ▼a 211023 ▼c 211023 ▼d 211009
041 1 ▼a kor ▼h eng
082 0 4 ▼a 006.31 ▼2 23
085 ▼a 006.31 ▼2 DDCK
090 ▼a 006.31 ▼b 2020z5
100 1 ▼a Teofili, Tommaso.
245 1 0 ▼a 검색을 위한 딥러닝 : ▼b 심층 신경망을 활용하는 차세대 검색 엔진 개발 / ▼d 토마소 테오필리 지음 ; ▼e 박진수 옮김
246 1 9 ▼a Deep learning for search
260 ▼a 파주 : ▼b 제이펍, ▼c 2020
300 ▼a xxv, 358 p. : ▼b 삽화 ; ▼c 25 cm
440 0 0 ▼a 제이펍의 인공지능 시리즈 ; ▼v 26
500 ▼a 색인수록
650 0 ▼a Machine learning
650 0 ▼a Neural networks (Computer science)
650 0 ▼a Web search engines
650 0 ▼a Web sites ▼x Design
700 1 ▼a 박진수, ▼e
900 1 0 ▼a 테오필리, 토마소, ▼e
945 ▼a KLPA

소장정보

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 006.31 2020z5 등록번호 121252707 도서상태 대출가능 반납예정일 예약 서비스 B M

컨텐츠정보

책소개

딥러닝, 즉 심층 신경망을 사용하여 더 나은 검색을 이끌어내는 방법을 배운다. 우선 색인 처리 및 순위지정과 같은 기본 검색 기술이 딥러닝과 어떤 관련성이 있는지를 알아본다. 그런 다음, 아파치 루씬과 DL4J를 사용하는 검색 기능을 딥러닝 기술로 보강해 보는 심층 예제를 다루고, 더 나아가서 이미지 검색, 사용자 질의 내용 번역, 학습하는 동안 개선되는 검색 엔진 설계와 같은 고급 주제를 살펴본다.

딥러닝을 활용해 더 스마트하고 인간 친화적인 검색 엔진을 만드는 기술의 모든 것!

구글이나 네이버에서 벗어나 나만의 사용자 중심 검색 엔진을 만들 수 있을까? 이 책에서는 딥러닝, 즉 심층 신경망을 사용하여 더 나은 검색을 이끌어내는 방법을 배웁니다. 우선 색인 처리 및 순위지정과 같은 기본 검색 기술이 딥러닝과 어떤 관련성이 있는지를 알아봅니다. 그런 다음, 아파치 루씬과 DL4J를 사용하는 검색 기능을 딥러닝 기술로 보강해 보는 심층 예제를 다루고, 더 나아가서 이미지 검색, 사용자 질의 내용 번역, 학습하는 동안 개선되는 검색 엔진 설계와 같은 고급 주제를 살펴봅니다.

딥러닝 기술을 활용해서 한층 더 진화된 검색 엔진을 완성한다!
신경망을 이용한 인공지능 검색 시스템의 원리와 활용!


딥러닝을 활용하면 검색어가 부정확하거나, 색인이 심하게 꼬여 있거나, 메타데이터가 거의 없는
상태에서도 이미지 검색과 같은 가장 까다로운 검색까지 처리할 수 있다. 또한, DL4J나 텐서플로와 같은 최신 도구를 사용하면 데이터 과학이나 자연어 처리에 대한 배경지식이 깊지 않아도 강력한 딥러닝 기술을 응용할 수 있다.

독자는 이 책을 통해 신경망을 사용하여 검색 결과를 향상시키는 방법을 배울 수 있다. 이 책에서는 색인 처리 및 순위지정과 같은 기본 검색 기술이 딥러닝과 어떤 관련성이 있는지를 검토하는 것부터 시작한다. 그런 다음, 아파치 루씬과 DL4J를 사용하는 검색 기능을 딥러닝 기술로 보강해 보는 심층 예제를 다루고, 더 나아가서 이미지 검색, 사용자 질의 내용 번역, 학습하는 동안 개선되는 검색 엔진 설계와 같은 고급 주제를 살펴본다.

이 책의 주요 내용
■ 동의어를 생성해 쿼리 보충하기
■ 정확하고 연관성 높은 결과가 먼저 나오게 순위지정하기
■ 여러 외국어를 사용해서 검색하기
■ 이미지 내용을 가지고 이미지 검색하기
■ 추천 기능을 제공해 검색 돕기


정보제공 : Aladin

저자소개

토마소 테오필리(지은이)

오픈 소스와 머신러닝에 열정을 보이는 소프트웨어 엔지니어다. 아파치 소프트웨어 재단의 일원으로서 정보 검색 분야(루씬, 솔라 등)부터 자연어 처리와 OpenNLP, Joshua, UIMA 등에 이르는 다양한 오픈 소스 프로젝트에 기여하고 있다. 현재 어도비(Adobe)에서 검색 및 색인화 기반 컴포넌트를 개발 중이며, 자연어 처리, 정보 검색 및 딥러닝 분야를 연구하고 있다. 베를린에서 열리는 버즈워즈(Buzzwords), 국제 컴퓨터 과학 회의, 아파치콘(ApacheCon), 이클립스콘(EclipseCon) 등을 포함한 여러 회의에서 검색 기술과 머신러닝 기술의 융합을 제안했다. 트위터 @teofili에서 그를 만나 볼 수 있다.

박진수(옮긴이)

정보기술(IT)과 관련하여 다양한 개발, 저술·번역, 기술편집, 기술교정, 자문, 발표, 기고를 해 왔다. 최근에는 주로 인공지능과 관련한 번역, 자문, 강의를 한다. 다수의 저서와 번역서는 온라인 서점에서 역자의 이름으로 검색할 수 있다.

정보제공 : Aladin

목차

옮긴이 머리말
추천사
머리말
감사의 말
이 책에 대하여
베타리더 후기

PART I 검색이 딥러닝을 만나다 1
CHAPTER 1 신경망을 이용한 검색 3
1.1 신경망과 딥러닝 5
1.2 머신러닝이란? 8
1.3 검색 시에 딥러닝으로 할 수 있는 일은? 10
1.4 딥러닝 학습을 위한 계획도 14
1.5 유용한 정보 꺼내기 16
1.5.1 텍스트, 토큰, 용어, 검색에 관한 기초 지식 18
1.5.2 연관도 우선 28
1.5.3 고전적인 검색 모델 29
1.5.4 정밀도와 재현율 30
1.6 미해결 문제들 31
1.7 검색 엔진 블랙박스 열기 32
1.8 구조의 손길을 펼치는 딥러닝 34
1.9 색인아, 뉴런을 만나 주지 않을래? 38
1.10 신경망 훈련 39
1.11 신경 검색의 약속들 42

CHAPTER 2 동의어 생성 44
2.1 동의어 확장 소개 45
2.1.1 왜 동의어인가? 47
2.1.2 어휘 기반 동의어 일치 49
2.2 맥락의 중요성 60
2.3 순방향 신경망 62
2.4 word2vec 사용 66
2.4.1 Deeplearning4j에 word2vec 끼워 쓰기 76
2.4.2 Word2vec 기반 동의어 확장 77
2.5 평가 및 비교 80
2.6 프로덕션 시스템에 대해 고려할 사항 81
2.6.1 동의어 대 반의어 83

PART 2 검색 엔진에 신경망들 던져 넣기 87
CHAPTER 3 일반 검색에서 텍스트 생성까지 89
3.1 정보 요구 대 쿼리: 틈새를 메우는 것 91
3.1.1 대안 쿼리 생성 91
3.1.2 데이터 준비 94
3.1.3 데이터 생성 준비 102
3.2 시퀀스 학습 103
3.3 재귀 신경망 104
3.3.1 RNN 내부 구조와 작동 방식 107
3.3.2 장기 의존성 111
3.3.3 장단기 기억망 112
3.4 비지도 학습 방식으로 텍스트를 생성하기 위한 LSTM 망 113
3.4.1 비지도 쿼리 확장 122
3.5 비지도 텍스트 생성에서 지도 텍스트 생성까지 126
3.5.1 시퀀스-투-시퀀스 모델링 126
3.6 프로덕션 시스템에 대해 고려해야 할 점 130

CHAPTER 4 그럴듯한 쿼리들 제안하기 133
4.1 쿼리 제안 생성 134
4.1.1 쿼리 작성 중에 제안하기 135
4.1.2 사전 기반 제안 136
4.2 루씬 룩업 API 136
4.3 분석된 내용을 활용하는 제안기 141
4.4 언어 모델 사용 148
4.5 내용 기반 제안기 152
4.6 신경 언어 모델 154
4.7 제안용 문자 기반 신경 언어 모델 156
4.8 LSTM 언어 모델 조율 160
4.9 단어 매장을 이용한 제안 다양화 169

CHAPTER 5 단어 매장을 사용해 검색 결과의 순위지정하기 173
5.1 순위지정의 중요성 174
5.2 검색 모델 177
5.2.1 TF-IDF와 벡터 공간 모델 179
5.2.2 루씬에서 문서의 순위지정하기 183
5.2.3 확률 모델 186
5.3 신경 정보 검색 188
5.4 단어 벡터에서 문서 벡터까지 189
5.5 평가 및 비교 196
5.5.1 평균 단어 매장 기준 유사도 198

CHAPTER 6 순위지정 및 추천을 위한 문서 매장 203
6.1 단어 매장으로부터 문서 매장까지 204
6.2 순위지정 시 단락 벡터 사용 208
6.2.1 단락 벡터 기반 유사도 211
6.3 문서 매장과 연관 내용 211
6.3.1 검색, 추천 그리고 연관 내용 212
6.3.2 빈출 용어들을 사용해 유사한 내용 찾기 214
6.3.3 단락 벡터를 사용해 유사한 내용 검색 224
6.3.4 인코더-디코더 모델에서 벡터를 사용해 유사한 내용 검색 227

PART 3 한 걸음 더 나아가다 231
CHAPTER 7 여러 언어로 검색하기 233
7.1 언어가 서로 다른 사용자들에게 서비스하기 234
7.1.1 문서 번역 대 쿼리 번역 235
7.1.2 교차 언어 검색 237
7.1.3 루씬 기반 다중 언어 쿼리 239
7.2 통계적 기계 번역 241
7.2.1 정렬 244
7.2.2 단락 기반 번역 245
7.3 병렬 말뭉치를 가지고 일하기 246
7.4 신경 기계 번역 249
7.4.1 인코더-디코더 모델 250
7.4.2 DL4J에서 기계 번역을 하기 위한 인코더-디코더 254
7.5 여러 언어를 위한 단어 매장 및 문서 매장 261
7.5.1 선형 사영 1개 국어 사용 매장 261

CHAPTER 8 내용 기반 이미지 검색 268
8.1 이미지 내용과 검색 270
8.2 되돌아보기: 텍스트 기반 이미지 검색 272
8.3 이미지 이해하기 275
8.3.1 이미지 표현 277
8.3.2 특징 추출 280
8.4 이미지 표현을 위한 딥러닝 288
8.4.1 CNN 290
8.4.2 이미지 검색 298
8.4.3 국소성 민감 해싱 304
8.5 레이블이 없는 이미지 다루기 308

CHAPTER 9 성능 엿보기 314
9.1 성과 및 딥러닝의 약속 315
9.1.1 모델 설계로부터 모델 산출로 316
9.2 색인과 뉴런이 협동하게 하기 334
9.3 데이터 스트림 작업 337

찾아보기 346

관련분야 신착자료

Cartwright, Hugh M. (2021)
한국소프트웨어기술인협회. 빅데이터전략연구소 (2021)