HOME > Detail View

Detail View

칼디로 배우는 음성인식 (Loan 1 times)

Material type
단행본
Personal Author
陈果果 都家宇, 저 那興宇, 저 張俊博, 저 단비, 역
Title Statement
칼디로 배우는 음성인식 = Kaldi speech recognition practice / 천궈궈 [외]지음 ; 단비 옮김
Publication, Distribution, etc
서울 :   지니북스,   2022  
Physical Medium
xiv, 401 p. : 삽화 ; 24 cm
Varied Title
Kaldi语音识别实战
ISBN
9791196278878
General Note
참고문헌(p. 393-395)과 색인수록  
공저자: 뚜지아위(都家宇), 나씽위(那興宇), 장쥔보어(張俊博)  
000 00000cam c2200205 c 4500
001 000046117962
005 20220615112653
007 ta
008 220614s2022 ulka b 001c kor
020 ▼a 9791196278878 ▼g 93560
035 ▼a (KERIS)BIB000016171766
040 ▼a 222003 ▼c 222003 ▼d 211009
082 0 4 ▼a 006.454 ▼2 23
085 ▼a 006.454 ▼2 DDCK
090 ▼a 006.454 ▼b 2022
100 1 ▼a 陈果果
245 1 0 ▼a 칼디로 배우는 음성인식 = ▼x Kaldi speech recognition practice / ▼d 천궈궈 [외]지음 ; ▼e 단비 옮김
246 1 9 ▼a Kaldi语音识别实战
246 3 ▼a Kaldi yu yin shi bie shi zhan
260 ▼a 서울 : ▼b 지니북스, ▼c 2022
300 ▼a xiv, 401 p. : ▼b 삽화 ; ▼c 24 cm
500 ▼a 참고문헌(p. 393-395)과 색인수록
500 ▼a 공저자: 뚜지아위(都家宇), 나씽위(那興宇), 장쥔보어(張俊博)
700 1 ▼a 都家宇, ▼e
700 1 ▼a 那興宇, ▼e
700 1 ▼a 張俊博, ▼e
700 0 ▼a 단비, ▼e
900 1 0 ▼a 천궈궈, ▼e
900 1 0 ▼a Chen, Guoguo, ▼e
900 1 0 ▼a 뚜지아위, ▼e
900 1 0 ▼a Du, Jiayu, ▼e
900 1 0 ▼a 나씽위, ▼e
900 1 0 ▼a Na, Xingyu, ▼e
900 1 0 ▼a 장쥔보어, ▼e
900 1 0 ▼a Zhang, Junbo, ▼e
900 0 0 ▼a danb, ▼e
945 ▼a ITMT

Holdings Information

No. Location Call Number Accession No. Availability Due Date Make a Reservation Service
No. 1 Location Science & Engineering Library/Sci-Info(Stacks1)/ Call Number 006.454 2022 Accession No. 121260174 Availability Available Due Date Make a Reservation Service B M

Contents information

Book Introduction

최신 음성인식 기술을 구현한 오픈소스인 Kaldi를 기반으로, 음성인식의 배경지식과 실제 구현에 대해 자세히 설명한 음성인식 교재이다. 예제 분석에 주의를 기울이고, 공식 유도를 되도록 피하였으며, 핵심 문제와 해당 알고리즘의 직관적인 의미를 설명하는데 중심을 두었다. 또한 독자들이 음성 기술에 대한 거시적 관점을 빠르게 확립하고 Kaldi 도구 셋의 세밀한 부분까지도 이해할 수 있도록 돕기 위해 예제 해석에 초점을 맞추었다.

구체적인 알고리즘 구현, Kaldi 툴박스의 사용법, 음성 인식
키워드 검색, 화자 인식, 언어 인식 시스템 구축


지난 20여년 간 음성인식 시장은 규모가 커지는 듯 보이다가 급속히 줄어들기도 하면서, 시장의 필수 비즈니스로 자리잡지 못했다. 그 이유는 음성인식 기술이 대중들의 기준에 못 미쳤기 때문이다. 10여년 전부터 신경망 기술의 발전으로, 음성인식 기술은 황금기를 맞이하게 되었다. 이제는 음성인식 기술이 점차 산업의 필수 기술로 자리잡고 있으며, 아직까지 완벽하진 않지만 대중들의 필요를 충족시켜 주고 있기에, 음성인식 산업의 규모가 점진적으로 성장하고 있다. 앞으로 음성인식 기술의 발전과 그에 따른 사업의 규모는 그 누구도 예상할 수 없을 정도로 빠르게 성장해 나갈 것이다. 이러한 상황에서, 음성인식 개발자들에게 꼭 필요한 지식과 정보를 전달해 주는 음성인식 교재는 필수 불가결한 요소라고 할 수 있을 것이다. 이 책은 최신 음성인식 기술을 구현한 오픈소스인 Kaldi를 기반으로, 음성인식의 배경지식과 실제 구현에 대해 자세히 설명한 음성인식 교재이다.
본문에서 저자는 예제 분석에 주의를 기울이고, 공식 유도를 되도록 피하였으며, 핵심 문제와 해당 알고리즘의 직관적인 의미를 설명하는 데 중심을 두었다. 또한 독자들이 음성 기술에 대한 거시적 관점을 빠르게 확립하고 Kaldi 도구 셋의 세밀한 부분까지도 이해할 수 있도록 돕기 위해 예제 해석에 초점을 맞추었다. 음성과 관련된 배경 지식이 없는 독자들은 이 책을 입문 참고서로 사용하여 음성 개발을 빠르게 시작할 수 있다.


Information Provided By: : Aladin

Author Introduction

천궈궈(지은이)

Tsinghua 대학교 학사로 졸업했으며, 박사과정은 오픈 소스 음성인식 도구인 Kaldi의 메인 개발자 Daniel Povey와 존스홉킨스 대학에서 언어 및 음성 처리 센터의 교수를 역임하고 있는 Sanjeev Khudanpur의 지도를 받았다. 음성인식 및 자연어 처리에 중점을 둔 KITT.AI를 공동 설립했으며, 2017년 Baidu에 인수되었다. 현재 Baidu Smart Living Group(SLG)의 수석 설계자이다.

뚜지아위(지은이)

Dalian 기술대학에서 학사 학위를 받은 후, 호주 New South Wales 대학교 전자정보공학부의 신호처리 석사 학위를 받았다. Kaldi와 관련된 작업에 참여 하였는데, Kaldi nnet1 신경망 프레임워크의 lstm을 개발했다. Tsinghua 대학교, Peking 대학교, Nanyang 기술 대학교, Columbia 대학교 등 거의 200개 국내외 대학의 과학 연구 프로젝트에 기여한 세계 최대의 중국 오픈 소스 음성 데이터 셋 프로젝트 AISHELL-1, AISHELL-2를 시작하고 홍보했다.

나씽위(지은이)

Beijing 공과대학에서 학부 및 박사 학위를 받았으며, 주요 연구 분야는 음성인식 및 음성합성이다. 그는 중국 과학 아카데미의 음향 연구소와 Alibaba Robotics에서 근무하였고, Microsoft에서 수석 응용 프로그램 과학자로 일하면서, 음성인식 알고리즘 및 기술 아키텍처의 개발 및 비즈니스 지원 업무를 담당하고 있다. 2015년에는 Kaldi 오픈소스 프로젝트에 코드를 기여하기 시작했으며, nnet3 및 chain 모델 개발에 참여했다. 이와 관련된 여러 예제 및 OpenSLR의 중국어 음성인식 모델의 유지 관리에 관여했다.

장쥔보어(지은이)

그는 Yan Yonghong 교수의 지도아래 중국 과학원 음향 연구소에서 박사 학위를 받았다. 그는Xiaomi에서 음성인식, 스마트 장치 웨이크업, 성문인식, 음성향상 및 음성 알고리즘 연구 프레임워크 셋 구축을 주관하였다. 그의 여러 논문은 향후의 음성 연구 및 개발 작업의 기반을 마련했다. 최근에는 외국어 학습에서 발음 평가를 위한 발음 점수를 계산하는 코드를 Kaldi에 기고했다.

단비(옮긴이)

음성인식 전문업체에서 근무하면서, 대어휘 자연어 인식, 대어휘 고립어 인식, 핵심어 인식, 웨 이크업 인식, 명령어 인식 등 다방면의 음성인식 시스템을 개발하고 있다. 새로운 기술을 배우고 익히는는 것을 즐기며, 다수의 머신러닝 서적을 번역하였다.

Information Provided By: : Aladin

Table of Contents

제1장 음성인식의 기초
제2장 Kaldi소개
제3장 데이터 정리
제4장 기존의 음향 모델링 기술
제5장 그래프 구성 및 디코딩
제6장 딥러닝 음향 모델 기법
제7장 키워드 검색 및 음성 웨이크업(wake-up)
제8장 화자인식
제9장 음성인식 응용 실습

New Arrivals Books in Related Fields

Alexopoulos, Panos (2022)