HOME > Detail View

Detail View

실전 금융 머신 러닝 완벽 분석 / [수정판]

Material type
단행본
Personal Author
López de Prado, Marcos Mailoc 이병욱, 역 이기홍, 역 하석근, 역
Title Statement
실전 금융 머신 러닝 완벽 분석 / 마르코스 로페즈 데 프라도 지음 ; 이병욱, 이기홍, 하석근 옮김
판사항
[수정판]
Publication, Distribution, etc
서울 :   에이콘,   2019  
Physical Medium
519 p. : 삽화, 도표 ; 23 cm
Series Statement
에이콘 금융 퀀트 머신러닝 융합 시리즈
Varied Title
Advances in financial machine learning
ISBN
9791161752334 9791161752464 (Set)
Bibliography, Etc. Note
참고문헌과 색인수록
Subject Added Entry-Topical Term
Finance --Data processing Finance --Mathematical models Machine learning
000 00000nam c2200205 c 4500
001 000046083193
005 20210617173424
007 ta
008 210617s2019 ulkad b 001c kor
020 ▼a 9791161752334 ▼g 94000
020 1 ▼a 9791161752464 (Set)
040 ▼a 211009 ▼c 211009 ▼d 211009
041 1 ▼a kor ▼h eng
082 0 0 ▼a 332.0285/631 ▼2 23
085 ▼a 332.0285 ▼2 DDCK
090 ▼a 332.0285 ▼b 2019z5
100 1 ▼a López de Prado, Marcos Mailoc ▼0 AUTH(211009)100093
245 1 0 ▼a 실전 금융 머신 러닝 완벽 분석 / ▼d 마르코스 로페즈 데 프라도 지음 ; ▼e 이병욱, ▼e 이기홍, ▼e 하석근 옮김
246 1 9 ▼a Advances in financial machine learning
250 ▼a [수정판]
260 ▼a 서울 : ▼b 에이콘, ▼c 2019
300 ▼a 519 p. : ▼b 삽화, 도표 ; ▼c 23 cm
490 1 0 ▼a 에이콘 금융 퀀트 머신러닝 융합 시리즈
504 ▼a 참고문헌과 색인수록
650 0 ▼a Finance ▼x Data processing
650 0 ▼a Finance ▼x Mathematical models
650 0 ▼a Machine learning
700 1 ▼a 이병욱, ▼e▼0 AUTH(211009)1768
700 1 ▼a 이기홍, ▼e
700 1 ▼a 하석근, ▼e
830 0 ▼a 에이콘 금융 퀀트 머신러닝 융합 시리즈
900 1 0 ▼a 로페즈 데 프라도, 마르코스, ▼e
945 ▼a KLPA

Holdings Information

No. Location Call Number Accession No. Availability Due Date Make a Reservation Service
No. 1 Location Science & Engineering Library/Sci-Info(Stacks1)/ Call Number 332.0285 2019z5 Accession No. 121257478 Availability Available Due Date Make a Reservation Service B M

Contents information

Book Introduction

머신러닝을 금융에 적용하는 방법을 알려주며, 이론 연구를 넘어선 실전 경험을 바탕으로 어떠한 장점과 위험이 존재하는 것인지 빠짐없이 설명한다. 저자가 20년 간 금융에서 실제로 적용해 본 머신러닝 기법에 대해 각각의 장단점과 함께 개별 기법들을 상세히 설명한다. 또 금융에 맞는 데이터 구조, 모델링, 백테스팅, 유용한 금융적 특징, 고성능 컴퓨팅에 이르기까지 최고 전문가의 시각에서 전달해 주는 실전 지식을 빠짐없이 나열한다.
대부분의 금융 머신러닝 프로젝트가 실패하는 이유와 성공적인 금융 머신러닝 프로젝트를 위해서 어떠한 요소가 갖춰져야 하는지 설명하고 있다. 특히 대부분 프로젝트가 저지르는 백테스팅의 오류를 심도 있게 설명한다.
메타-전략 패러다임의 효용성과 중요성을 설명해 주며, 대부분 성공한 프로젝트가 활용하고 있는 메타-전략 패러다임을 예제와 함께 잘 설명한다. 이 책은 그 깊이로 인해 머신러닝과 금융에 대한 최소한의 지식을 갖춰야 이해할 수 있지만, 최소한의 지식이 바탕이 되고 나면 책에서 다루고 있는 깊이 있고 실용적인 내용으로부터 많은 도움을 받을 수 있다.

★ 이 책의 대상 독자 ★

특히 금융 관련 데이터에 연계된 문제들을 해결하기 위해 설계된 고급 머신러닝 기법을 다루고 있다. '고급'이라는 의미는 이해하기가 극도로 힘들다거나 딥러닝이나 순환신경망 또는 합성곱망 등 최근에 되살아나고 있는 기법들을 설명한다는 의미는 아니다. 그보다 이 책은 금융 문제에 머신러닝 알고리즘을 적용한 경험이 있는 상급 연구원들이 중요하게 생각하는 여러 의문에 해답을 주고자 쓰여졌다. 만약 머신러닝이 처음이고, 복잡한 알고리즘에 대한 경험이 없다면 이 책은 (아직은) 맞지 않을 것이다. 이 책에서 다루고 있는 문제에 대해 현업에서의 경험이 없다면 이 책을 이용해 문제를 해결하기가 쉽지 않을 것이다. 이 책을 읽기 전에 머신러닝에 관한 여러 훌륭한 책을 읽길 권한다.
이 책의 핵심 독자들은 머신러닝 경험이 풍부한 전문 투자가들이다. 저자의 목표는 여러분이 이 책에서 배운 것을 통해 수익을 증대하기를 바라는 것이고, 금융을 현대화하는 데 일조하고 투자가들에게 실질적인 가치를 전달해 주기를 바라는 것이다.
이 책은 금융 이외의 여러 분야에 머신러닝 알고리즘을 성공적으로 구현한 경험이 있는 데이터 과학자들에게도 적합하다. 만약 여러분이 구글에서 일하면서 얼굴 인식 분야를 성공적으로 구현한 적이 있지만, 금융 쪽에 제대로 적용해 본 적이 없다면 이 책이 많은 도움이 될 것이다. 가끔 특정 구조(예를 들어, 메타 레이블링, 삼중 배리어 기법, 프랙디프)의 금융 논리에 대해 잘 이해되지 않을 때도 있을 수 있지만, 끈기를 갖길 바란다. 투자 포트폴리오를 일정 수준 이상 운용하다 보면 게임의 법칙이 점점 뚜렷하게 보이고, 1장에 설명된 내용들이 이해가 될 것이다.

★ 이 책의 구성 ★

이 책은 서로 얽혀 있는 주제들을 각각 구분해 정돈된 형태로 설명한다. 각 장은 그 이전 장을 읽었다고 가정하고 설명한다. 1부는 금융 데이터를 머신러닝 알고리즘에서 잘 적용할 수 있도록 데이터를 구조화하는 방법을 알아보고, 2부에서는 해당 데이터에 기반해 머신러닝 알고리즘을 활용해 리서치하는 방법을 알아본다. 여기서 중요한 것은 실질적인 발견은 연구나 과학적 프로세스를 통해 이뤄지며, 이는 우연히 어떤 (잘못될 가능성이 많은) 결과가 나타날 때까지 의미 없이 반복하는 연구 기법과는 구분된다. 3부에서는 연구에 대한 백테스트 방법을 설명하고, 결과가 잘못될 확률을 평가해 본다.
1~3부를 통해 데이터 분석으로부터 모델을 연구하고, 결과를 평가하는 전체 프로세스를 개괄할 수 있다. 이러한 지식을 바탕으로 4부에서는 데이터로 되돌아가 의미 있는 특성을 추출하는 혁신적인 방법을 설명한다. 이러한 작업들은 대부분 상당한 양의 자원을 소모하는데 5부에서는 유용한 HPC 비법을 알아본다.

머신러닝을 금융에 적용하는 방법을 알려주며, 이론 연구를 넘어선 실전 경험을 바탕으로 어떠한 장점과 위험이 존재하는 것인지 빠짐없이 설명한다. 저자가 20년 간 금융에서 실제로 적용해 본 머신러닝 기법에 대해 각각의 장단점과 함께 개별 기법들을 상세히 설명한다. 또 금융에 맞는 데이터 구조, 모델링, 백테스팅, 유용한 금융적 특징, 고성능 컴퓨팅에 이르기까지 최고 전문가의 시각에서 전달해 주는 실전 지식을 빠짐없이 나열한다.

대부분의 금융 머신러닝 프로젝트가 실패하는 이유와 성공적인 금융 머신러닝 프로젝트를 위해서 어떠한 요소가 갖춰져야 하는지 설명하고 있다. 특히 대부분 프로젝트가 저지르는 백테스팅의 오류를 심도 있게 설명한다.


Information Provided By: : Aladin

Table of Contents

1.1 동기 부여
1.2 이론이 중요하다
1.2.1 교훈1: 이론이 필요하다
1.2.2 교훈2: 머신러닝은 이론을 발견하는 것을 돕는다
1.3 어떻게 과학자들이 머신러닝을 이용하는가
1.4 두 가지 형태의 과적합
1.4.1 훈련셋 과적합
1.4.2 테스트셋 과적합
1.5 개요
1.6 청중
1.7 다섯 가지 만연한 금융 머신러닝에 대한 잘못된 개념
1.7.1 머신러닝은 성배 대 머신러닝은 무용지물
1.7.2 머신러닝은 블랙박스
1.7.3 금융은 머신러닝을 적용하기에는 불충분한 데이터를 갖고 있다
1.7.4 금융에서 신호 대 잡음 비율이 너무 낮다
1.7.5 금융에서 과적합의 위험은 너무 크다
1.8 금융 리서치의 미래
1.9 자주 물어 보는 질문들
1.10 결론
1.11 연습문제

2장. 잡음 제거와 주음 제거

2.1 동기 부여
2.2 마르첸코-파스퇴르 정리
2.3 신호가 있는 랜덤 행렬
2.4 마르첸코-파스퇴르 PDF 적합화
2.5 잡음 제거
2.5.1 상수 잔차 고유값 방법
2.5.2 타깃 축소
2.6 주음 제거
2.7 실험 결과
2.7.1 최소 분산 포트폴리오
2.7.2 최대 샤프 비율 포트폴리오
2.8 결론
2.9 연습문제

3장. 거리 척도

3.1 동기 부여
3.2 상관계수 기반 척도
3.3 한계와 결합 엔트로피
3.4 조건부 엔트로피
3.5 쿨백 - 라이블러 발산
3.6 교차 엔트로피
3.7 상호 정보
3.8 정보 변분
3.9 이산화
3.10 두 분할 간의 거리
3.11 실험 결과
3.11.1 무관계
3.11.2 선형관계
3.11.3 비선형관계
3.12 결론
3.13 연습문제

4장. 최적 군집화

4.1 동기 부여
4.2 근접성 행렬
4.3 군집화 종류
4.4 군집의 수
4.4.1 관측 행렬
4.4.2 기본 군집화
4.4.3 상위 수준 군집화
4.5 실험 결과
4.5.1 랜덤 블록 상관관계 행렬 생성
4.5.2 군집의 수
4.6 결론
4.7 연습문제

5장. 금융 레이블

5.1 동기 부여
5.2 고정 - 기간 방법
5.3 삼중 배리어 방법
5.4 추세 검색 방법
5.5 메타 레이블링
5.5.1 기대 샤프 비율에 의한 베팅 크기
5.5.2 앙상블 베팅 크기
5.6 실험 결과
5.7 결론
5.8 연습문제

6장. 특성 중요도 분석

6.1 동기 부여
6.2 p - 값
6.2.1 p 값의 몇 가지 결함
6.2.2 수치 예제
6.3 특성 중요도
6.3.1 평균 감소 불순도
6.3.2 평균 감소 정확도
6.4 확률 가중 정확도
6.5 대체 효과
6.5.1 직교화
6.5.2 군집 특성 중요도
6.6 실험 결과
6.7 결론
6.8 연습문제

7장. 포트폴리오 구축

7.1 동기 부여
7.2 볼록 포트폴리오 최적화
7.3 조건 수
7.4 마코위츠의 저주
7.5 공분산 불안정성의 원천으로서의 신호
7.6 중첩 군집 최적화 알고리즘
7.6.1 상관 군집화
7.6.2 군집 내 비중
7.6.3 군집 간 비중
7.7 실험 결과
7.7.1 최소 분산 포트폴리오
7.7.2 최대 샤프 비율 포트폴리오
7.8 결론
7.9 연습문제

8장. 테스트셋 과적합

8.1 동기 부여
8.2 정밀도와 재현율
8.3 다중 테스트하의 정밀도와 재현율
8.4 샤프 비율
8.5 ‘거짓 전략’ 정리
8.6 실험 결과
8.7 축소 샤프 비율
8.7.1 유효 시행 수
8.7.2 시행 간 분산
8.8 군별 오차율
8.8.1 시다크 조정
8.8.2 다중 테스트하의 1종 오류
8.8.3 다중 테스트하의 2종 오류
8.8.4 1종과 2종 오류 간의 상호작용
8.9 결론
8.10 연습문제

부록 A. 합성 데이터 테스트
부록 B. ‘거짓 전략’ 정리의 증명

New Arrivals Books in Related Fields

한국은행. 금융결제국. 결제연구팀 (2020)