000 | 00000cam c2200205 c 4500 | |
001 | 000046155647 | |
005 | 20230803131440 | |
007 | ta | |
008 | 230803s2023 ulkad 001c kor | |
020 | ▼a 9791161757605 ▼g 93000 | |
035 | ▼a (KERIS)BIB000016794213 | |
040 | ▼a 211023 ▼c 211023 ▼d 211009 | |
041 | 1 | ▼a kor ▼h eng |
082 | 0 4 | ▼a 006.31 ▼2 23 |
085 | ▼a 006.31 ▼2 DDCK | |
090 | ▼a 006.31 ▼b 2023z12 | |
100 | 1 | ▼a Masís, Serg |
245 | 2 0 | ▼a (파이썬을 활용한) 머신러닝 해석 가능성 : ▼b 예측의 공정성, 책임성, 투명성을 수립하는 다양한 방법 학습하기 / ▼d 세르그 마시스 지음 ; ▼e 김우현 옮김 |
246 | 1 9 | ▼a Interpretable machine learning with Python : ▼b learn to build interpretable high-performance models with hands-on real-world examples |
260 | ▼a 서울 : ▼b 에이콘, ▼c 2023 | |
300 | ▼a 839 p. : ▼b 삽화(일부천연색), 도표 ; ▼c 24 cm | |
500 | ▼a 색인수록 | |
650 | 0 | ▼a Machine learning |
650 | 0 | ▼a Python (Computer program language) |
700 | 1 | ▼a 김우현, ▼e 역 |
900 | 1 0 | ▼a 마시스, 세르그, ▼e 저 |
945 | ▼a ITMT |
소장정보
No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
---|---|---|---|---|---|---|---|
No. 1 | 소장처 중앙도서관/제2자료실(3층)/ | 청구기호 006.31 2023z12 | 등록번호 111883388 | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
컨텐츠정보
책소개
설명 가능한 인공지능 또는 해석 가능한 머신러닝 모델을 구축하는 다양한 방법론을 소개한다. 최근 이슈가 되고 있는 인공지능 모델의 윤리적 문제를 다루면서도 동시에 높은 성능과 견고성을 유지할 수 있는 비결을 소개한다.
먼저 해석 가능성이란 무엇인지 설명하고 머신러닝 모델의 윤리적 측면인 공정성, 책임성, 투명성이 필요한 이유 그리고 이를 달성할 방법을 설명한다. 그 다음 다양한 상황과 다양한 데이터 형태를 갖는 각 유스 케이스에서 머신러닝 해석방법론을 적용하는 과정을 실제적으로 다루고 있다. 마지막으로 모델의 복잡성을 줄이고, 편향을 완화시키고, 안정성과 견고성을 향상시키기 위해 모델을 튜닝하는 방법을 학습할 수 있다.
◈ 이 책에서 다루는 내용 ◈
◆ 비즈니스에서 해석 가능성의 중요성
◆ 선형 모델, 의사결정 트리, 나이브 베이즈 등 본질적으로 해석 가능한 모델 학습
◆ 모델 독립적인 해석방법론을 통해 모델 해석 숙련도 향상
◆ 이미지 분류기의 작동 방식 및 모델이 학습한 내용 시각화
◆ 데이터셋에서 편향 완화 방법
◆ 적대적 견고성으로 모델의 신뢰성을 높이는 방법
◆ 단조적 제약조건을 사용해 보다 공정하고 안전한 모델 구축
◈ 이 책의 대상 독자 ◈
◆ 머신러닝과 파이썬 프로그래밍 언어에 대한 기초 지식을 가진 데이터 과학 초보자 및 학생
◆ 자신이 개발하고 유지 관리하는 AI 시스템의 작동 방법과 개선 계획을 설명할 중요 책임이 점점 더 늘어나는 데이터 전문가
◆ 최신 해석 방법론과 편향 완화 기술을 포함하도록 자신의 기술 영역을 확장하려는 머신러닝 엔지니어 및 데이터 과학자
◆ AI 윤리와 관련해 더 나은 방향을 제시하기 위해 AI의 구현 측면을 더 깊이 이해하고자 하는 AI 윤리 담당자
◆ 공정성, 책임성, 투명성의 원칙을 준수하기 위해 해석 가능한 머신러닝을 비즈니스에 도입하려는 AI 프로젝트 매니저 및 비즈니스 리더
◈ 이 책의 구성 ◈
1장, '해석, 해석 가능성, 설명 가능성: 왜 이 모두가 중요한가?'에서는 머신러닝 해석과 함께 해석 가능성, 설명 가능성, 블랙박스 모델, 투명성 등과 같은 관련 개념을 소개하고 모호성을 피하기 위해 용어에 관한 정의를 제공한다. 그 다음 비즈니스에 대한 머신러닝 해석 가능성
의 가치를 논의한다.
2장, '해석 가능성의 주요 개념'에서는 심혈관 질환 예측 예제를 사용해 두 가지 기본 개념인 "피처 중요도"와 "의사결정 영역"을 소개하고, 해석 방법론을 분류할 때 사용되는 가장 중요한 분류법을 살핀다. 또한 머신러닝 해석 가능성을 방해하는 것이 무엇인지 자세히 설명한다.
3장, '머신러닝 해석의 과제'에서는 항공기 지연 예측 문제를 갖고 회귀와 분류 모두에서 머신러닝 해석에 사용되는 전통적인 방법을 논의한다. 그 다음 이런 전통적인 방법의 한계를 살펴보고 "화이트박스" 모델을 본질적으로 해석할 수 있게 만드는 요소가 무엇인지, 왜 화이트박스 모델을 항상 사용할 수 없는지 설명한다. 이 질문에 답하기 위해 예측 성능과 모델 해석 가능성 사이의 절충에 대해 고려할 것이다. 마지막으로 이런 절충 문제에서 타협하지 않으려는 새로운 모델인 "글래스박스(glass-box)" 모델을 살펴본다.
4장, '피처 중요도와 피처 영향력'에서는 출생 순서 분류 예제를 사용해 모델의 고유한 매개변수를 사용하는 것과 같이, 피처 중요도를 얻기 위한 다른 방법론들과 함께 "순열 피처 중요도(PFI, Permutation Feature Importance)"라고 부르는 좀 더 신뢰할 수 있는 모델 독립적인 방법론을 논의한다. 그런 다음에 단일 피처의 예측에 대한 한계 효과를 확인하기 위해 "부분 의존도 플롯(PDP, Partial Dependence Plot)" 및 "개별 조건부 기대치(ICE, Individual Conditional Expectation)" 그래프를 렌더링하고 해석하는 방법을 학습한다.
5장, '글로벌 모델 독립적인 해석 방법론'에서는 자동차 연비 회귀 모델을 사용해 게임 이론으로부터 영감을 받은 SHAPS(Hapley Additive exPlanations)를 자세히 학습한 다음, 조건부 주변 분포인 "누적 지역 효과(ALE, Accumulated Local Effects)" 그래프를 시각화한다. 마지막으로 "글로벌 대체 모델(Global Surrogate)"에 대해 알아본다.
6장, '로컬 모델 독립적인 해석 방법론'에서는 단일 예측 또는 그룹 예측을 설명하는 로컬 해석 방법론을 다룬다. 이를 위해 테이블 데이터와 텍스트 데이터를 모두 포함하고 있는 초콜릿바 등급 분류 예제를 사용한다. 로컬 해석을 위해 SHAP와 LIME(Local Interpretable Model-Agnostic Descriptions)을 활용하는 방법을 다룰 것이다.
7장, '앵커와 반사실적 설명'에서는 로컬 모델 해석을 계속하며, 분류 문제를 더 깊게 다룬다. 인간이 해석할 수 있는 방식으로 불공정한 예측을 설명하는 방법을 파악하기 위해 재범 위험 예측 예제를 사용한다. WIT(What-If-Tool)뿐만 아니라 "앵커(Anchor)", "반대 사실(Counterfactuals)", "대조적 설명 방법론(CEM, Contrastive Explanation Method)" 등을 소개한다.
8장, '컨볼루션 신경망 시각화'에서는 컨볼루션 신경망(CNN) 모델인 과일 분류기 모델과 함께 작동하는 해석 방법론을 집중적으로 살펴본다. CNN이 "활성화 함수(activation)"를 통해 학습하는 방법을 파악한 후, 클래스 속성을 디버깅하기 위해 "돌출 맵(Saliency Maps)", Grad-CAM, "통합 그래디언트(Integrated Gradients)" 등과 같은 몇 가지 그래디언트 기반 귀인 방법론을 학습한다. 마지막으로 "폐쇄 민감도(Occlusion Sensitivity)", LIME, CEM과 같은 섭동 기반 귀인 방법론을 통해 속성 디버깅 노하우를 확장한다.
9장, '다변량 예측 및 민감도 분석을 위한 해석 방법론'에서는 교통량 예측 문제와 LSTM(Long Short-Term Memory) 모델을 사용해 이 유스 케이스에 통합 그래디언트와 SHAP를 적용하는 방법을 다룬다. 또한 예측과 불확실성이 본질적으로 어떻게 연결돼 있는지, 입력과 관련된 모델 출력의 불확실성을 측정하기 위해 설계된 방법론 중 민감도 분석을 살펴본다. 여기서는 인자의 우선순위를 추출하는 모리스(Morris) 방식과 인자를 고정하는 소볼(Sobol) 방식 두 가지를 학습한다.
10장, '해석 가능성을 위한 피처 선택과 피처 엔지니어링'에서는 비영리 다이렉트 메일링 최적화 문제를 사용해 스피어만(Spearman) 상관계수와 같은 필터 기반 피처 선택 방법론을 검토하고, Lasso와 같은 임베디드 방법에 관해 알아본다. 그런 다음 "순차적인 피처 선택(Sequential Feature Selection)"과 같은 래퍼 방법, "재귀적인 피처 제거(Recursive Feature Elimination)"와 같은 하이브리드 방법, "유전 알고리듬(Genetic Algorithm)"과 같은 고급 방법을 소개한다. 마지막으로, "피처 엔지니어링(feature engineering)"은 일반적으로 피처 선택 이전에 수행되지만, 먼지가 가라앉은 후에 수행하는 것도 여러 가지 이유로 가치가 있음을 살펴본다.
11장, '편향 완화 및 인과관계 추론 방법론'에서는 신용카드 채무불이행 문제를 통해 원치 않는 편향을 감지하기 위해 공정성 메트릭 및 시각화를 활용하는 방법을 배운다. 그다음 가중치 재설정과 같은 전처리 방법, 프로세스 내 처리를 위한 이질적 영향력 제거기, 후처리를 위한 "오즈 균등화(equalized odds)" 등을 통해 편향을 줄이는 방법을 살펴본다. 그러고 나서 신용카드 채무불이행을 낮추기 위한 처치를 테스트하고 인과적 모델링을 활용해 "평균 처치 효과(ATE, Average Treatment Effects)"와 "조건부 평균 처치 효과(CATE, Conditional Average Treatment Effects)"를 결정한다. 마지막으로, 인과적 가정과 추정치의 견고성을 테스트한다.
12장, '해석 가능성을 위한 단조성 제약조건과 모델 튜닝'에서는 7장의 재범 위험 예측 문제를 계속해서 다룬다. 공정성을 보장하기 위해 데이터 측면에 "피처 엔지니어링"과 함께 가드레일을 배치하고, 모델에 "단조적이고 상호작용하는 제약조건"을 적용하는 방법을 배우는 동시에 여러 목표가 있을 때 모델을 튜닝하는 방법을 배운다.
13장, '적대적 견고성'에서는 얼굴 마스킹 탐지 문제를 사용해 엔드 투 엔드 적대적 솔루션(end-to-end adversarial solution)을 다룬다. 모델을 공격하는 방법에는 여러 가지가 있지만, 여기서는 칼리니(Carlini)와 와그너(Wagner)의 "인피니티-노름(Infinity-Norm)" 및 "적대적 패치(Adversarial Patchs)"와 같은 회피 공격에 초점을 맞추고, 다른 형태의 공격은 간략하게 설명한다. "공간 평활 전처리(spatial smoothing preprocessing)"와 "적대적 학습(adversarial training)"이라는 두 가지 방어 방법을 설명한다. 끝으로 "견고성 평가" 방법 하나와 인증 방법 하나를 보여준다.
14장, '머신러닝 해석 가능성 그 다음 단계는?'에서는 머신러닝 해석 가능성 방법론의 생태계의 맥락에서 학습한 내용을 요약한다.
정보제공 :

저자소개
세르그 마시스(지은이)
지난 20년 동안 인터넷, 애플리케이션 개발 및 분석의 교차점에 있었다. 현재 세계 식량 안보 향상의 임무를 가진 선도적인 농업 비즈니스 기업인 신젠타(Syngenta)의 기후 및 농업 데이터 과학자다. 그 전에는 클라우드 컴퓨팅과 머신러닝의 힘을 의사결정 과학의 원리와 결합해 사용자를 새로운 장소와 이벤트에 노출시키는 하버드 이노베이션 랩스(Harvard Innovation Labs)가 인큐베이팅한 스타트업을 공동 설립했다. 여가 활동이나 식물의 질병, 또는 고객 평생 가치 등 분야에 상관없이 데이터와 의사결정 사이에서 자주 놓치는 연결 고리를 제공하는 데 열정을 쏟고 있으며, 머신러닝 해석은 이런 격차를 해소하는 데 강력한 도움이 된다.
김우현(옮긴이)
대학생 시절, 선배와 함께 창업한 이후 20년 넘게 소프트웨어 개발자로 살고 있으며 인공지능 분야에서 새로운 길을 만들어 가고 있다. 숙명여자대학교 나노/바이오 전산화학 연구센터에서 데이터 과학자로 근무했으며, 현재 프리랜서 AI 개발자로 일하는 중이다. 옮긴 책으로는 에이콘출판사에서 출간한 『R 데이터 구조와 알고리즘』(2017), 『자바 데이터 사이언스 쿡북』(2018), 『피처 엔지니어링, 제대로 시작하기』(2018), 『The Python 3 Standard Library by Example』(2020), 『파이썬 객체지향 프로그래밍 4/e』(2022) 등이 있다.

목차
1부. 머신러닝 해석 소개 __1장. 해석, 해석 가능성, 설명 가능성: 왜 이 모두가 중요한가? ______기술 요구 사항 ______머신러닝 해석이란? ____단순 몸무게 예측 모델의 이해 ______해석 가능성과 설명 가능성의 차이점 이해 ____해석 가능성이란 ____설명 가능성이란 ______해석 가능성에 대한 비즈니스 사례 ____더 나은 의사결정 ____더 신뢰받는 브랜드 ____더 윤리적인 ____더 많은 수익 ______정리 ______이미지 소스 ______더 읽을거리 __2장. 해석 가능성의 주요 개념 ______기술 요구 사항 ______미션 ____CVD에 대한 상세정보 ______접근법 ______준비 ____라이브러리 로드 ____데이터 이해 및 준비 ______해석 방법론의 종류와 범위 ____모델 해석 가능성 방법론의 종류 ____모델 해석 가능성의 범위 ____로지스틱 회귀로 개별 예측 해석 ______머신러닝 해석 가능성을 저해하는 요인 ____비선형성 ____상호작용성 ____비단조성 ______미션 완료 ______정리 ______더 읽을거리 __3장. 머신러닝 해석의 과제 ______기술 요구 사항 ______미션 ______접근법 ______준비 ____라이브러리 로드 ____데이터의 이해 및 준비 ______전통적인 모델 해석 방법론 ____다양한 회귀 방법론으로 지연된 시간 예측 ____다양한 분류 방법론으로 항공편 지연 여부 분류 ____차원 축소 방법으로 지연된 항공편 시각화 ______전통적인 모델 해석 방법론의 한계 ______본질적으로 해석 가능한 화이트박스 모델 ____일반화 선형 모델(GLM) ____의사결정 트리 ____RuleFit ____최근접 이웃 ____나이브 베이즈 ______성능과 해석 가능성 사이의 균형 ____특수한 모델 속성 ____성능 평가 ______최신의 해석 가능한 글래스박스 모델 ____설명 가능한 부스팅 머신(EBM) ____Skoped Rules ______미션 완료 ______정리 ______데이터셋 소스 ______더 읽을거리 2부. 해석 방법론 마스터하기 __4장. 피처 중요도와 피처 영향력 ______기술 요구 사항 ______미션 ____성격과 출생 순서 ______접근법 ______준비 ____라이브러리 로드 ____데이터 이해 및 준비 ______결과에 대한 피처의 영향력 측정 ____트리 기반 모델의 피처 중요도 ____로지스틱 회귀의 피처 중요도 ____LDA의 피처 중요도 ____다층 퍼셉트론의 피처 중요도 ______PFI 실습 ____PFI의 단점 ______PDP 해석 ____상호작용 PDP ____PDP의 단점 ______ICE 플롯 ____ICE의 단점 ______미션 완료 ______정리 ______데이터셋 소스 ______더 읽을거리 __5장. 글로벌 모델 독립적 해석 방법론 ______기술 요구 사항 ______미션 ______접근법 ______준비 ____라이브러리 로드 ____데이터 이해 및 준비 ____데이터 딕셔너리 ______섀플리 값 소개 ______SHAP 요약 플롯 및 의존도 플롯 해석 ____SHAP 요약 플롯 생성 ____상호작용 이해하기 ____SHAP 의존도 플롯 ____SHAP 영향력 플롯 ______누적 지역 효과 플롯 ______글로벌 대체 모델 ______미션 완료 ______정리 ______더 읽을거리 __6장. 로컬 모델 독립적 해석 방법론 ______기술 요구 사항 ______미션 ______접근법 ______준비 ____라이브러리 로드 ____데이터 이해 및 준비 ______SHAP의 KernelExplainer 활용해 SHAP 값으로 로컬 해석 ______LIME ______NLP에 LIME 사용하기 ______NLP에 SHAP 사용하기 ______SHAP과 LIME 비교 ______미션 완료 ______정리 ______데이터셋 소스 ______더 읽을거리 __7장. 앵커와 반사실적 설명 ______기술 요구 사항 ______미션 ____재범 위험 평가의 부당한 편향 ______접근법 ______준비 ____라이브러리 로드 ____데이터 이해 및 준비 ______앵커 설명에 대한 이해 ____alibi를 이용해 앵커 및 반사실적 설명 준비하기 ____앵커 설명을 위한 로컬 해석 ______반사실적 설명 탐색 ____프로토타입을 통한 반사실적 설명 ____What-If 도구(WIT)를 사용한 반사실적 설명 ______CEM과의 비교 ______미션 완료 ______정리 ______데이터셋 소스 ______더 읽을거리 __8장. 컨볼루션 신경망 시각화 ______기술 요구 사항 ______미션 ______접근법 ______준비 ____라이브러리 로드 ____데이터 이해 및 준비 ____전통적인 해석 방법론으로 CNN 분류기 평가 ______활성화 기반 방법론으로 학습 과정을 시각화 ____중간 활성화 ____활성화 극대화 ______그래디언트 기반 귀인 방법론으로 오분류 검증 ____돌출 맵 ____Grad-CAM ____통합 그래디언트 ____종합 ______섭동 기반 귀인 방법론으로 분류 이해 ____폐쇄 민감도 ____LIME의 ImageExplainer ____CEM ____종합 ____보너스: SHAP의 DeepExplainer ______미션 완료 ______정리 ______데이터셋 및 이미지 소스 ______더 읽을거리 __9장. 다변량 예측 및 민감도 분석을 위한 해석 방법론 ______기술 요구 사항 ______미션 ______접근법 ______준비 ____라이브러리 로드 ____데이터 이해 및 준비 ______전통적인 해석 방법론으로 시계열 모델 평가 ______통합 그래디언트로 LSTM 속성 생성 ______SHAP의 KernelExplainer로 글로벌 및 로컬 속성 계산 ______인자 우선순위화로 영향력 있는 피처 식별 ______인자 고정으로 불확실성 및 비용 민감도 정량화 ______미션 완료 ______정리 ______데이터셋 및 이미지 소스 ______더 읽을거리 3부. 해석 가능성을 위한 튜닝 __10장. 해석 가능성을 위한 피처 선택과 피처 엔지니어링 ______기술 요구 사항 ______미션 ______접근법 ______준비 ____라이브러리 로드 ____데이터 이해 및 준비 ______상관성 없는 피처의 효과 이해 ______필터링 기반 피처 선택 방법론 ____기본 필터링 기반 방법론 ____상관관계 필터링 기반 방법론 ____순위 필터링 기반 방법론 ____필터링 기반 방법론 비교 ______임베디드 피처 선택 방법론 ______래퍼, 하이브리드, 고급 피처 선택 방법론 ____래퍼 방법론 ____하이브리드 방법 ____고급 피처 선택 방법론 ____모든 피처 선택 모델 평가 ______피처 엔지니어링 고려 ______미션 완료 ______정리 ______데이터셋 소스 ______더 읽을거리 __11장. 편향 완화 및 인과관계 추론 방법론 ______기술 요구 사항 ______미션 ______접근법 ______준비 ____라이브러리 로드 ____데이터 이해 및 준비 ______편향 감지 ____데이터셋 편향 시각화 ____데이터셋 편향 정량화 ____모델 편향 정량화 ______편향 완화 ____전처리 편향 완화 방법론 ____프로세스 내 편향 완화 방법론 ____후처리 편향 완화 방법론 ____편향 완화 방법론 비교 ______인과 모델 생성 ____실험 결과 이해 ____인과 모델에 대한 이해 ____선형 DRL 초기화 ____인과 모델 적합 ______이질적 처치 효과 ____정책 선택 ______추정치 견고성 테스트 ____무작위 공통 원인 추가 ____무작위 변수로 처치 대체 ______미션 완료 ______정리 ______데이터셋 소스 ______더 읽을거리 __12장. 해석 가능성을 위한 단조성 제약조건과 모델 튜닝 ______기술 요구 사항 ______미션 ______접근법 ______준비 ____라이브러리 로드 ____데이터 이해 및 준비 ______피처 엔지니어링으로 가드레일 배치 ____서수화 ____이산화 ____상호작용 항과 비선형 변환 ____범주화 인코딩 ____다른 준비 작업 ______해석 가능성을 위한 모델 튜닝 ____케라스 신경망 튜닝 ____인기 있는 다른 모델 클래스 튜닝 ____베이지안 하이퍼파라미터 튜닝 및 사용자 정의 메트릭으로 공정성 최적화 ______모델 제약조건 구현 ____XGBoost에 대한 제약조건 ______미션 완료 ______정리 ______데이터셋 소스 ______더 읽을거리 __13장. 적대적 견고성 ______기술 요구 사항 ______미션 ______접근법 ______준비 ____라이브러리 로드 ____데이터 이해 및 준비 ____CNN 기본 모델 로드 ____CNN 기본 분류기 평가 ______우회 공격 ______전처리를 통한 표적 공격 방어 ______적대적 학습을 통해 우회 공격으로부터 보호 ______적대적 견고성 평가 및 인증 ____모델 견고성과 공격 강도 비교 ____무작위 평활화로 견고성 인증 ______미션 완료 ______정리 ______데이터 소스 ______더 읽을거리 __14장. 머신러닝 해석 가능성 그다음 단계는? ______ML 해석 가능성의 현재 상황 이해 ____전체 요약 ____최신 트렌드 ____ML 해석 가능성의 미래에 대한 추측 ____ML의 새로운 비전 ____종합적인 접근 ____적절한 표준화 ____규제 시행 ____내장된 해석으로 인한 매끄러운 머신러닝 자동화 ____MLOps 엔지니어와의 긴밀한 통합 ______더 읽을거리