000 | 00000cam c2200205 c 4500 | |
001 | 000046110639 | |
005 | 20220405134715 | |
007 | ta | |
008 | 220322s2022 ulka 001c kor | |
020 | ▼a 9791161756134 ▼g 93000 | |
035 | ▼a (KERIS)BIB000016115474 | |
040 | ▼a 211046 ▼c 211046 ▼d 211009 | |
041 | 1 | ▼a kor ▼h eng |
082 | 0 4 | ▼a 006.31 ▼2 23 |
085 | ▼a 006.31 ▼2 DDCK | |
090 | ▼a 006.31 ▼b 2022z5 | |
100 | 1 | ▼a Alla, Sridhar |
245 | 1 0 | ▼a MLFlow를 활용한 MLOps : ▼b AWS, Azure, GCP에서 MLOps 시작하기 / ▼d 스리다르 알라, ▼e 수만 칼리안 아다리 지음 ; ▼e 정이현 옮김 |
246 | 1 9 | ▼a Beginning MLOps with MLFlow : ▼b deploy models in AWS SageMaker, Google Cloud, and Microsoft Azure |
260 | ▼a 서울 : ▼b 에이콘출판, ▼c 2022 | |
300 | ▼a 301 p. : ▼b 삽화 ; ▼c 24 cm | |
490 | 1 0 | ▼a 에이콘 데이터 과학 시리즈 |
500 | ▼a 부록: Databricks | |
500 | ▼a 색인수록 | |
650 | 0 | ▼a Machine learning |
650 | 0 | ▼a Computer software |
650 | 0 | ▼a Cloud computing |
700 | 1 | ▼a Adari, Suman Kalyan, ▼e 저 |
700 | 1 | ▼a 정이현, ▼e 역 |
830 | 0 | ▼a 에이콘 데이터 과학 시리즈 |
900 | 1 0 | ▼a 알라, 스리다르, ▼e 저 |
900 | 1 0 | ▼a 아다리, 수만 칼리안, ▼e 저 |
945 | ▼a ITMT |
Holdings Information
No. | Location | Call Number | Accession No. | Availability | Due Date | Make a Reservation | Service |
---|---|---|---|---|---|---|---|
No. 1 | Location Science & Engineering Library/Sci-Info(Stacks1)/ | Call Number 006.31 2022z5 | Accession No. 121259378 | Availability In loan | Due Date 2023-10-04 | Make a Reservation Available for Reserve | Service |
Contents information
Book Introduction
머신러닝 솔루션 구축을 위한 프로세스는 1.문제의 식별, 2.데이터 수집, 3.데이터 분석, 4.피처 엔지니어링 및 데이터 정규화, 5.모델 구축, 6.학습, 평가 및 검증, 7.예측 등의 과정이다. MLOps는 데브옵스(DevOps)에서 채택돼 머신러닝에 적용되는 원칙 및 관행으로, 파이프라인의 지속적인 통합과 전달을 보장해 전체 자동화 설정을 완료한다.
MLFlow는 기존 코드 베이스에 MLOps 원칙을 통합해 널리 사용되는 다양한 프레임워크를 지원하는 API이다. MLFlow를 사용해서 지표, 파라미터, 그래프 및 모델 자체를 로깅한다. 또한 기록된 모델을 적재하고, 기능을 활용할 수 있다.
프레임워크는 scikit-learn, TensorFlow 2.0/ Keras, PyTorch 및 PySpark의 실험에 MLFlow를 적용하는 방법과 이러한 모델 중 하나를 로컬에 배포하고 모델을 사용해 예측하는 방법을 실행해 본다. 해당 모델을 AWS, Azure, GCP에 배포하고 구성해서 서빙되는 구체적인 방법을 다룬다.
◈ 이 책에서 다루는 내용 ◈
◆ 기본 데이터 분석 수행 및 scikit-learn 및 PySpark 모델 구축
◆ 모델 학습, 테스트 및 검증(하이퍼파라미터 튜닝)
◆ MLOps의 정의와 이상적인 MLOps 구축
◆ 기존 또는 향후 프로젝트에 MLFlow를 쉽게 통합
◆ 클라우드에 모델을 배포하고 예측 수행
◈ 이 책의 대상 독자 ◈
이 책은 머신러닝 초보자부터 고급 머신러닝 엔지니어, 실험의 더 나은 구성법을 배우고자 하는 머신러닝 연구원까지 머신러닝에 관심 있는 모든 독자를 대상으로 한다.
◈ 이 책의 구성 ◈
1, 2장은 신용카드 데이터셋에 기반한 이상 검출기 모델에 MLOps 원리를 통합하는 방법을 다룬다.
3장에서는 MLOps가 무엇인지, 작동 방식 및 어떻게 유용할 수 있는지에 관한 이유에 대해 소개한다.
4장에서는 기존 프로젝트에서 MLFlow를 구현하고 활용해 몇 줄의 코드만으로 MLOps의 이점을 누릴 수 있는 방법에 대해 자세히 설명한다.
5장, 6장, 7장에서는 모델을 운영해 AWS, Microsoft Azure 및 Google Cloud에 각각 구축할 수 있는 방법을 다룬다.
7장에서는 가상 머신에서 모델을 호스팅하고 외부 소스에서 서버에 연결해 예측을 수행하는 방법을 설명한다. 따라서 설명서에 설명된 MLFlow 기능이 오래되면 언제든지 이 방식을 사용해 클라우드상의 일부 클러스터에서 모델을 서비스할 수 있다.
마지막 장인 부록에서는 MLFlow를 만든 Databricks를 활용해 MLFlow 실험을 구성하고 모델을 배치하는 방법에 대해 설명한다.
Information Provided By: :

Author Introduction
스리다르 알라(지은이)
SAS 코드를 Python으로 자동 변환하는 것에 초점을 맞춘 제품 Sas2Py(www.sas2py.com)의 벤더인 Bluewhale.one의 설립자이자 CTO이다. 블루웨일(Bluewhale)은 지능적인 이메일 대화 추적부터 소매업계에 영향을 미치는 문제 등에 이르기까지 AI를 활용해 핵심 문제를 해결하는 데도 주력하고 있다. 또한 퍼블릭 클라우드와 사내 인프라 모두에서 AI기반 빅데이터 분석 실무 구축에 관한 깊은 전문 지식을 보유하고 있다. 그는 저자이자 수많은 Strata, Hadoop World, Spark Summit 및 기타 콘퍼런스에서 열정적인 발표자로 활동하고 있을 뿐만 아니라 대규모 컴퓨팅 및 분산 시스템에 대해 미국 PTO에 출원한 여러 특허를 보유하고 있다.
수만 칼리안 아다리(지은이)
컴퓨터 비전, 적대적 머신러닝, 자연어 처리(대화형 AI) 이상 탐지(anomaly detection) 등 다양한 분야에서 실용성을 발휘하는 딥러닝을 전문으로 하는 플로리다대학교 수석연구원이다. 2019년 6월 미국 오리건주 포틀랜드에서 열린 신뢰할 수 있고 안전한 머신러닝에 관한 IEEE에서 연사로 참여했다. 또한 그는 이상 탐지에 있어 딥러닝의 활용에 초점을 맞춘 책을 출간한 작가이기도 하다.
정이현(옮긴이)
IT 서비스업계에서 주로 금융 차세대 AA/SA 및 Mobile Commerce/Payment 관련 글로벌 프로젝트에서 솔루션 아키텍트 역할을 수행해오다가 2017년부터 본격적으로 클라우드 및 데이터 플랫폼 관련 업무를 수행해 현재에 이른다. AWS, Azure, GCP 등 주요 CSP 내 Managed Kubernetes Cluster를 기반으로 한 Cloud Native Transformation 및 AI/Data 관련 플랫폼 서비스 구축 등을 담당하고 있다. Kubernetes, DevOps, SRE, MLOps, Auto-ML, 클라우드 보안 등에 관심이 많으며 PaaS, SaaS, OSS, Cloud Native 서비스 기반에서 다양한 시도를 해보는 것을 좋아한다.

Table of Contents
Chapter 1. 시작하기: 데이터 분석 __소개 및 전제 __신용카드 데이터세트 __데이터세트 적재 __정상 데이터 및 부정 데이터 __플로팅 __요약 Chapter 2. 모델 구축 __소개 __scikit-learn __데이터 프로세싱 __모델 학습 __모델 평가 __모델 검증 __PySpark __데이터 처리 __모델 학습 __모델 평가 __요약 Chapter 3. MLOps는 무엇인가? __소개 __MLOps 구축 __수동 구현 __지속적인 모델 전달 __파이프라인의 지속적인 통합/지속적인 전달 __구축에 대한 회고 __파이프라인 및 자동화 __파이프라인 진행 여정 __모델 선택 __데이터 전처리 __학습 프로세스 __모델 평가 __모델 검증 __모델 요약 __MLOps 구현 방법 __요약 Chapter 4. MLFlow 소개 __소개 __사이킷런(Scikit-Learn)을 활용한 MLFlow __데이터 처리 __MLFlow를 통한 학습 및 평가 __MLFlow 실행 로깅 및 확인 __로깅된 모델 적재 __MLFlow를 사용한 모델 검증(파라미터 튜닝) __파라미터 튜닝 - Guided Search __MLFlow 및 기타 프레임워크 TensorFlow 2.0을 사용한 MLFlow(Keras) __데이터 처리 __MLFlow 실행 - 학습 및 평가 __MLFlow 모델 적재 __PyTorch를 사용한 MLFlow __데이터 처리 __MLFlow 실행 - 학습 및 평가 __MLFlow UI - 실행 체크 __MLFlow 모델 적재 __PySpark 을 사용하는 MLFlow __데이터 처리 __MLFlow 실행 - 학습, UI 및 MLFlow 모델 적재 __로컬 모델 서빙 모델 배포 __모델 쿼리 __스케일링 없는 쿼리 __스케일링을 사용한 쿼리 __배치 쿼리 __요약 Chapter 5. AWS에 배포 __소개 __AWS 구성 __AWS SageMaker에 모델 배포 __예측하기 __모델 전환 __배포된 모델 제거 __요약 Chapter 6. Azure에 배포 __소개 __Azure 구성 __Azure에 배포(개발 단계) __예측하기 __운영 환경에 배포 __예측하기 __자원 정리하기 __요약 Chapter 7. Google에 배포 __소개 __Google 구성 __버킷 스토리지 __가상 머신 구성 __방화벽 구성 __모델 배포 및 쿼리 __배포 업데이트 및 제거 __자원 정리하기 __요약 Appendix. Databricks __소개 __Databricks에서 실험 실행 __Azure에 배포 __워크스페이스에 연결 __모델 쿼리 __MLFlow 모델 레지스트리 __요약