HOME > Detail View

Detail View

MLFlow를 활용한 MLOps : AWS, Azure, GCP에서 MLOps 시작하기 (Loan 2 times)

Material type
단행본
Personal Author
Alla, Sridhar Adari, Suman Kalyan, 저 정이현, 역
Title Statement
MLFlow를 활용한 MLOps : AWS, Azure, GCP에서 MLOps 시작하기 / 스리다르 알라, 수만 칼리안 아다리 지음 ; 정이현 옮김
Publication, Distribution, etc
서울 :   에이콘출판,   2022  
Physical Medium
301 p. : 삽화 ; 24 cm
Series Statement
에이콘 데이터 과학 시리즈
Varied Title
Beginning MLOps with MLFlow : deploy models in AWS SageMaker, Google Cloud, and Microsoft Azure
ISBN
9791161756134
General Note
부록: Databricks  
색인수록  
Subject Added Entry-Topical Term
Machine learning Computer software Cloud computing
000 00000cam c2200205 c 4500
001 000046110639
005 20220405134715
007 ta
008 220322s2022 ulka 001c kor
020 ▼a 9791161756134 ▼g 93000
035 ▼a (KERIS)BIB000016115474
040 ▼a 211046 ▼c 211046 ▼d 211009
041 1 ▼a kor ▼h eng
082 0 4 ▼a 006.31 ▼2 23
085 ▼a 006.31 ▼2 DDCK
090 ▼a 006.31 ▼b 2022z5
100 1 ▼a Alla, Sridhar
245 1 0 ▼a MLFlow를 활용한 MLOps : ▼b AWS, Azure, GCP에서 MLOps 시작하기 / ▼d 스리다르 알라, ▼e 수만 칼리안 아다리 지음 ; ▼e 정이현 옮김
246 1 9 ▼a Beginning MLOps with MLFlow : ▼b deploy models in AWS SageMaker, Google Cloud, and Microsoft Azure
260 ▼a 서울 : ▼b 에이콘출판, ▼c 2022
300 ▼a 301 p. : ▼b 삽화 ; ▼c 24 cm
490 1 0 ▼a 에이콘 데이터 과학 시리즈
500 ▼a 부록: Databricks
500 ▼a 색인수록
650 0 ▼a Machine learning
650 0 ▼a Computer software
650 0 ▼a Cloud computing
700 1 ▼a Adari, Suman Kalyan, ▼e
700 1 ▼a 정이현, ▼e
830 0 ▼a 에이콘 데이터 과학 시리즈
900 1 0 ▼a 알라, 스리다르, ▼e
900 1 0 ▼a 아다리, 수만 칼리안, ▼e
945 ▼a ITMT

Holdings Information

No. Location Call Number Accession No. Availability Due Date Make a Reservation Service
No. 1 Location Science & Engineering Library/Sci-Info(Stacks1)/ Call Number 006.31 2022z5 Accession No. 121259378 Availability In loan Due Date 2022-10-01 Make a Reservation Available for Reserve R Service M

Contents information

Book Introduction

머신러닝 솔루션 구축을 위한 프로세스는 1.문제의 식별, 2.데이터 수집, 3.데이터 분석, 4.피처 엔지니어링 및 데이터 정규화, 5.모델 구축, 6.학습, 평가 및 검증, 7.예측 등의 과정이다. MLOps는 데브옵스(DevOps)에서 채택돼 머신러닝에 적용되는 원칙 및 관행으로, 파이프라인의 지속적인 통합과 전달을 보장해 전체 자동화 설정을 완료한다.

MLFlow는 기존 코드 베이스에 MLOps 원칙을 통합해 널리 사용되는 다양한 프레임워크를 지원하는 API이다. MLFlow를 사용해서 지표, 파라미터, 그래프 및 모델 자체를 로깅한다. 또한 기록된 모델을 적재하고, 기능을 활용할 수 있다.

프레임워크는 scikit-learn, TensorFlow 2.0/ Keras, PyTorch 및 PySpark의 실험에 MLFlow를 적용하는 방법과 이러한 모델 중 하나를 로컬에 배포하고 모델을 사용해 예측하는 방법을 실행해 본다. 해당 모델을 AWS, Azure, GCP에 배포하고 구성해서 서빙되는 구체적인 방법을 다룬다.

◈ 이 책에서 다루는 내용 ◈

◆ 기본 데이터 분석 수행 및 scikit-learn 및 PySpark 모델 구축
◆ 모델 학습, 테스트 및 검증(하이퍼파라미터 튜닝)
◆ MLOps의 정의와 이상적인 MLOps 구축
◆ 기존 또는 향후 프로젝트에 MLFlow를 쉽게 통합
◆ 클라우드에 모델을 배포하고 예측 수행

◈ 이 책의 대상 독자 ◈

이 책은 머신러닝 초보자부터 고급 머신러닝 엔지니어, 실험의 더 나은 구성법을 배우고자 하는 머신러닝 연구원까지 머신러닝에 관심 있는 모든 독자를 대상으로 한다.

◈ 이 책의 구성 ◈

1, 2장은 신용카드 데이터셋에 기반한 이상 검출기 모델에 MLOps 원리를 통합하는 방법을 다룬다.
3장에서는 MLOps가 무엇인지, 작동 방식 및 어떻게 유용할 수 있는지에 관한 이유에 대해 소개한다.
4장에서는 기존 프로젝트에서 MLFlow를 구현하고 활용해 몇 줄의 코드만으로 MLOps의 이점을 누릴 수 있는 방법에 대해 자세히 설명한다.
5장, 6장, 7장에서는 모델을 운영해 AWS, Microsoft Azure 및 Google Cloud에 각각 구축할 수 있는 방법을 다룬다.
7장에서는 가상 머신에서 모델을 호스팅하고 외부 소스에서 서버에 연결해 예측을 수행하는 방법을 설명한다. 따라서 설명서에 설명된 MLFlow 기능이 오래되면 언제든지 이 방식을 사용해 클라우드상의 일부 클러스터에서 모델을 서비스할 수 있다.
마지막 장인 부록에서는 MLFlow를 만든 Databricks를 활용해 MLFlow 실험을 구성하고 모델을 배치하는 방법에 대해 설명한다.


Information Provided By: : Aladin

Author Introduction

스리다르 알라(지은이)

SAS 코드를 Python으로 자동 변환하는 것에 초점을 맞춘 제품 Sas2Py(www.sas2py.com)의 벤더인 Bluewhale.one의 설립자이자 CTO이다. 블루웨일(Bluewhale)은 지능적인 이메일 대화 추적부터 소매업계에 영향을 미치는 문제 등에 이르기까지 AI를 활용해 핵심 문제를 해결하는 데도 주력하고 있다. 또한 퍼블릭 클라우드와 사내 인프라 모두에서 AI기반 빅데이터 분석 실무 구축에 관한 깊은 전문 지식을 보유하고 있다. 그는 저자이자 수많은 Strata, Hadoop World, Spark Summit 및 기타 콘퍼런스에서 열정적인 발표자로 활동하고 있을 뿐만 아니라 대규모 컴퓨팅 및 분산 시스템에 대해 미국 PTO에 출원한 여러 특허를 보유하고 있다.

수만 칼리안 아다리(지은이)

컴퓨터 비전, 적대적 머신러닝, 자연어 처리(대화형 AI) 이상 탐지(anomaly detection) 등 다양한 분야에서 실용성을 발휘하는 딥러닝을 전문으로 하는 플로리다대학교 수석연구원이다. 2019년 6월 미국 오리건주 포틀랜드에서 열린 신뢰할 수 있고 안전한 머신러닝에 관한 IEEE에서 연사로 참여했다. 또한 그는 이상 탐지에 있어 딥러닝의 활용에 초점을 맞춘 책을 출간한 작가이기도 하다.

정이현(옮긴이)

IT 서비스업계에서 주로 금융 차세대 AA/SA 및 Mobile Commerce/Payment 관련 글로벌 프로젝트에서 솔루션 아키텍트 역할을 수행해오다가 2017년부터 본격적으로 클라우드 및 데이터 플랫폼 관련 업무를 수행해 현재에 이른다. AWS, Azure, GCP 등 주요 CSP 내 Managed Kubernetes Cluster를 기반으로 한 Cloud Native Transformation 및 AI/Data 관련 플랫폼 서비스 구축 등을 담당하고 있다. Kubernetes, DevOps, SRE, MLOps, Auto-ML, 클라우드 보안 등에 관심이 많으며 PaaS, SaaS, OSS, Cloud Native 서비스 기반에서 다양한 시도를 해보는 것을 좋아한다.

Information Provided By: : Aladin

Table of Contents

Chapter 1. 시작하기: 데이터 분석
__소개 및 전제
__신용카드 데이터세트
__데이터세트 적재
__정상 데이터 및 부정 데이터
__플로팅
__요약
Chapter 2. 모델 구축
__소개
__scikit-learn
__데이터 프로세싱
__모델 학습
__모델 평가
__모델 검증
__PySpark
__데이터 처리
__모델 학습
__모델 평가
__요약
Chapter 3. MLOps는 무엇인가?
__소개
__MLOps 구축
__수동 구현
__지속적인 모델 전달
__파이프라인의 지속적인 통합/지속적인 전달
__구축에 대한 회고
__파이프라인 및 자동화
__파이프라인 진행 여정
__모델 선택
__데이터 전처리
__학습 프로세스
__모델 평가
__모델 검증
__모델 요약
__MLOps 구현 방법
__요약
Chapter 4. MLFlow 소개
__소개
__사이킷런(Scikit-Learn)을 활용한 MLFlow
__데이터 처리
__MLFlow를 통한 학습 및 평가
__MLFlow 실행 로깅 및 확인
__로깅된 모델 적재
__MLFlow를 사용한 모델 검증(파라미터 튜닝)
__파라미터 튜닝 - Guided Search
__MLFlow 및 기타 프레임워크 TensorFlow 2.0을 사용한 MLFlow(Keras)
__데이터 처리
__MLFlow 실행 - 학습 및 평가
__MLFlow 모델 적재
__PyTorch를 사용한 MLFlow
__데이터 처리
__MLFlow 실행 - 학습 및 평가
__MLFlow UI - 실행 체크
__MLFlow 모델 적재
__PySpark 을 사용하는 MLFlow
__데이터 처리
__MLFlow 실행 - 학습, UI 및 MLFlow 모델 적재
__로컬 모델 서빙 모델 배포
__모델 쿼리
__스케일링 없는 쿼리
__스케일링을 사용한 쿼리
__배치 쿼리
__요약
Chapter 5. AWS에 배포
__소개
__AWS 구성
__AWS SageMaker에 모델 배포
__예측하기
__모델 전환
__배포된 모델 제거
__요약
Chapter 6. Azure에 배포
__소개
__Azure 구성
__Azure에 배포(개발 단계)
__예측하기
__운영 환경에 배포
__예측하기
__자원 정리하기
__요약
Chapter 7. Google에 배포
__소개
__Google 구성
__버킷 스토리지
__가상 머신 구성
__방화벽 구성
__모델 배포 및 쿼리
__배포 업데이트 및 제거
__자원 정리하기
__요약
Appendix. Databricks
__소개
__Databricks에서 실험 실행
__Azure에 배포
__워크스페이스에 연결
__모델 쿼리
__MLFlow 모델 레지스트리
__요약

New Arrivals Books in Related Fields

Easttom, Chuck (2021)
Glassner, Andrew S (2022)
Campbell, Matthew (2021)