000 | 00000nam c2200205 c 4500 | |
001 | 000046040857 | |
005 | 20211229160921 | |
007 | ta | |
008 | 200804s2020 ggka 001c kor | |
020 | ▼a 9791158392178 ▼g 93000 | |
040 | ▼a 211009 ▼c 211009 ▼d 211009 | |
041 | 1 | ▼a kor ▼h jpn |
082 | 0 4 | ▼a 006.312 ▼2 23 |
085 | ▼a 006.312 ▼2 DDCK | |
090 | ▼a 006.312 ▼b 2020z3 | |
100 | 1 | ▼a 下山輝昌 |
245 | 1 0 | ▼a 파이썬 데이터 분석 실무 테크닉 100 : ▼b 100가지 예제로 배우는 데이터 가공, 머신러닝, 이미지/자연어 처리의 기술 / ▼d 시모야마 테루마사, ▼e 마쯔다 유마, ▼e 미키 타카유키 지음 ; ▼e 손민규 옮김 |
246 | 1 9 | ▼a Python実践デ-タ分析100本ノック |
246 | 3 | ▼a Paison jissen deta bunseki hyappon nokku |
260 | ▼a 파주 : ▼b 위키북스, ▼c 2020 ▼g (2021 2쇄) | |
300 | ▼a xvii, 276 p. : ▼b 천연색삽화 ; ▼c 24 cm | |
440 | 0 0 | ▼a 데이터 사이언스 시리즈 = ▼x DS ; ▼v 059 |
500 | ▼a 색인수록 | |
500 | ▼a 부록: 1. 데이터 결합과 정규화, 2. 머신러닝, 3. 최적화 문제 | |
700 | 1 | ▼a 松田雄馬, ▼e 저 |
700 | 1 | ▼a 三木孝行, ▼e 저 |
700 | 1 | ▼a 손민규, ▼e 역 |
900 | 1 0 | ▼a 시모야마 테루마사, ▼e 저 |
900 | 1 0 | ▼a Shimoyama, Terumasa, ▼e 저 |
900 | 1 0 | ▼a 마쯔다 유마, ▼e 저 |
900 | 1 0 | ▼a Matsuda, Yuma, ▼e 저 |
900 | 1 0 | ▼a 미키 타카유키, ▼e 저 |
900 | 1 0 | ▼a Miki, Takayuki, ▼e 저 |
945 | ▼a KLPA |
소장정보
No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
---|---|---|---|---|---|---|---|
No. 1 | 소장처 중앙도서관/제2자료실(3층)/ | 청구기호 006.312 2020z3 | 등록번호 111831748 | 도서상태 대출중 | 반납예정일 2023-06-10 | 예약 | 서비스 |
No. 2 | 소장처 중앙도서관/제2자료실(3층)/ | 청구기호 006.312 2020z3 | 등록번호 511051713 | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
No. 3 | 소장처 과학도서관/Sci-Info(1층서고)/ | 청구기호 006.312 2020z3 | 등록번호 121254002 | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
No. 4 | 소장처 세종학술정보원/과학기술실(5층)/ | 청구기호 006.312 2020z3 | 등록번호 151351191 | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
No. 5 | 소장처 세종학술정보원/과학기술실(5층)/ | 청구기호 006.312 2020z3 | 등록번호 151351489 | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
---|---|---|---|---|---|---|---|
No. 1 | 소장처 중앙도서관/제2자료실(3층)/ | 청구기호 006.312 2020z3 | 등록번호 111831748 | 도서상태 대출중 | 반납예정일 2023-06-10 | 예약 | 서비스 |
No. 2 | 소장처 중앙도서관/제2자료실(3층)/ | 청구기호 006.312 2020z3 | 등록번호 511051713 | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
---|---|---|---|---|---|---|---|
No. 1 | 소장처 과학도서관/Sci-Info(1층서고)/ | 청구기호 006.312 2020z3 | 등록번호 121254002 | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
---|---|---|---|---|---|---|---|
No. 1 | 소장처 세종학술정보원/과학기술실(5층)/ | 청구기호 006.312 2020z3 | 등록번호 151351191 | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
No. 2 | 소장처 세종학술정보원/과학기술실(5층)/ | 청구기호 006.312 2020z3 | 등록번호 151351489 | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
컨텐츠정보
책소개
실제 비즈니스 현장에서 마주칠 수 있는 100개의 예제를 풀면서 현장 분위기를 몸에 익히고 현장에 맞게 기술을 응용하는 힘을 기를 수 있게 설계한 문제집이다. 이 책에 실린 100개의 테크닉을 익힌다고 해서 바로 현장에 적용할 수 있는 것은 아니지만, 현장 감각을 몸에 익힘으로써 비즈니스 현장에 자연스럽게 투입되기 위한 힘을 기를 수 있다.
《파이썬 데이터 분석 실무 테크닉 100》은 실제 비즈니스 현장에서 마주칠 수 있는 100개의 예제를 풀면서 현장 분위기를 몸에 익히고 현장에 맞게 기술을 응용하는 힘을 기를 수 있게 설계한 문제집입니다.
이 책에 실린 100개의 테크닉을 익힌다고 해서 바로 현장에 적용할 수 있는 것은 아니지만, 현장 감각을 몸에 익힘으로써 비즈니스 현장에 자연스럽게 투입되기 위한 힘을 기를 수 있습니다. 인터넷이나 입문서로 데이터 분석과 머신러닝을 배우고 나서 '붓꽃 분류보다 도움이 되는 데이터 분석을 하고 싶다', '비즈니스 현장에서 이런 기술이 어떻게 응용되는지 알고 싶다'라고 생각하는 사람에게는 이 책이 분명 도움이 될 것입니다.
이 책은 4부로 기초부터 실전까지 폭넓게 구성되어 있습니다.
◎ 1부(기초 편)에서는 비즈니스 현장의 데이터를 분석하기 위해 필요한 데이터 가공 방법을 배웁니다. 비교적 '깨끗한' 인터넷 상품 주문 데이터와 읽어 들이기조차 어려운 '지저분한' 데이터가 많은 대리점 데이터를 예제로 데이터 가공을 실습합니다.
◎ 2부(실전 편1)에서는 머신러닝 기술을 활용해서 고객 분석을 위해 필요한 노하우를 배우고 실제 데이터를 사용해 문제를 발견하고 해결합니다.
◎ 3부(실전 편2)에서는 최적화 기술을 적용하는 노하우를 배우고 경영 상황 개선을 실습해 봅니다.
◎ 4부(발전 편)에서는 AI라고 부르는 이미지 인식 기술과 자연어 처리 기술을 사용해 데이터화되지 않은 정보를 이용해 고객의 잠재적인 수요 파악과 같이 비즈니스 현장에서 활용할 수 있는 노하우를 배우고 실습합니다.
정보제공 :

저자소개
시모야마 데루마사(지은이)
일본전기주식회사(NEC)의 중앙연구소 하드웨어 연구 개발 부문에서 근무하였으며, 2017년에 아이큐베이터를 공동 창업하였다. 인공지능, 사물인터넷, 정보 디자인 부문에서 새로운 방향성과 가능성을 연구하며 비즈니스화를 진행하고 있으며, 머신러닝을 활용한 데이터 분석이나 대시보드 설계 등으로 업무 분야를 넓히면서 데이터 분석 컨설턴트로도 활동한다. 공저로 《파이썬 데이터 분석 실무 테크닉 100》(위키북스), 《Tableauデータ分析: 実践から活用まで(Tableau 데이터 분석: 실전에서 활용까지)》(슈와시스템)가 있다.
마쯔다 유마(지은이)
박사(공학). 교토대학대학원에서 신경망 기초연구 후 일본전기회사(NEC) 중앙연구소에 입사. 확률론을 이용한 무선통신 신호처리 최적화 연구, 차세대 두뇌형 컴퓨터 프로젝트, 이미지 인식을 중심으로 한 항공우주 방위사업을 포함한 여러 분야의 사업화 담당. 2015년 동북대학교대학원에서 박사 취득, 2017년 합동회사 아이큐베타(IQBETA LLC.) 공동 창업. 저서로 《인공지능 철학》 《인공지능은 왜 의자에 못 앉는가》가 있다.
미키 다카유키(지은이)
소프트웨어 개발 회사에서 철도, 은행 등 대규모 기간 시스템 개발을 총괄하면서 시스템/IT의 요구사항 정의, 설계, 개발, 출시까지의 모든 과정을 경험했다. 2017년에 아이큐베이터를 공동 창업하였다. 독학으로 여러 언어를 습득해 C 언어보다 더 높은 수준의 언어를 주로 다룬다. 공저로 《파이썬 데이터 분석 실무 테크닉 100》(위키북스)이 있다.
손민규(옮긴이)
소니 반도체에서 데이터 분석업무와 알고리즘 및 시스템 개발 업무와 사원 대상 통계 알고리즘 강의를 진행했으며, 현재 삼성전자에서 데이터 분석 업무를 하고 있다. 일본 큐슈대학교에서 인공지능의 한 분야인 강화학습(Reinforcement Learning) 알고리즘 개발로 박사학위를 받았으며, 관심분야는 강화학습, 인공신경망(Neural Network), 유전 알고리즘(Genetic Algorithm) 등 머신러닝(Machine Learning) 알고리즘을 활용한 시스템 개발이다. - 저서: 《데이터 분석을 떠받치는 수학(2018)》 《기초부터 시작하는 강화학습/신경망 알고리즘(2019)》 - 번역: 《가장 쉬운 딥러닝 입문 교실(2018)》 《실전! 딥러닝(2019)》 《파이썬 데이터 분석 실무 테크닉 100(2010)》 - 감수: 《정석으로 배우는 딥러닝(2017)》

목차
[1부] 기초편: 데이터 가공 ▣ 01장: 웹에서 주문 수를 분석하는 테크닉 10 001 데이터를 읽어 들이자 002 데이터를 결합(유니언)해 보자 003 매출 데이터끼리 결합(조인)해 보자 004 마스터데이터를 결합(조인)해 보자 005 필요한 데이터 칼럼을 만들자 006 데이터를 검산하자 007 각종 통계량을 파악하자 008 월별로 데이터를 집계해 보자 009 월별, 상품별로 데이터를 집계해 보자 010 상품별 매출 추이를 가시화해 보자 ▣ 02장: 대리점 데이터를 가공하는 테크닉 10 011 데이터를 읽어 들이자 012 데이터의 오류를 살펴보자 013 데이터에 오류가 있는 상태로 집계해 보자 014 상품명 오류를 수정하자 015 금액의 결측치를 수정하자 016 고객 이름의 오류를 수정하자 017 날짜 오류를 수정하자 018 고객 이름을 키로 두 개의 데이터를 결합(조인)하자 019 정제한 데이터를 덤프하자 020 데이터를 집계하자 [2부] 실전편①: 머신러닝 ▣ 03장: 고객의 전체 모습을 파악하는 테크닉 10 021 데이터를 읽어 들이고 확인하자 022 고객 데이터를 가공하자 023 고객 데이터를 집계하자 024 최신 고객 데이터를 집계하자 025 이용 이력 데이터를 집계하자 026 이용 이력 데이터로부터 정기 이용 플래그를 작성하자 027 고객 데이터와 이용 이력 데이터를 결합하자 028 회원 기간을 계산하자 029 고객 행동의 각종 통계량을 파악하자 030 탈퇴 회원과 지속 회원의 차이를 파악하자 ▣ 04장: 고객의 행동을 예측하는 테크닉 10 031 데이터를 읽어 들이고 확인하자 032 클러스터링으로 회원을 그룹화하자 033 클러스터링 결과를 분석하자 034 클러스터링 결과를 가시화하자 035 클러스터링 결과를 바탕으로 탈퇴 회원의 경향을 파악하자 036 다음 달의 이용 횟수 예측을 위해 데이터를 준비하자 037 특징이 되는 변수를 추가하자 038 다음 달 이용 횟수를 예측하는 모델을 구축하자 039 모델에 기여하는 변수를 확인하자 040 다음 달의 이용 횟수를 예측하자 ▣ 05장: 회원 탈퇴를 예측하는 테크닉 10 041 데이터를 읽어 들이고 이용 데이터를 수정하자 042 탈퇴 전월의 탈퇴 고객 데이터를 작성하자 043 지속 회원의 데이터를 작성하자 044 예측할 달의 재적 기간을 작성하자 045 결측치를 제거하자 046 문자열 변수를 처리할 수 있게 가공하자 047 의사결정 트리를 사용해서 탈퇴 예측 모델을 구축하자 048 예측 모델을 평가하고 모델을 튜닝해 보자 049 모델에 기여하는 변수를 확인하자 050 회원 탈퇴를 예측하자 [3부] 실전편②: 최적화 문제 ▣ 06장: 물류의 최적경로를 컨설팅하는 테크닉 10 051 물류 데이터를 불러오자 052 현재 운송량과 비용을 확인해 보자 053 네트워크를 가시화해 보자 054 네트워크에 노드를 추가해 보자 055 경로에 가중치를 부여하자 056 운송 경로 정보를 불러오자 057 운송 경로 정보로 네트워크를 가시화해 보자 058 운송 비용 함수를 작성하자 059 제약 조건을 만들어보자 060 운송 경로를 변경해서 운송 비용 함수의 변화를 확인하자 ▣ 07장: 물류 네트워크 최적 설계를 위한 테크닉 10 061 운송 최적화 문제를 풀어보자 062 최적 운송 경로를 네트워크로 확인하자 063 최적 운송 경로가 제약 조건을 만족하는지 확인하자 064 생산 계획 데이터를 불러오자 065 이익을 계산하는 함수를 만들자 066 생산 최적화 문제를 풀어보자 067 최적 생산 계획이 제약 조건을 만족하는지 확인하자 068 물류 네트워크 설계 문제를 풀어보자 069 최적 네트워크의 운송 비용과 그 내역을 계산하자 070 최적 네트워크의 생산 비용과 그 내역을 계산하자 ▣ 08장: 수치 시뮬레이션으로 소비자의 행동을 예측하는 테크닉 10 071 인간관계 네트워크를 가시화해 보자 072 입소문에 의한 정보 전파 모습을 가시화해 보자 073 입소문 수의 시계열 변화를 그래프화해 보자 074 회원 수의 시계열 변화를 시뮬레이션해 보자 075 파라미터 전체를 ‘상관관계’를 보면서 파악해 보자 076 실제 데이터를 불러와보자 077 링크 수의 분포를 가시화해 보자 078 시뮬레이션을 위해 실제 데이터로부터 파라미터를 추정하자 079 실제 데이터와 시뮬레이션을 비교하자 080 시뮬레이션으로 미래를 예측해 보자 [4부] 발전편: 이미지 처리 / 언어 처리 ▣ 09장: 잠재고객을 파악하기 위한 이미지 인식 테크닉 10 081 이미지 데이터를 불러오자 082 동영상 데이터를 불러오자 083 동영상을 이미지로 나누고 저장하자 084 이미지 속에 사람이 어디에 있는지 검출해 보자 085 이미지 속 사람 얼굴을 검출해 보자 086 이미지 속 사람의 얼굴이 어느 쪽을 보고 있는지 검출해 보자 087 검출한 정보를 종합해서 타임랩스를 만들어보자 088 전체 모습을 그래프로 가시화해 보자 089 거리의 변화를 그래프로 확인해 보자 090 이동 평균을 계산해서 노이즈를 제거하자 ▣ 10장: 앙케트 분석을 위한 자연어 처리 테크닉 10 091 데이터를 불러서 파악해 보자 092 불필요한 문자를 제거하자 093 문자 수를 세어 히스토그램으로 표시해 보자 094 형태소 분석으로 문장을 분해해 보자 095 형태소 분석으로 문장에서 ‘동사’, ‘명사’를 추출해 보자 096 형태소 분석으로 자주 나오는 명사를 확인해 보자 097 관계없는 단어를 제거해 보자 098 고객만족도와 자주 나오는 단어의 관계를 살펴보자 099 의견을 특징으로 표현해 보자 100 비슷한 설문지를 찾아보자 ▣ 부록 001 데이터 결합과 정규화 002 머신러닝 003 최적화 문제 ▣ 맺음말