HOME > 상세정보

상세정보

파이썬과 OpenCV를 이용한 컴퓨터 비전 학습 : 컴퓨터 비전 애플리케이션을 만들기 위한 강력한 OpenCV 3와 파이썬 활용하기

파이썬과 OpenCV를 이용한 컴퓨터 비전 학습 : 컴퓨터 비전 애플리케이션을 만들기 위한 강력한 OpenCV 3와 파이썬 활용하기

자료유형
단행본
개인저자
Spizhevoy, Alexey Rybnikov, Aleksandr, 저
단체저자명
테크 트랜스 그룹 T4, 역
서명 / 저자사항
파이썬과 OpenCV를 이용한 컴퓨터 비전 학습 : 컴퓨터 비전 애플리케이션을 만들기 위한 강력한 OpenCV 3와 파이썬 활용하기 / 알렉세이 스피쉐보이, 알렉산드르 류브니코프 지음 ; 테크 트랜스 그룹 T4 옮김
발행사항
서울 : 에이콘, 2019
형태사항
414 p. : 삽화 ; 24 cm
총서사항
Acorn+PACKT technical book
원표제
OpenCV 3 computer vision with Python cookbook : leverage the power of OpenCV 3 and Python to build computer vision applications
ISBN
9791161752396 9788960772106 (세트)
일반주기
색인수록
000 00000cam c2200205 c 4500
001 000045973496
005 20190410143755
007 ta
008 190228s2019 ulka 001c kor
020 ▼a 9791161752396 ▼g 94000
020 1 ▼a 9788960772106 (세트)
035 ▼a (KERIS)BIB000014983837
040 ▼a 248019 ▼c 248019 ▼d 248019 ▼d 211009
041 1 ▼a kor ▼h eng
082 0 4 ▼a 005.133 ▼2 23
085 ▼a 005.133 ▼2 DDCK
090 ▼a 005.133 ▼b P999 2019z5
100 1 ▼a Spizhevoy, Alexey
245 1 0 ▼a 파이썬과 OpenCV를 이용한 컴퓨터 비전 학습 : ▼b 컴퓨터 비전 애플리케이션을 만들기 위한 강력한 OpenCV 3와 파이썬 활용하기 / ▼d 알렉세이 스피쉐보이, ▼e 알렉산드르 류브니코프 지음 ; ▼e 테크 트랜스 그룹 T4 옮김
246 1 9 ▼a OpenCV 3 computer vision with Python cookbook : ▼b leverage the power of OpenCV 3 and Python to build computer vision applications
260 ▼a 서울 : ▼b 에이콘, ▼c 2019
300 ▼a 414 p. : ▼b 삽화 ; ▼c 24 cm
440 0 0 ▼a Acorn+PACKT technical book
500 ▼a 색인수록
546 ▼a 영어로 된 원저작을 한국어로 번역
700 1 ▼a Rybnikov, Aleksandr, ▼e
710 ▼a 테크 트랜스 그룹 T4, ▼e
900 1 0 ▼a 스피쉐보이, 알렉세이, ▼e
900 1 0 ▼a 류브니코프, 알렉산드르, ▼e

소장정보

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 세종학술정보원/과학기술실/ 청구기호 005.133 P999 2019z5 등록번호 151344964 도서상태 대출중 반납예정일 2021-02-15 예약 예약가능 R 서비스

컨텐츠정보

책소개

OpenCV 3는 컴퓨터 비전, 머신 러닝, 이미지 처리를 위한 기본적인 크로스 플랫폼 라이브러리다. 이 책에서 보여주는 다양한 방법으로 현재 막혀 있는 컴퓨터 비전 문제를 해결할 수 있을 것이며, 관련 애플리케이션의 성능을 향상시킬 수 있다.

픽셀 단위의 조작을 통한 이미지 처리 방법과 히스토그램을 사용해 이미지를 분석하는 방법을 배울 수 있다. 그리고 이미지 콘텐츠를 더 향상시키기 위해서 이미지 필터를 어떻게 사용해야 하는지, 촬영된 장면의 다른 뷰들을 연결 처리하기 위해서 이미지 기하학을 어떻게 사용할 것인지를 보여준다.

또한 카메라 보정과 멀티 뷰 분석을 위한 기법도 제공한다. 객체 검출과 인식과 같은 애플리케이션에서 활용할 수 있는 저수준 픽셀 정보를 고수준 개념으로 전환해주는 방법을 배울 수 있다. 파일이나 카메라에 있는 동영상을 처리하는 방법, 움직이는 객체를 검출하고 추적하는 방법에 대해서도 다룬다. 끝으로 딥러닝, 객체 분류 및 뉴럴 네트워크와 같은 최신 주제에 대해서도 살펴볼 수 있다.

★ 이 책에서 다루는 내용 ★

■ 저수준 이미지 처리 방법
■ 컴퓨터 비전에서 필요한 일반적인 선형 대수 도구
■ 다양한 카메라 모델과 에피폴라 기하학
■ 이미지 내에 있는 관심 점을 검출하는 방법과 각 방법의 비교
■ 이미지 이진화와 관심 영역의 마스크 처리
■ 동영상에서의 객체 검출과 추적

★ 이 책의 대상 독자 ★

파이썬에 관한 기본 지식이 있는 개발자를 위한 책이다. OpenCV에 대해 어느 정도 알고 있는 상태에서 다른 개발자보다 성능이 좋고 빠르며, 복잡하지만 더 실용적인 컴퓨터 비전 시스템을 만들고자 한다면 이 책을 추천한다.

★ 이 책의 구성 ★

1장, '입출력과 GUI'에서는 이미지와 동영상의 기본 동작(불러오기, 저장하기, 표시하기)을 알아본다.
2장, '행렬, 색상, 필터'에서는 행렬을 처리하는 동작을 알아본다. 이미지, 채널, 픽셀에 대한 영역을 처리하는 방법도 보여준다. 또한 많은 색상 공간 사이의 전환과 필터 사용법도 다룬다.
3장, '윤곽선과 분할'에서는 이미지 마스크를 만드는 방법, 윤곽선을 찾는 방법, 이미지를 분할하는 방법을 알아본다.
4장, '객체 검출과 머신 러닝'에서는 특별한 용도로 만들어진 객체(QR 코드와 ArUCo 마커)부터 일상에서 볼 수 있는 객체까지 여러 가지 형태의 객체를 검출하고 추적하는 방법을 알아본다.
5장, '딥러닝'에서는 심층 신경망을 사용하는 OpenCV 내의 새로운 기능을 알아본다. 딥러닝 모델을 사용하고, 그 모델을 컴퓨터 비전 태스크에서 사용하는 예제를 살펴볼 수 있다.
6장, '선형 대수'에서는 선형 대수 문제를 풀기 위한 유용한 수학적 방법을 자세히 살펴본다. 이러한 수학적 방법을 컴퓨터 비전에 적용하는 예제도 볼 수 있다.
7장, '검출기와 기술자'에서는 이미지 특징 기술자를 어떻게 사용하는지 알아본다. 여러 가지 방법들로 특징 기술자를 연산하고, 표시하며, 객체 검출과 추적을 위해 어떻게 매칭시킬 것인지를 살펴볼 수 있다.
8장, '이미지 및 동영상 처리'에서는 여러 장의 이미지들을 어떻게 사용하는지와 각 시퀀스 간의 상관관계에 기반해 어떻게 결과를 얻는지 알아본다.
9장, '다중 뷰 기하학'에서는 장면 내의 3D 기하학적 정보를 얻기 위해 카메라를 어떻게 사용할지 알아본다.


정보제공 : Aladin

저자소개

알렉세이 스피쉐보이(지은이)

컴퓨터 비전 분야에서 7년의 R&D 경력이 있다. 주요 OpenCV 컨트리뷰터인 잇시즈(Itseez)에서 인텔에 인수되기 전 5년간 근무했다. OpenCV 라이브러리의 동영상 흔들림 방지와 포토 스티칭 모듈에 기여했고 3D 복원, 비디오 콘퍼런스, 객체 검출과 추적, 의미론적 분할, 운전 보조 등의 많은 분야에 사용되는 다양한 OpenCV 프로젝트에 참여했다. 컴퓨터 과학으로 석사 학위를 받았고, 현재 박사 과정에 있다.

알렉산드르 류브니코프(지은이)

C++ 프로그래밍에 5년 이상의 경력이 있고 컴퓨터 비전 분야에서는 3년의 경력이 있다. OpenCV의 개발과 지원을 했던 잇시즈에서 근무했고, 그 후에는 인텔에서 근무했다. 기존 기능을 더욱더 좋게 개선시켰고, 추가적인 2개의 딥러닝 프레임워크와 많은 기능들을 추가해 OpenCV의 dnn 모듈을 향상시켰다. 엔지니어로서 붓꽃 인식, 객체 검출, 의미론적 분할, 6 DOF 자세 추정 및 디지털 홀로그램 같은 CV와 DL 프로젝트에 참가했다. 물리학 석사 학위가 있다.

테크 트랜스 그룹 T4(옮긴이)

최신 IT 테크놀로지에 대한 리서치를 목적으로 하는 스터디 그룹이다. 엔터프라이즈 환경에서 오픈소스를 활용해 프레임워크를 구축하는 데 관심이 많으며, 스프링Spring, React.js, Node.js, OpenCV, ML 등의 기술에 주목하고 있다. 오픈소스 기반의 플랫폼 개발 및 활용도 주요 관심 분야다. 에이콘출판사에서 펴낸 『구글 애널리틱스로 하는 데이터 분석 3/e』(2017), 『추천 엔진을 구축하기 위한 기본서』(2017) 등을 번역했다.

정보제공 : Aladin

목차

1장. 입출력과 GUI
__소개
__파일에서 이미지 읽어오기
__간단한 이미지 변환: 크기 조절 및 뒤집기
__손실 및 무손실 압축을 사용한 이미지 저장
__OpenCV 창에 이미지 표시
__OpenCV 창에서 버튼 및 탐색바와 같은 UI 요소로 작업
__2D 프리미티브 그리기: 마커, 선, 타원, 사각형 및 텍스트
__사용자의 키보드 입력 처리
__사용자의 마우스 입력을 처리해 앱을 대화형으로 만들기
__카메라 프레임 캡처 및 표시
__비디오 프레임 스트림 재생
__프레임 스트림 프로퍼티 얻기
__프레임 스트림을 비디오로 저장
__비디오 파일의 프레임 간 이동


2장. 행렬, 색상, 필터
__소개
__행렬 조작: 생성하기, 채우기, 요소 접근하기, ROI
__데이터 타입과 스케일 변환
__NumPy를 사용한 비이미지 데이터 영속성
__이미지 채널 조작
__이미지의 색 공간 변환
__감마 보정과 요소 단위의 수학
__평균/분산 이미지 정규화
__이미지 히스토그램 계산
__이미지 히스토그램 평활화
__가우시안 필터, 중앙값 필터, 양방향 필터를 사용한 노이즈 제거
__소벨 필터로 이미지 경사도 계산
__자체 필터 생성과 적용
__실수 값으로 된 가버(Garbor) 필터로 이미지 처리
__이산 푸리에 변환을 사용한 공간 도메인과 주파수 도메인 간 변환
__이미지 필터링을 위한 이미지 주파수 조작
__다양한 이미지 임계 처리법
__형태 연산자
__이미지 마스크와 이진 연산


3장. 윤곽선과 분할
__소개
__Otsu 알고리즘을 사용한 그레이스케일 이미지 이진화
__이진 이미지에서 외부 및 내부 윤곽선 찾기
__이진 이미지에서 연결된 구성 요소 추출
__선과 원을 2차원 점의 집합으로 맞추기
__이미지 모멘트 계산
__곡선으로 작업: 근사, 길이, 면적
__윤곽선 내부에서 점의 포함 여부 확인
__거리 맵 계산
__평균 알고리즘을 k- 이용한 이미지 분할
__분할 시드를 사용해 이미지 분할: 워터쉐드 알고리즘


4장. 객체 검출과 머신 러닝
__소개
__GrabCut 알고리즘을 사용해 객체 마스크 얻기
__Canny 알고리즘을 사용해 에지 찾기
__Hough 변환을 사용해 직선과 원 검출
__템플릿 매칭을 통한 객체 찾기
__메디안 플로우 객체 추적기
__추적 API의 다양한 알고리즘을 사용해 객체 추적
__두 프레임 사이의 밀집 옵티컬 플로우 계산
__체스판과 원 그리드 패턴 검출
__SVM 모델을 사용한 단순 보행자 검출기
__다양한 머신 러닝 모델을 사용한 광학 문자 인식
__Haar/LBP 캐스케이드를 사용해 얼굴 검출
__AR 애플리케이션을 위한 AruCo 패턴 검출
__자연 영상에서 텍스트 검출
__QR 코드 검출기


5장. 딥러닝
__소개
__이미지를 텐서/blobs로 표현
__Caffe, Torch, TensorFlow 형식의 딥러닝 모델 불러오기
__모든 레이어에 대한 입/출력 텐서 형태 가져오기
__이미지 사전 처리와 컨벌루션 네트워크로 추론
__추론 시간과 각 계층의 기여도 측정
__GoogleNet/Inception, ResNet 모델로 이미지 분류
__SSD 모델로 객체 검출
__FCN(Fully Convolution Network) 모델을 사용해 장면 분할
__SSD, ResNet 모델을 사용해 얼굴 검출
__연령 및 성별 예측


6장. 선형 대수
__소개
__직교 프로쿠르스테스 문제
__순위 제한과 행렬 근사 방법
__주성분 분석
__선형 방정식 풀기(underdetermined, overdetermined 포함)
__다항 방정식 풀기
__심플렉스 방법을 사용한 선형 프로그래밍


7장. 검출기와 기술자
__소개
__이미지의 코너 찾기: 해리스(Harris)와 FAST
__추적을 위한 이미지 내 좋은 코너 선택
__키포인트, 기술자 및 매칭 결과 나타내기
__크기 불변 키포인트의 검출
__이미지 키포인트에 대한 컴퓨팅 기술자: SURF, BRIEF, ORB
__여러 기술자 간의 대응 관계를 찾기 위한 매칭 기법
__신뢰할 수 있는 매칭 결과 찾기: 교차 검증 및 비율 테스트
__모델 기반 매칭 필터링: RANSAC
__전역 이미지 기술자 구축을 위한 BoW 모델


8장. 이미지 및 동영상 처리
__소개
__아핀과 원근감 변환을 사용해 이미지 뒤틀기
__임의 변환을 사용한 이미지 재매핑
__루카스-카나데 알고리즘을 사용해 프레임 간 키포인트 추적
__배경 제거
__많은 이미지를 파노라마 형태로 스티칭
__비지역적 평균 알고리즘을 사용해 사진 노이즈 제거
__HDR 이미지 만들기
__이미지 수리 방법을 사용해 사진 내의 결함 제거


9장. 다중 뷰 기하학
__소개
__핀홀 카메라 모델 보정
__어안 렌즈 카메라 모델 보정
__스테레오 장비 보정: 외부 추정
__왜곡 점과 비왜곡 점
__이미지에서 렌즈 변형 효과 제거
__삼각 측량을 통해 두 가지 관찰 지점으로부터 3D 점 복원
__PnP 알고리즘을 사용해 상대적 카메라 객체의 자세(포즈) 찾기
__스테레오 정류기를 통한 두 개의 뷰 정렬
__에피폴라 기하학: 컴퓨팅 기본과 필수 행렬
__회전과 이동을 위한 필수적인 행렬 분해
__스테레오 이미지의 불일치 맵 추정
__호모그래피 변환 추정을 통한 특별한 2개 뷰의 기하학 특성 살펴보기
__평면 영상: 호모그래피 분해 방법을 사용해 회전과 이동
__회전 카메라 케이스: 호모그래피 변환에서 카메라 회전 추정 사용


정보제공 : Aladin

관련분야 신착자료