HOME > 상세정보

상세정보

데이터 시각화 : processing을 이용한 데이터 탐색과 표현

데이터 시각화 : processing을 이용한 데이터 탐색과 표현 (7회 대출)

자료유형
단행본
개인저자
Fry, Ben 이정문, 역
서명 / 저자사항
데이터 시각화 : processing을 이용한 데이터 탐색과 표현 / 벤 프라이 지음 ; 이정문 옮김
발행사항
서울 :   에이콘,   2016  
형태사항
486 p. : 천연색삽화 ; 26 cm
총서사항
에이콘 데이터 과학 시리즈 = Data science series
원표제
Visualizing data
ISBN
9788960778368 9788960777316 (Set)
서지주기
참고문헌(p. 475-479)과 색인수록
일반주제명
Java (Computer program language) Web site development Web sites --Authoring programs
000 00000nam c2200205 c 4500
001 000045874119
005 20160614140622
007 ta
008 160614s2016 ulka b 001c kor
020 ▼a 9788960778368 ▼g 94000
020 1 ▼a 9788960777316 (Set)
040 ▼a 211009 ▼c 211009 ▼d 211009
041 1 ▼a kor ▼h eng
082 0 4 ▼a 001.4/226028566 ▼a 005.118 ▼2 23
085 ▼a 001.42260285 ▼2 DDCK
090 ▼a 001.42260285 ▼b 2016
100 1 ▼a Fry, Ben
245 1 0 ▼a 데이터 시각화 : ▼b processing을 이용한 데이터 탐색과 표현 / ▼d 벤 프라이 지음 ; ▼e 이정문 옮김
246 1 9 ▼a Visualizing data
260 ▼a 서울 : ▼b 에이콘, ▼c 2016
300 ▼a 486 p. : ▼b 천연색삽화 ; ▼c 26 cm
440 0 0 ▼a 에이콘 데이터 과학 시리즈 = ▼x Data science series
504 ▼a 참고문헌(p. 475-479)과 색인수록
650 0 ▼a Java (Computer program language)
650 0 ▼a Web site development
650 0 ▼a Web sites ▼x Authoring programs
700 1 ▼a 이정문, ▼e
900 1 0 ▼a 프라이, 벤, ▼e
945 ▼a KLPA

소장정보

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 001.42260285 2016 등록번호 121236952 도서상태 대출가능 반납예정일 예약 서비스 B M

컨텐츠정보

책소개

에이콘 데이터 과학 시리즈. 이 책은 프로세싱 프로그래밍 환경을 사용해 데이터 시각화를 구축하는 방법을 다룬다. 정보시각화의 프로세스와 프로세싱 소개부터 시작해서 매핑, 시계열, 상관관계 분석, 트리, 그래프 등을 시각화하는 방법을 예제와 함께 설명한다. 또한 데이터를 수집해 파싱할 때 사용할 수 있는 다양한 기법도 소개한다.

데이터 시각화 7단계: 수집, 파싱, 필터링, 마이닝, 표현, 정교화, 상호작용, 모든 데이터 문제가 질문에서 시작해 분명한 답을 제공하는 내러티브로 마무리되는 과정, 실제 코드를 사용하는 예제 프로젝트, 다양한 표현 수단들의 장단점, 그리고 데이터 집합과 가장 어울리는 표현이 되도록 커스터마이징하는 방법 등을 다루고 있다.

★ 요약 ★

이 책은 프로세싱 프로그래밍 환경을 사용해 데이터 시각화를 구축하는 방법을 다룬다. 정보시각화의 프로세스와 프로세싱 소개부터 시작해서 매핑, 시계열, 상관관계 분석, 트리, 그래프 등을 시각화하는 방법을 예제와 함께 설명한다. 또한 데이터를 수집해 파싱할 때 사용할 수 있는 다양한 기법도 소개한다.

★ 이 책에서 다루는 내용 ★

■ 데이터 시각화 7단계: 수집, 파싱, 필터링, 마이닝, 표현, 정교화, 상호작용
■ 모든 데이터 문제가 질문에서 시작해 분명한 답을 제공하는 내러티브로 마무리되는 과정
■ 실제 코드를 사용하는 예제 프로젝트
■ 다양한 표현 수단들의 장단점, 그리고 데이터 집합과 가장 어울리는 표현이 되도록 커스터마이징하는 방법

★ 이 책의 대상 독자 ★

2007년 봄, 카네기 멜론 대학교에서 정보 시각화(Information Visualization) 수업을 강의한 적이 있다. 30명의 수강생들은 미술을 전공하는 신입생부터 컴퓨터과학 박사과정 학생에 이르기까지 다양했으며, 그 중간에는 디자인 스쿨 출신의 대학원생과 다양한 학부의 학부생들이 있었다. 수강생들의 기술 수준은 매우 편차가 컸지만 기술 수준보다 훨씬 중요한 것은 호기심의 수준이었으며, 호기심 많고 적극적인 수강생은 기술적 어려움(미술이나 디자인 출신)과 미적 감각 결여(공학 전공자)를 극복할 수 있었다.

이 책의 대상 독자 역시 비슷한 범위의 배경지식을 가정하고 있다. 질문을 하고, 데이터를 가지고 놀며, 타인에게 정보를 효과적으로 전달하는 방법을 이해하고자 하는 사람을 대상으로 한다. 예를 들어, 지금 사용하는 도구보다 복잡한 시각화를 구축하고자 하는 웹 디자이너는 이 책에서 많은 도움을 얻을 수 있다. 또한 데이터를 표현하는 소프트웨어를 능숙하게 작성하고자 하는 소프트웨어 엔지니어에게도 매우 유용할 것이다. 단순히 UI를 개발해본 경험과는 다른 기술이 요구되는 일이기 때문이다. 이런 일들은 고도의 기술을 요구하지는 않지만 어디서부터 시작해야 할지 갈피를 잡기 어려울 때가 많다.

기본적으로 이 책은 데이터 집합을 갖고 있으면서 데이터를 탐구하고자 하는 호기심이 충만하고 데이터에 관해 무언가를 다른 사람에게 전달하고 싶은 사람을 대상으로 한다. 데이터를 시각화하는 사람들의 수는 갈수록 늘어나고 있으며, 기대 수준은 시각화 분야의 전문가들의 수준을 뛰어넘고 있다. 좀 더 많은 사람이 시각화 기법에 익숙해진다면 앞으로 10년간 놀랄 만한 일들이 많이 일어날 것이라고 믿는다.

★ 이 책의 구성 ★

1장, ‘데이터 시각화 7단계’에서는 데이터를 수집해서 상호작용하기까지 유용한 시각화를 개발하기 위한 과정을 다룬다. 이후의 장에서 문제를 공략하기 위해 일관되게 사용될 프레임워크라고 할 수 있다.

2장, ‘Processing 시작하기’에서는 Processing 환경과 구문의 기초적인 내용을 소개한다. API의 구조에 관한 약간의 배경지식과, Processing의 바탕이 되는 기본적인 철학을 제공한다.
3~8장에서는 점점 복잡해지는 예제 프로젝트를 다룬다.

3장, ‘매핑’에서는 데이터 포인트를 지도 위에 그려보면서 데이터를 디스크에서 읽어 화면에 표현하는 방법을 소개한다.

4장, ‘시계열’에서는 시간의 변화에 따른 데이터의 변화를 표현하는 차트를 그리는 방법을 다룬다.

5장, ‘상관관계’에서는 데이터 집합을 획득해 파싱하는 방법을 본격적으로 설명하기 시작한다. 이 장의 예제 프로젝트는 MLB.com 웹사이트에서 데이터를 읽어서 선수들의 연봉과 팀 성적 간의 상관관계를 보여주는 이미지를 생성한다. 공식적인 API가 제공되지 않는 웹사이트로부터 데이터를 긁어오는 방법을 보여주는 방법을 구체적으로 다룬다. 여기에 사용되는 기법은 야구뿐만 아니라 다양한 프로젝트에서 사용할 수 있다.

6장, ‘산포도’에서는 사용자가 우편번호를 키보드로 입력하면서 미국 지도를 개량할 수 있는 프로젝트를 개발함으로써 “우편번호와 지리적 위치는 어떤 관계가 있는가?”와 같은 질문에 답을 할 수 있는 방법을 소개한다.

7장 ‘트리, 계층, 재귀’에서는 트리와 계층구조에 관해 논의한다. 또한 트리 구조를 다룰 때 꼭 알아야 할 개념인 재귀에 대해 설명하고, 특정 종류의 트리 데이터를 효과적으로 표현할 수 있는 트리맵도 다룬다.

8장, ‘네트워크와 그래프’는 정보로 이뤄진 네트워크, 즉 그래프를 주제로 삼는다. 전반부에서는 네트워크를 구성하는 수많은 노드 간의 연결을 표현하는 방법을 논의하고, 후반부에서는 웹사이트 트래픽 데이터를 이용해 실제로 그래프를 생성함으로써 웹사이트 이용 현황을 보여주는 방법을 설명한다. 이때 Processing을 널리 쓰이는 자바 IDE인 이클립스(Eclipse)와 통합하는 방법도 소개한다.

마지막 세 장은 데이터를 획득하고 파싱하는 것과 관련된 추가적인 배경지식과 기법을 중심으로 실무에서 참고서로 사용할 만한 내용을 담고 있다.

9장, ‘데이터 수집’은 온갖 종류의 실용적인 기법을 망라하는 일종의 요리책에 해당한다. 파일로부터 데이터를 읽어들이는 방법, 웹 브라우저를 흉내 내는 방법, 데이터를 데이터베이스에 저장하는 방법 등을 설명한다.

10장, ‘데이터 파싱’ 역시 9장과 비슷한 구성으로, 데이터를 파싱하는 방법을 보여주는 예제들로 가득하다. HTML 테이블, XML, 압축 데이터, SVG 등의 다양한 형태의 데이터를 파싱하는 방법이 다뤄진다. 또한 문서화되지 않은 데이터 프로토콜의 동작 방법을 이해하기 위해 네트워크 연결을 관찰하는 방법도 소개한다.

11장, ‘Processing과 자바의 통합’에서는 Processing API를 자바와 통합하는 방법을 구체적으로 설명한다. 이 장은 Processing API를 별도의 프로젝트에서 사용하기를 원하는 고급 자바 프로그래머를 대상으로 하는, 부록에 가까운 장이라고 할 수 있다.


정보제공 : Aladin

저자소개

벤 프라이(지은이)

MIT 미디어랩에서 박사 학위를 받았으며, 여기서 정보를 이해하기 위한 수단으로 컴퓨터 과학, 그래픽 디자인, 통계학, 데이터 시각화 등의 분야를 혼합하는 것에 대한 연구에 집중했다. 또 MIT와 하버드의 연구소에서 데이터 시각화를 위한 툴을 개발하기도 했다. 현재는 보스턴 소재의 디자인, 소프트웨어 컨설팅 회사 Fathom의 대표로 재직 중이다. 나이키, 구글, 스탠포드대학교 등과 함께 작업을 해왔다. 휘트니, 쿠퍼 휴잇, 그리고 MoMA 등 세계적인 미술관들에 그의 작품이 전시되었으며, 뉴욕타임스를 비롯한 유수의 언론에 그의 정보 그래픽 작품이 기사로 다루어지기도 했다. 그는 내셔널 디자인 어워드의 인터랙션 부문에서 수상한 디자이너이며 전 세계에서 데이터, 디자인, 프로그래밍에 대한 강의를 해왔다. 프로그래밍에 관한 3권의 저서가 있다.

이정문(옮긴이)

컴퓨터공학을 전공했으며 다수의 원서를 번역했다. 번역서로는 『안드로이드 앱 마케팅』(2011), 『데이터 과학으로 접근하는 정보보안』(2016), 『양자 컴퓨터 프로그래밍』(2019), 『양자 컴퓨터 원리와 수학적 기초』(2020) 등이 있다.

정보제공 : Aladin

목차

1장. 데이터 시각화 7단계 
__데이터를 표시할 때 사전 계획이 필요한 이유 
__예제 
__반복과 결합 
__원칙 
__정리 

2장. Processing 시작하기 
__Processing으로 스케치 그리기 
__작업 결과 익스포트와 배포 
__예제 프로그램과 도움말 
__주요 함수 
__스케치와 스크립트 
__정리 

3장. 매핑 
__지도 그리기 
__지도 위 위치 
__지도 위 데이터 
__독자적인 데이터 사용 
__정리 

4장. 시계열 
__우유와 홍차와 커피(데이터 수집, 파싱) 
__테이블 정리(필터링, 마이닝) 
__간단한 화면 표시(표현, 정교화) 
__현재의 데이터 집합에 레이블 달기(정교화, 상호작용) 
__축에 레이블 달기(정교화) 
__적절한 표현 선택하기(표현, 정교화) 
__롤오버를 사용해 데이터 포인트 강조하기(상호작용) 
__점을 연결하는 방법(정교화) 
__탭 구분 텍스트 레이블(상호작용) 
__데이터 집합 간의 보간(상호작용) 
__정리 

5장. 상관관계 
__데이터 소스의 변경 
__예제 프로젝트 개요 
__전처리 
__전처리를 끝낸 데이터의 사용(데이터 수집, 파싱, 필터링, 마이닝) 
__결과 표시(표현) 
__문제로 돌아가기(정교화) 
__고급 정렬: 똑같은 성적을 낸 팀 간의 순위 결정을 위해 연봉 이용하기(마이닝) 
__2 이상의 날짜로 이동하기(상호작용) 
__자연스러운 상호작용 구현(정교화) 
__배포 시의 고려사항(데이터 수집, 파싱, 마이닝) 

6장. 산포도 
__전처리 
__데이터 로드(데이터 수집, 파싱) 
__우편번호가 가리키는 위치를 점으로 표현하기(마이닝, 표현) 
__키 입력을 받으면서 강조 표시하기(정교화, 상호작용) 
__현재 선택된 점을 나타내는 방법(정교화) 
__점진적으로 밝기를 변경(정교화) 
__줌인 기능(상호작용) 
__화면 확대 시 표시 방법 변경(정교화) 
__애플리케이션 배포와 관련된 이슈(데이터 수집, 정교화) 
__정리와 개선 

7장. 트리, 계층, 재귀 
__재귀를 사용한 디렉토리의 트리 구조 구축 
__큐를 사용한 비동기 로드(상호작용) 
__트리맵 소개 
__자리를 가장 많이 차지하고 있는 파일은? 
__폴더의 내용 보기(상호작용) 
__트리맵 표시 개선(정교화) 
__파일 내비게이트(상호작용) 
__정리 

8장. 네트워크와 그래프 
__간단한 그래프 예제 
__복잡한 그래프 
__네트워크의 표현 방법 
__고급 그래프 예제 
__추가적인 정보 마이닝 

9장. 데이터 수집 
__어디서 데이터를 찾을까 
__인터넷에서 데이터를 수집하기 위한 도구 
__Processing에서 사용하는 파일의 위치 
__텍스트 데이터 로드 
__파일과 폴더 처리 
__폴더 내의 파일 열거하기 
__비동기식 이미지 다운로드 
__자바와의 연결고리로서 openStream() 사용하기 
__바이트 배열 처리 
__고급 웹 기법 
__데이터베이스 사용 
__다수의 파일 처리 

10장. 데이터 파싱 
__노력의 수준 
__단서를 모으기 위한 도구 
__텍스트가 최고! 
__마크업 언어 
__정규표현 
__문법과 BNF 표기법 
__압축 데이터 
__벡터와 좌표정보 
__이진 데이터 형식 
__고급 탐색 작업 

11장. Processing과 자바의 통합 
__프로그래밍 모드 
__추가 소스 파일(탭) 
__전처리기 
__API의 구조 
__자바 애플리케이션에 PApplet 포함시키기 
__Processing 스케치에서의 자바 코드 사용 
__라이브러리 사용 
__processing.core 소스코드 조사 

참고문헌 
찾아보기

관련분야 신착자료

Gibbs, Graham (2022)
권보드래 (2022)
김철규 (2022)