000 | 00000nam c2200205 k 4500 | |
001 | 000045216842 | |
005 | 20230711104817 | |
007 | ta | |
008 | 050630s2005 ulka bmAC 000a kor | |
040 | ▼a 211009 ▼c 211009 ▼d 211009 | |
041 | 0 | ▼a kor ▼b eng |
085 | ▼a 0510 ▼2 KDCP | |
090 | ▼a 0510 ▼b 6D36 ▼c 108 | |
100 | 1 | ▼a 지수영 ▼g 池秀榮 |
245 | 1 0 | ▼a 베지어 곡면과 선택적 문서영역 이진화 기법을 이용한 카메라 문서영상 해석 / ▼d 池秀榮. |
260 | ▼a 서울 : ▼b 고려대학교 대학원, ▼c 2005. | |
300 | ▼a vii, 93 p. : ▼b 삽도 ; ▼c 26 cm. | |
500 | ▼a 단면인쇄임 | |
500 | ▼z 지도교수: 김창헌 | |
502 | 1 | ▼a 학위논문(박사)-- ▼b 고려대학교 대학원, ▼c 컴퓨터학과 전산학 전공, ▼d 2005.8. |
504 | ▼a 참고문헌 : p. 88-93 | |
900 | 1 0 | ▼a 김창헌, ▼g 金昌憲, ▼d 1957-, ▼e 지도교수 ▼0 AUTH(211009)153276 |
945 | ▼a KINS |
소장정보
No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
---|---|---|---|---|---|---|---|
No. 1 | 소장처 과학도서관/학위논문서고/ | 청구기호 0510 6YD36 108 | 등록번호 123028395 | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
컨텐츠정보
초록
본 논문에서는 카메라문서영상에서 문자 인식률을 향상시킬 수 있는 방법의 하나로 문자인식 모듈에 입력될 문서 영상의 기하학적 왜곡을 베지어 곡면을 적용시켜 원래의 문서와 가장 근접한 문서영상으로 복원하여 인식 하기 적합한 문서로 복원을 수행하였고, 문서 촬영 시의 카메라의 상대적 위치나 촬영 각도 등 왜곡에 영향을 미치는 파라미터들을 계산하고, 계산된 파라미터들을 이용하여 왜곡 없는 문서 영상의 복원이 가능함을 확인하였다. 문서영상의 왜곡보정 방법과 조명이나 낮은 영상의 해상도 그리고 다양한 환경에서 발생되는 잡음이 있는 문서영상에서 텍스트 영역만을 추출하여 전역적 이진화 방법 중 가장 잘 알려진 Otsu 이진화 알고리즘을 적용하여 효율적으로 문서영상을 이진화하는 방법을 제시하였다. 또한, 텍스트 추출 알고리즘에 의해 선택된 텍스트 영역에 대해 지역적 이진화 방법 중 가장 잘 알려진 Niblack 방법을 변형한 선택적 지역기반 이진화 기법을 적용하여 효율적으로 문서영상을 인식할 수 있는 방법을 제시하였다. 제안된 방법의 타당성을 검증하기 위하여 한글, 영어, 숫자 및 특수 기호가 포함된 휴대용 카메라 문서영상 ETRI 데이터베이스를 이용한 실험을 통하여 99.15%의 분류율과 97.5%의 인식률을 얻었다.
본 논문에서는 카메라문서영상에서 문자 인식률을 향상시킬 수 있는 방법의 하나로 문자인식 모듈에 입력될 문서 영상의 기하학적 왜곡을 베지어 곡면을 적용시켜 원래의 문서와 가장 근접한 문서영상으로 복원하여 인식 하기 적합한 문서로 복원을 수행하였고, 문서 촬영 시의 카메라의 상대적 위치나 촬영 각도 등 왜곡에 영향을 미치는 파라미터들을 계산하고, 계산된 파라미터들을 이용하여 왜곡 없는 문서 영상의 복원이 가능함을 확인하였다. 문서영상의 왜곡보정 방법과 조명이나 낮은 영상의 해상도 그리고 다양한 환경에서 발생되는 잡음이 있는 문서영상에서 텍스트 영역만을 추출하여 전역적 이진화 방법 중 가장 잘 알려진 Otsu 이진화 알고리즘을 적용하여 효율적으로 문서영상을 이진화하는 방법을 제시하였다. 또한, 텍스트 추출 알고리즘에 의해 선택된 텍스트 영역에 대해 지역적 이진화 방법 중 가장 잘 알려진 Niblack 방법을 변형한 선택적 지역기반 이진화 기법을 적용하여 효율적으로 문서영상을 인식할 수 있는 방법을 제시하였다. 제안된 방법의 타당성을 검증하기 위하여 한글, 영어, 숫자 및 특수 기호가 포함된 휴대용 카메라 문서영상 ETRI 데이터베이스를 이용한 실험을 통하여 99.15%의 분류율과 97.5%의 인식률을 얻었다.
목차
그림 3.2 예제 영상의 양선형 변환 로 수식 (3.6)이 되고 최종직선은 ④가 되므로 통과점(xb,yb)은 수식 (3.7)이 된다.- 15 - - 16 -영상의 좌우 가장자리에 위치한 후보글자들을 대상으로 기울어진 각도의 최고 값을 측정하여 세로방향 직선의 기울기를 결정한다. 3) 후보글자 선정 그림 3.4 의 텍스트 영상을 이용하여 텍스트 영역 좌우 끝에 위치한 글자에 외접하는 두 직선의 Mvθc 값을 구한 결과 각각 6.4°와 -5.9°이고 이 값을 이용하여 그림 3.6 세로방향 연결화소 예 구한 두 세로방향 직선과 앞 절에서 구한 2개의 가로방향 직선이 형성하는 사변형영역을 그림 3.7 (a)에 표시하였으며 그림 3.7 (b)는 해당 사변형 영역을 양선형변xe [l(cc 환을 수행하여 기하학적 왜곡을 보정한 결과이다.y(x)), ccy(x) VC]vc Σm - x-xs nvc (3.10)VC- ccy(x)│l(ccy(x))≥ dy , x (xs,xe), dy - 3 (ye ?ys) (3.11) 3.1.3 Bezier surface를 이용한 2차원 복원 기법 Bezier curve를 서로 수직인 두 방향의 별개의 매개변수를 이용한 2차원 표현식으로 일반화한 것이 Bezier surface인데, 주어진 매개변수 쌍에 대한 곡면상의임의의 점은 다음의 식에 의해서 계산된다. 그림 3.9 고차의 Bezier surface를 이용한 변환 예(c) Bezier surface 표면 (d) 복원된 출력 영상 그림 3.8 2차원 Bezier 복원 기법 적용 예 앞의 그림 3.8의 예와 같이 양선형 복원과 동일한 Bezier 복원 기법은 Beziersurface를 1차 다항식을 이용하였을 때이다. 한편, Bezier surface의 표현식을 2차, 그림 3.10 고차 Bezier 복원에 의한 곡선 경계 영역의 변환 예다음의 그림 3.10에서는 곡선 경계를 갖는 영역에 대한 복원예로서, 그림 3.10(a)의 입력 영상은 복원 대상 영역이 곡면 경계로 둘러싸인 경우이다. 사용자가 곡면 경계에 일치하도록 고차 Bezier 곡면의 조정점을 위치시킨 예를 보여주고있고, 이를 이용하여 곡면 경계 내의 영역이 Bezier 복원 기법에 의해서 직사각형영역으로 복원된 결과를 그림 3.10(b)에서 보여주고 있다. (a) 왜곡전 문서영상 (b) x-축에 대한 회전 (c) 복합 변환된 영상 그림 3.11 기하학적 왜곡 요소와 그 영향의 예- 27 - - 28 - 그림 3.11(a)는 왜곡이 없는 문서영상을 보여주고 있다. 그림 3.11(b)는 문서가 3.2.2 3차원 복원기법의 수학적 전개 x-축을 기준으로 -20도 만큼 회전한 경우에 카메라에 촬영된 영상이고, 그림 그림 3.12에 그림으로 나와 있는 것처럼, 카메라로 촬영된 왜곡된 영상(a)가 주어 로 추적하는 기법을 생각할 수 있다. 본 논문에서는 [60]이 제안한 pa eter ? 11 12 13 14 ?ram {p}-[M]{q} 또는 v -????m21 m22 m23 m24 ????? y (3.16)trackin 기에 적합한 원 문서영상으로 {w1}?m m m m ? zg 기법을 왜곡된 문서영상에 적용하여 인식하 ???m31 32 33 34 ??{}41 m42 m43 m 다. ?(a) 왜곡된 문서 영상 (b) 왜곡 전 원문서