한글 인쇄체의 골격선 추출

Download Report

Transcript 한글 인쇄체의 골격선 추출

문자 패턴을 위한 모양 분해
알고리즘
2001. 8. 24
박 정 선, 오 일 석
전북대학교 컴퓨터과학과
컴퓨터 비젼실
목차
1. 연구 배경
2. 용어 설명
3. 제안한 모양 분해 방법
4. 모양 분해 실험 결과
5. 가상의 골격선 추출
6. 결론
전북대학교 컴퓨터 과학과 컴퓨터 비젼실
2
연구 배경


최근 인식 분야에서는 획 기반의 연구 주류
획 분석 방법

세선화 방법 [1,2,3,4]



매스크 연산들을 사용하여 가장 바깥쪽의 외곽의 비골격 화소
(non-skeleton pixel)들을 반복적으로 제거하는 방법
정보 손실 및 패턴 왜곡 & 획 길이가 원 영상보다 작아진다는
단점
모양 분해 방법(shape decomposition) [5,6,7,8]



LAG(line adjacency graph)[6]이나 획 단면(cross section) [7]과
같은 고차원의 데이터 구조를 이용하는 방법
획의 두께 정보를 이용하여 정규 영역 과 비정규 영역으로 분할
[8,9]하여 추출하는 방법
원 영상의 정보를 그대로 보존, 획의 길이가 줄어들지 않는다는
것 그리고 획 들간의 상호 연결 정보를 포함하는 장점
전북대학교 컴퓨터 과학과 컴퓨터 비젼실
3
연구 배경

모양 분해 알고리즘

기본 전략




가능한 한 단순한 규칙 사용
Language independent, font and size independent
계산 시간 측면에서 유리
분할 후보 위치

가장 움푹 들어가 있는 부분의 점
전북대학교 컴퓨터 과학과 컴퓨터 비젼실
4
용어 설명

용어 정의

오목 영역


분할 기준점(Anchor point)


오목 영역의 가장 꼭대기(peak)점
볼록 헐을 이루게 하는 선분
depth
외곽선
오목 영역
분할 끝점(Terminal point)


컷(cut)
bridge line
연결선(bridge line)


볼록 헐(convex hull) 영상 – 원 영상
분할 기준점과 대응이 되는 점
컷(cut)

분할 기준점-분할 끝점의 쌍
분할 기준점(anchor point)
분할 끝점(terminal point)
전북대학교 컴퓨터 과학과 컴퓨터 비젼실
5
모양 분해 방법

모양 분해 알고리즘
step 1 : 연결 영역(connected component)으로 분리
step 2 : 외곽선에 대한 체인코드(4방향) 생성
step 3 : 체인 코드 안에서 bridge line의 양 끝점 추출
step 4 : 유사 볼록 부품 검사
만약 유사 볼록 부품 이라면, goto step 1
step 5 : 각 오목 영역 안에서 분할 기준점(anchor points) 탐지
step 6 : 각 분할 기준점에 근접한 분할 끝점(terminal point) 탐지
step 7 : 기준점-끝점들로 멀티 분할, goto step 1
전북대학교 컴퓨터 과학과 컴퓨터 비젼실
6
각 연결 요소에 anchor,
terminal point 탐지 및 분할
전체 알고리즘
입력 영상
T
A
T
A
모든 연결 요소가 파
라미터 pdepth,pdistance
의 조건 만족하면 종
료
T
A
홀 탐지 및 분할
T
O
A
T
T
A
T
O
연결 요소 추출
anchor-terminal point 쌍으로 분할
및 재 연결 요소 추출
유사 볼록 부품으로
분해된 결과
모양 분해 방법

유사 볼록 부품 검사(step 4)

파라미터 pdepth,pdistance가 아래 두 조건을 만족하면 유사 볼록
부품

depth(rs,re,rj):s≤j≤e, rj에서 직선(rs re )까지의 수직 거리

pointdist(rs,re): rs에서 re까지의 유클리디언 거리

Pdepth > Max {depth(rs,re,rj) }, (s<j<e).(1)

Pdistance > pointdist(rs,re) ..................(2)
rt
ra
re
bridge line
외곽선
오목 영역
전북대학교 컴퓨터 과학과 컴퓨터 비젼실
rs
8
모양 분해 방법

분할 기준점들(anchor points) 탐지 (step 5), 분할 끝점
들(terminal points) 탐지 (step 6)

분할 기준점(Anchor point)


분할 끝점(Terminal point)



ra= step4의 가장 깊은 점
연결선을 중심으로 바깥 외곽선 대상
rt = Min {pointdist(ra,rj) }, (e<j<s)
외곽선
컷(cut)

분할 기준점 – 분할 끝점의 쌍
bridge line
: anchor point
: terminal point
전북대학교 컴퓨터 과학과 컴퓨터 비젼실
9
모양 분해 알고리즘 결과

실험 환경


Pentium II에서 Visual C++로 구현
인쇄된 한글, 필기된 한글, 영어, 중국어, 일본어,
숫자 등 다양한 문자에 적용
전북대학교 컴퓨터 과학과 컴퓨터 비젼실
10
모양 분해 알고리즘 결과
전북대학교 컴퓨터 과학과 컴퓨터 비젼실
11
임계값 조절에 따른 모양 분해
depth = 4.0
depth = 3.0
전북대학교 컴퓨터 과학과 컴퓨터 비젼실
depth = 2.0
12
가상의 골격선 추출
전북대학교 컴퓨터 과학과 컴퓨터 비젼실
13
가상의 골격선 추출
전북대학교 컴퓨터 과학과 컴퓨터 비젼실
14
결론

결론

원 영상을 유사 볼록 부품 집합으로 분할



가능한 단순한 규칙들을 사용함
분할된 패턴에서 골격선 추출 방법 설계, 구현 중
향후 인식기를 통한 성능 평가

카이스트 인공지능 실험실 인식기
전북대학교 컴퓨터 과학과 컴퓨터 비젼실
15