문자 인식 개요

Download Report

Transcript 문자 인식 개요

문자 인식 개요
NR-LAB
강동구
Neural network and Realworld application
1. 문자 인식의 방법
 신경 회로망
 인간의 신경 체계인 뉴론의 모형을 기반
 템플릿 매칭
 각 문자의 대표 문자를 바탕으로 유사도 측정
 특징 추출
 여러 이미지 변환을 통하여 특징을 추출
 그 문자만이 가진 독특한 특성을 이용
Neural network and Realworld application
2. 신경 회로망을 이용한 문자인식
수상돌기
7
축색
세포체
“7” 이면 활성화
그렇지 않으면 비활성화
Neural network and Realworld application
3. 신경 회로망의 구조
 뉴런들의 집합으로 구성되어 있다.
 뉴런의 수상돌기는 돌기가 가지는 저항치
(가중치)와 곱해져서 그 합이 뉴런의 세포
체로 들어간다.
 뉴런의 노드는 주어진 조건에 의해 출력값
을 생성하고 축색으로 보낸다.
 축색으로 보낸 값은 또 다른 뉴런의 수상돌
기로 향한다.
Neural network and Realworld application
4. 신경회로망의 특성
 신경망은 프로그램 되지 않는다.
 예제를 통한 학습 : 지도학습
 정보를 분산된 형태로 코드화
 네트웍의 일부가 파손되어도 작동 가능
 이 내용에 대한 실재 구현은 어려움
 분류 작업을 수행하는데 필요한 두드러진 특징을
발견한다.
 훈련 세트간의 차이점이 어디에서 나타나는지를 스스로
찾아낸다.
Neural network and Realworld application
5. 템플릿 매칭을 이용한 방법
 템플릿이란?
 문자들의 기준이 되는 대표 문자
 입력값과 템플릿들의 유사도를 분석하여
가장 유사한 템플릿이 가지는 문자가 입력
문자로 판단
 유사도를 측정하는 방법이 필요
Neural network and Realworld application
7. 간단한 유사도 측정 방법
템플릿 :
입력 :
틀린것이 3개 존재
틀린것이 12개 존재
따라서 3과 가까움
Neural network and Realworld application
7. 템플릿 매칭의 특징
 자동차 번호판과 같이 고정된 문자의 인식
 별도의 인식을 위한 처리과정이 필요 없이
간단히 구현
 필기체 문자 인식에는 부적합
 NR배 숫자 인식 경진대회에 적용하기도 부
적합
Neural network and Realworld application
8. 특징 추출을 통해서 인식
 각각의 문자들이 가지는 고유한 특성을 찾
아내어 그 특징을 종합하여 인식
 예를 들어 7 과 6을 구별하는 방법은 이미
지를 반으로 잘라서 위쪽에 검정 픽셀이 많
으면 7, 그 반대는 6으로 인식
Neural network and Realworld application
9. 문자인식에 많이 사용하는 특징추출
( 1. 프로젝션 )
Neural network and Realworld application
9. 문자인식에 많이 사용하는 특징추출
( 2. convex deficiencies )
2
3
3
4
2
2
0
1
1
4
0
4
2
0
Neural network and Realworld application
9. 문자인식에 많이 사용하는 특징추출
( 3. chain code )
111444
3
2
4
1
Neural network and Realworld application
9. 문자인식에 많이 사용하는 특징추출
( 4. Resampling )
2
2
2
4
2
4
3
0
3
Neural network and Realworld application
10. 문자 인식 경진 대회 문자셋의 특징




세선화 문자( 한 픽셀 굵기의 문자)
굵은 폰트의 문자
잡음이 많이 섞인 문자
한글의 여러 폰트를 리사이징한 문자
자세한 내용은 http://harmony.cs.pusan.ac.kr
Neural network and Realworld application