讲座PPT下载

Download Report

Transcript 讲座PPT下载

数字图像处理综合实验
案例分析一
手写数字识别
本章要点:

OCR光学字符识别

研究背景及意义

特征选择和提取

构建样品特征库

手写数字识别
OCR光学字符识别

OCR (Optical Character Recognition
,光学字符识别)是对文本资料进行
扫描,然后对图像文件进行分析处
理,获取文字及版面信息的过程。
手写数字识别
手写数字识别是光学字符识别
技术的一个分支。
 研究的对象:如何利用电子计
算机自动辨认人手写的阿拉伯
数字。

研究背景
手写数字识别的应用范围广泛,阿
拉伯数字组成的各种编号和统计数
据如:邮政编码、统计报表、财务
报表、银行票据等等。
 在整个OCR领域中,最为困难的就
是脱机手写字符的识别。

研究理论意义
阿拉伯数字是唯一的被世界各国
通用的符号。
 目前为止机器的识别本领还无法
与人的认知能力相比,这仍是一
个有难度的开放性问题。
 手写数字的识别方法扩展范围广
。

研究难点
 不同数字之间字形相差不大,使得
准确区分某些数字相当困难;
 数字虽然只有十种,笔划简单,但
同一数字写法千差万别,全世界各
地区的人都用,书写上带有明显的
区域特性,很难做到完全兼顾世界
各种写法的极高识别率系统。
简单手写数字识别系统设计
简单手写数字识别系统主要构成:
 特征提取
 识别(模版匹配法)
特征库
具体流程图:
手写输入或
打开图片
初步处理
点阵坐标
记录边界
提取
特征
25维
特征
识别
结果
特征提取和选择
在模式识别中特征选择是个重要问题。
直接从样品得到的数据量往往是相当
大的。例如从一个图像中可以有几十
万个数据,而一个卫星云图的数据量
更多。为了对样品进行准确的识别,
需要进行特征选择或特征压缩。
特征提取和选择
一个重要而困难的环节:
 分析特征的有效性,选出最有代表
性的特征是模式识别的关键一步。
 降低特征维数。
特征选择
特征形成:根据被识别的对象产生出来的一
组基本特征。
特征选择:对原始数据进行抽取,抽取那些
对区别不同类别最为重要的特征,而舍去那
些对分类并无多大贡献的特征,得到能反映
分类本质的特征。
特征提取
特征提取:是模式识别的关键,直接影
响其识别的分类效果。两种方法:
1)以框架的左边框到数字之间的距离变
化。
2)将每个数字分成N×N等份,对每一份
内的像素个数进行统计,除以每一份
的面积总数。
特征提取
特征提取
模板特征提取
模版特征提取
分成N×N等份的好处是:
针对同一形状、不同大小的样品得到
的特征值相差不大。有能力对同一形
状、不同大小的样品视为同类,因此
这里要求物体至少在宽度和长度上大
于N个像素,否则太小无法正确分类。
N值选择
特征数目选择
Kanal.L曾经总结过经验:样品数
与特征数之比应足够大,通常样本
数是特征数的5~10倍左右。
 取N=5,特征数N×N=25;每一种数
字就需要至少125个标准样本,10
个数字需要1250个标准样本。

N值选择
N值选择
N值越大,模板也越大,特征越多
,区分不同的物体能力越强,但同
时计算量增加,运行等候的时间增
长,所需要的样本库也成倍增加。
因此,需要选择合适的N值。
 这里我们取N=5,经实验证明能够
满足实际需要。

特征提取的具体实现
1)搜索数据区,找出手写数字的上下左
右边界。
2)将数字区域平均分为5×5的小区域。
3)计算5×5的每一个小区域中黑像素所
占比例,第一行的5个比例值保存到特
征的前5个,第二行对应着特征的6~10
个,依此类推。
构造样品特征库
构造样品特征库

什么是监督
学习?
分类器的设计方法属于监督学习法,
在监督学习过程中,为了能够对未知
事物进行分类,必须输入一定数量的
样本来构建训练集,而且这些样本的
类别已知,提取这些样本的特征,构
造分类器,然后对任何未知类别进行
模式识别。
机器学习
机器学习
监督学习:给定训练数据集,从中学习出一个
函数,当新的数据到来时,可以根据这个函
数预测结果。输入和输出对应特征和目标。
无监督学习:无训练集,采用聚类法。
半监督学习:介于监督与无监督学习之间。
增强学习:通过观察来学习,根据观察到的
周围环境的反馈来做出判断。
样品特征库的建立
样品特征库的建立

点击【训练样品设计】下拉列表框,
为手写的数字选择其对应的类别。
手写数字识别
模式识别有多种方法如:模板匹配、判
别函数、神经网络、规则推理等。
模板匹配法:将训练样品集中的每个样
品都作为模板,用测试样品与每个模板
比较,看与哪个模板最相似,就按最近
似的模板的类别作为自己的类别。
最近邻法


最近邻法:将与测试样本最近邻样本的
类别作为决策的结果。
对一个C类别问题,每类有 Ni 个样本,
i=1,……,C,则第i类的判别函数为:
决策规则
最近邻法在原理上最直观,方法上也
十分简单,明显的缺点就是计算量大
,存储量大。
 ‖·‖表示某种距离(相似性)度量
,常用欧氏距离作为相似性度量。

欧式距离

设有两个样品Xi、Xj的特征值分别为:
 xi1 
 
x
X i   i 2    xi1 , xi 2 ,
 
 
 xin 

, xin 
T
 x j1 
 
x j2
X j      x j1 , x j 2 ,
 
 
 x jn 
, x jn 
T
若采用欧式距离法来计算的两样品之间的距离
,则两样品距离: D2   X  X T  X  X   X  X 2
ij
i
j
   xik  x jk 
n
k 1
距离越小,两个样品越相似。
i
2
j
i
j
手写数字识别过程
1)待测样品与训练集里每个样品的距离采用
d ( X , X i ) = | X - X i |2
2)循环计算待测样品和训练集中各已知样品之间的距
离,距离最近的已知样品的类别就是待测样品的类
别。
3)若样品未被识别,则可将样品加入样品特征库。
任务:对这个案例进一步分析
讨论一下
1)怎样找到数字的位置?
2)提取哪些特征?
3)怎样建立样品特征库?
4)采用何种识别的决策?
5)实现的流程的核心代码?
特征提取
特征提取
样品特征库的建立
样品特征库的建立

点击【训练样品设计】下拉列表框,
为手写的数字选择其对应的类别。
简单手写数字识别系统设计
特征库
手写输入或
打开图片
初步处理
点阵坐标
记录边界
提取
特征
25维
特征
识别
结果