Transcript 讲座PPT下载
数字图像处理综合实验 案例分析一 手写数字识别 本章要点: OCR光学字符识别 研究背景及意义 特征选择和提取 构建样品特征库 手写数字识别 OCR光学字符识别 OCR (Optical Character Recognition ,光学字符识别)是对文本资料进行 扫描,然后对图像文件进行分析处 理,获取文字及版面信息的过程。 手写数字识别 手写数字识别是光学字符识别 技术的一个分支。 研究的对象:如何利用电子计 算机自动辨认人手写的阿拉伯 数字。 研究背景 手写数字识别的应用范围广泛,阿 拉伯数字组成的各种编号和统计数 据如:邮政编码、统计报表、财务 报表、银行票据等等。 在整个OCR领域中,最为困难的就 是脱机手写字符的识别。 研究理论意义 阿拉伯数字是唯一的被世界各国 通用的符号。 目前为止机器的识别本领还无法 与人的认知能力相比,这仍是一 个有难度的开放性问题。 手写数字的识别方法扩展范围广 。 研究难点 不同数字之间字形相差不大,使得 准确区分某些数字相当困难; 数字虽然只有十种,笔划简单,但 同一数字写法千差万别,全世界各 地区的人都用,书写上带有明显的 区域特性,很难做到完全兼顾世界 各种写法的极高识别率系统。 简单手写数字识别系统设计 简单手写数字识别系统主要构成: 特征提取 识别(模版匹配法) 特征库 具体流程图: 手写输入或 打开图片 初步处理 点阵坐标 记录边界 提取 特征 25维 特征 识别 结果 特征提取和选择 在模式识别中特征选择是个重要问题。 直接从样品得到的数据量往往是相当 大的。例如从一个图像中可以有几十 万个数据,而一个卫星云图的数据量 更多。为了对样品进行准确的识别, 需要进行特征选择或特征压缩。 特征提取和选择 一个重要而困难的环节: 分析特征的有效性,选出最有代表 性的特征是模式识别的关键一步。 降低特征维数。 特征选择 特征形成:根据被识别的对象产生出来的一 组基本特征。 特征选择:对原始数据进行抽取,抽取那些 对区别不同类别最为重要的特征,而舍去那 些对分类并无多大贡献的特征,得到能反映 分类本质的特征。 特征提取 特征提取:是模式识别的关键,直接影 响其识别的分类效果。两种方法: 1)以框架的左边框到数字之间的距离变 化。 2)将每个数字分成N×N等份,对每一份 内的像素个数进行统计,除以每一份 的面积总数。 特征提取 特征提取 模板特征提取 模版特征提取 分成N×N等份的好处是: 针对同一形状、不同大小的样品得到 的特征值相差不大。有能力对同一形 状、不同大小的样品视为同类,因此 这里要求物体至少在宽度和长度上大 于N个像素,否则太小无法正确分类。 N值选择 特征数目选择 Kanal.L曾经总结过经验:样品数 与特征数之比应足够大,通常样本 数是特征数的5~10倍左右。 取N=5,特征数N×N=25;每一种数 字就需要至少125个标准样本,10 个数字需要1250个标准样本。 N值选择 N值选择 N值越大,模板也越大,特征越多 ,区分不同的物体能力越强,但同 时计算量增加,运行等候的时间增 长,所需要的样本库也成倍增加。 因此,需要选择合适的N值。 这里我们取N=5,经实验证明能够 满足实际需要。 特征提取的具体实现 1)搜索数据区,找出手写数字的上下左 右边界。 2)将数字区域平均分为5×5的小区域。 3)计算5×5的每一个小区域中黑像素所 占比例,第一行的5个比例值保存到特 征的前5个,第二行对应着特征的6~10 个,依此类推。 构造样品特征库 构造样品特征库 什么是监督 学习? 分类器的设计方法属于监督学习法, 在监督学习过程中,为了能够对未知 事物进行分类,必须输入一定数量的 样本来构建训练集,而且这些样本的 类别已知,提取这些样本的特征,构 造分类器,然后对任何未知类别进行 模式识别。 机器学习 机器学习 监督学习:给定训练数据集,从中学习出一个 函数,当新的数据到来时,可以根据这个函 数预测结果。输入和输出对应特征和目标。 无监督学习:无训练集,采用聚类法。 半监督学习:介于监督与无监督学习之间。 增强学习:通过观察来学习,根据观察到的 周围环境的反馈来做出判断。 样品特征库的建立 样品特征库的建立 点击【训练样品设计】下拉列表框, 为手写的数字选择其对应的类别。 手写数字识别 模式识别有多种方法如:模板匹配、判 别函数、神经网络、规则推理等。 模板匹配法:将训练样品集中的每个样 品都作为模板,用测试样品与每个模板 比较,看与哪个模板最相似,就按最近 似的模板的类别作为自己的类别。 最近邻法 最近邻法:将与测试样本最近邻样本的 类别作为决策的结果。 对一个C类别问题,每类有 Ni 个样本, i=1,……,C,则第i类的判别函数为: 决策规则 最近邻法在原理上最直观,方法上也 十分简单,明显的缺点就是计算量大 ,存储量大。 ‖·‖表示某种距离(相似性)度量 ,常用欧氏距离作为相似性度量。 欧式距离 设有两个样品Xi、Xj的特征值分别为: xi1 x X i i 2 xi1 , xi 2 , xin , xin T x j1 x j2 X j x j1 , x j 2 , x jn , x jn T 若采用欧式距离法来计算的两样品之间的距离 ,则两样品距离: D2 X X T X X X X 2 ij i j xik x jk n k 1 距离越小,两个样品越相似。 i 2 j i j 手写数字识别过程 1)待测样品与训练集里每个样品的距离采用 d ( X , X i ) = | X - X i |2 2)循环计算待测样品和训练集中各已知样品之间的距 离,距离最近的已知样品的类别就是待测样品的类 别。 3)若样品未被识别,则可将样品加入样品特征库。 任务:对这个案例进一步分析 讨论一下 1)怎样找到数字的位置? 2)提取哪些特征? 3)怎样建立样品特征库? 4)采用何种识别的决策? 5)实现的流程的核心代码? 特征提取 特征提取 样品特征库的建立 样品特征库的建立 点击【训练样品设计】下拉列表框, 为手写的数字选择其对应的类别。 简单手写数字识别系统设计 特征库 手写输入或 打开图片 初步处理 点阵坐标 记录边界 提取 特征 25维 特征 识别 结果