Transcript OCR

*
陆嘉辉
7.17
*
陆嘉辉
7.17
*将手写扫描图像或打印/印刷文本图像,
通过机械或电子学上的方法,转换成机
器编码的或是计算机可读的文本的技术
*属于模式识别、人工智能和计算机视觉
的一个领域
*缩写为OCR
*
*Gustav Tauschek, 1929
*Emanuel Goldberg, 1931
*Ray Kurzweil, 1974,
Kurzweil Computer Products, Inc
*WebOCR, 2000s
*
*OCR
*OWR
*ICR
*IWR
(光学字符识别)
(光学单词识别)
(智能字符识别)
(智能单词识别)
*
*纠偏
*去噪点
*二值化
*去噪音线
*版面分析
*单词检测
*字符分割
*比例模式化
*
*R(x,y),G(x,y),B(x,y)
*G = I = ( R + G + B )/ 3
*G = Y = 0.299R + 0.587G + 0.114B
*G = min { R , G , B }
(HSI)
(YIQ)
*
*一般24位RGB图像的灰度图是8位256个
灰度级的,如果把这个灰度级减少到1
位2个灰度级,就得到一副二值图,二
值图像中的数据全部是0或1。
*
*等距分割
*积分投影分割
*提取连通分量
*主要难题:字符粘连
*
*模式识别
*特征提取
*自适应字符识别(二次识别)
*字典改进
*“近邻”分析
*语法
*
*早期估计为81%-99%
*一个字符微小的不准确率会大幅降低
单词的正确识别率
*
*校对与纠错
*版面还原
*
*定制的OCR
*牌照,身份证
*盲人
*读地图
*验证码识别
*
* OmniPage
* Tesseract
* ExperVision TypeReader & RTK
* ABBYY FineReader
* AnyDoc Software
* LEADTOOLS
* CuneiForm
* Asprise OCR SDK
* SimpleOCR
* Dyanmsoft OCR SDK
* Microsoft Office OneNote 2007
* MeOCR
* Screenworm
汉王
紫光
*
* en.wikipedia.org/wiki/Comparison_of_optical_character_
recognition_software
*强制优化输入
*外包
reCAPTCHA
*
* http://www.cnblogs.com/chaosimple/archive/2013/0
7/18/3197720.html
* http://blog.damiles.com/2008/11/basic-ocr-inopencv/
* 冯建强,刘文波,于盛林.
《基于灰度积分投影的人眼定
位》 计算机仿真22.4 (2005): 75-76.
* 荆涛,王仲.
《光学字符识别技术与展望》 计算机工
程 29.2 (2003): 1-2.
* Eikvil, Line. "Optical Character Recognition." citeseer.
ist. psu. edu/142042. html (1993).
* 因华.《特殊印刷体粘连字符切分方法研究》2005
* Wikipedia
*