ccidnet????

出版日期:2000-03-20 总期号:406 本年期号:09

本期导读
信息综述
产品技术
行业应用
网络通信
神经网络在ocr识别中的作用



  扫描仪作为计算机的主要外设,众多的使用者已不能满足它仅仅只是把文字、图像清晰亮丽的输入计算机,而越来越需要它本身的“智能”化,“ocr”正是在这种情况下应运而生。ocr实际上就是让计算机认字,实现文字自动输入,它是一种非常快捷、省力的文字输入方法。

  OCR技术的关键问题就是如何对所属类别未知的字符图像进行识别,文字识别的方法就是指特征选择抽取、分类判别的方法,而特征抽取的目的是为了更好地进行分类判别,这一分类识别的过程是由OCR的模式分类器来完成的。模式分类器可分为结构型分类器、统计型分类器和神经网络分类器三种。我们拿市面流行的“尚书ocr文字识别系统”和“清华紫光ocr软件”为例,它们都属于“神经网络分类器”也就是目前最好的模式。对神经性网络的研究目前正处在一个新的高峰期,不但在理论上有很大的突破而且已广泛应用于模式识别领域。神经网络的拓朴结构分前馈网络和反馈网络两种。如多层感知器属于前馈网络,而hopfiled属于反馈网络。与一般的计算机程序不同,神经网络通常需要进行训练。训练的过程就是网络学习的过程,学习改变了网络节点的连接权矢量的值使其具有分类的功能,经过训练后的网络就可以用于字符的识别了。

  虽然,它们两者都采用了同样的内核,在它们之间还是有区别的,就笔者在使用比较了紫光扫描仪(含清华文通th-ocr mf7.0)和n-tek扫描仪(含尚书5号)之后认为,尚书ocr在外围的功能开发上走在了前面,而识别率和速度几乎没有区别。

  尚书5号和清华文通为32位系统,支持windows95/98/nt;在印刷文字识别上加入mmx优化,识别速度都比传统的ocr软件提高50%以上;两者在汉英双语同时混排时,识别率都达到98.4%以上);支持非特定人脱机手写识别功能;支持表格识别结果可在ms-word下编辑功能;支持对识别结果进行电子文档版面复原功能,所见即所得;支持日文、日英混排识别功能,识别率98%以上(选件)。它们识别的字体有:简/繁体汉字的宋体、仿宋体、黑体、楷体、魏碑、小姚等多种字体及其变形变体;十多种流行的印刷体英文字体;印刷体日文及规范手写体汉字、英文、数字、标点符号。

  当然,我们不能只停留在这些技术上,我们期待更具友好界面、更具稳定性、易用性和可靠性(最好识别率有100%)的产品出现,把咱们的文字“改邪归正”!把咱们的扫描仪“变”的更“聪明”!!