ccidnet????

出版日期:2003-03-10 总期号:1196 本年期号:15

本期导读
要闻综合
中国信息化
网络与通信
软件与服务
产品与应用
渠道与市场
东北专刊
华东专刊
华南专刊
西北专刊
西南专刊
争做中文OCR技术的首席

齐飞

  有一些信号表明,中国信息化建设日益高涨的呼声已经为我国信息技术发展带来了一些新的变化。这种变化不仅表现在技术的革新与进步,更表现为用户对于信息化的内涵和技术发展趋势有了非常明显的了解愿望。这一点在基础信息化的核心技术OCR领域上表现得更是如此。


  OCR进入成熟期


  “过去,是我们上门给客户解释什么是OCR;现在,有大量的数字图书馆、金融以及企业用户上门主动了解我们‘TH-OCR’技术在资料电子化以及基础信息上的应用。”说起这话,清华紫光文通总经理沙建辉不经意间露出了一丝笑容。但这个笑容背后,却隐藏着我国自有的信息化建设发展的艰辛。

  其实OCR技术并非一项新的技术。OCR概念的产生是在1929年,德国的科学家Tausheck首先提出了OCR的概念。几年后,美国科学家Handel也提出了利用光学技术对文字进行识别的想法。我国在OCR技术方面的研究工作起步较晚,但在清华的吴佑寿教授、丁晓青教授、中科院的刘品平博士、李明敬博士等人20多年的不懈努力下,已经取得了巨大发展。

  先进技术从实验室走向市场都要经历一个长期的过程。过去,人们对OCR要么完全陌生,要么只能和市场上与扫描仪捆绑的OCR软件普及版联系起来。这固然涉及到市场普及的问题,但也和过去OCR产品实用程度低、功能单一有很大的关系。随着国家“863”计划对OCR研究开发的资助,我国在信息技术领域付出的努力终于有了初步的回报。目前,印刷体OCR的识别技术已经达到完全实用的程度,即使对印刷质量较差的文字的识别率也达到95%以上。而结合尖端技术的专业版 OCR更是具备了批处理功能,性能更加优化。它针对表格形式的特征设计了大量的优化功能,使得识别精度更高、识别速度更快,并且为适应不同环境的使用提供了多种识别方式选项,支持单机和网络操作,极大地方便了使用,使应用范围更加广泛,能满足各种用户的应用要求。

  在目前的市场上,清华紫光文通公司推出的TH-OCR在国内市场占据了很大的份额。2002年,它们推出的IT-Center——数字化信息中心等五款战略性产品使数据录入更快捷、准确,支持多用户权限设置管理和智能全能检索,并在技术上实现了100%原文重现。“TH-OCR”技术已经成为当今中文识别处理领域强大的应用软件之一。

  可以说,经过科学家们和企业的共同努力,现在的OCR技术终于迎来了一个技术的成熟期。整个OCR技术的美好前景已经被清晰地勾勒出来了。


  打造国际品牌形象


  但是,由于OCR浓烈的技术色彩,一直以来,涉及OCR的厂商相当少。清华紫光文通就是属于不懈坚持的厂商之一。

  作为一家立足于印刷体和手写识别两大领域的信息技术公司,紫光文通自成立以来,以高科技为核心,依托强大的清华大学技术背景,现已发展成为海内外文字识别领域优秀的研究机构之一。

  清华紫光文通在技术上走向成熟的同时,也迅速地意识到了品牌的效应和这一效应带来的责任。紫光文通去年至少在两个层面已经取得了成效。首先就是在品牌塑造方面。作为一个技术型企业,清华紫光文通公司深知,要想在激烈的市场竞争中体现出核心竞争力,就必须树立起企业级的技术形象。紫光文通公司与清华大学电子工程系智能图文信息处理研究室进行了密切的合作,以工程院院士吴佑寿为首,在博士生导师丁晓青教授的领导下,致力于清华TH-OCR的研究与开发,使紫光文通的核心技术“TH-OCR”始终保持在领先的技术水平。再者,文通在品牌国际化方面也做得十分成功。文通已经和包括微软、SCANSOFT等多家知名软件公司展开合作,紫光文通的产品已经贴上“中国造”的标签销往日本、韩国等地。文通公司正在努力提升“TH-OCR”技术的国际形象。

  清华紫光文通总经理沙建辉告诉我们:“虽然OCR概念不是我们中国人首先提出来的,但是在中文OCR处理方面,我们就是要当仁不让地做首席。现在,大家都在谈论说,中国加入WTO后,软件业受到的影响将最大,却很少去谈我们怎么利用这个机会去争取国际市场。紫光文通现在正在做这方面的尝试。对此,我们满怀信心。”