ccidnet????

出版日期:1998-11-09 总期号:342 本年期号:45

本期导读
信息综述
产品技术
行业应用
网络通信
市场研究
语音时代 越走越近

石岩、张建军


  patrick gelsinger先生



  语音技术诞生30年以来,一直处于波澜不惊的平稳发展状态。但是近两年,语音技术领域巨浪迭起,无论是在技术开发方面还是市场方面都出现了大的进展,而日前在北京举办的首届“intel '98语音技术国际论坛”更是说明了——语音时代 越走越近

  11月2日在香格里拉饭店举办的首届“intel '98语音技术国际论坛”带给每个参与者一个强烈的信息——语音时代在敲击我们的大门。这个信息通过每一位演示工程师的操作、每一台计算机的应答以及intel公司副总裁兼台式机事业部总经理patrick gelsinger先生的演讲传递给了每一个人。究竟是什么使intel公司确信语音时代的迫近?又是什么为语音技术及市场的发展提供了源动力?今天以至未来一段时间内语音技术的技术瓶颈何在?应用发展又会怎样?intel希望确立语音领域行业标准的形象吗?最重要的是:语音技术将在中国取得怎样的进展?它将给我们的生活带来怎样的影响呢?带着这些问题,记者进行了一系列采访。


  强大的源动力


  根据有关统计数据,语音识别应用软件连续几年在全球范围内取得了60%的增长率,而同期的销售额也达到了25%的平均增幅,这两个数字充分说明,语音技术及市场正在飞速发展。使语音技术和市场迅速发展的源动力是多方面的,其中既有当今技术发展的因素,也有应用和市场的因素,还有未来的前景预测带来的牵动因素。

  影响语音技术发展的最重要的技术因素是计算机的计算能力。gelsinger先生将语音技术的发展历程分成了三个15年:第一个15年是大型机的时代,那时的语音软件都在大型主机上运行,费用昂贵,难以普及;第二个15年记录了语音技术一步步走下神坛的历程,在这15年里,客户端平台逐渐获得了支持语音应用算法的能力,许多语音输入、语音控制技术在低端平台得到应用,这促进了市场对语音技术的兴趣,反过来又进一步促进了语音技术自身的发展;第三个15年是未来的15年,由于第二个15年打下的技术基础,语音技术将在这未来的15年内获得今天难以预料的发展,取得更大的市场成功,对此gelsinger先生幽默地说:“可以确信的是——未来15年内我和我的同事将非常繁忙。”

  从应用角度讲,语音技术可谓前景无限:随着网络的爆炸性扩张,电子商务获得了迅速发展的机会,于是面向电子商务的语音技术接踵而至,使用该技术可以开发集成语音功能的web浏览器或internet站点,语音将介入电子邮件,同时在网上会议的激烈讨论中,语音技术将发挥重大作用;在商业应用领域,语音技术正在为财会、广告、数据挖掘、信息管理以及出版等提供便利条件,同时它还介入了医药卫生行业;在其它方面,语音技术正在为教育培训带来方便,用户在使用图形式交互界面时的适应时间也因语音的介入而大大缩短,此外游戏也是一个重要的受益者。

  面对如此众多的应用领域,难怪intel会对语音时代的到来那么肯定,而且该公司对未来客户平台的数量发展有着非常乐观的一个估计:10亿台联网的pc。在这样巨大的一个市场面前,语音技术必将有一个非常广阔的用武之地——因为并非每个用户都善于使用键盘,鼠标又不能实现完美的输入,而语音技术的基本功能就是语音输入和语音控制。


  语音技术发展重点何在?


  谈到语音技术未来的发展重点,intel中国研究中心董事兼总经理容志诚博士向记者介绍说:“语音技术的发展重点可以从硬件和软件两个方面考虑。从硬件平台方面看,语音技术是一个计算密集型的工作,对平台的计算能力要求很高,如果研究人员在算法方面想得很深远,而平台却无法支持这些算法,那必将影响语音技术的发展水平。从软件方面看,目前计算机的听说能力并不平均,听的能力比说的能力略强一些。在听的方面,如何加强非特定人的适应能力和同一语种不同语言环境中的适应能力是亟待解决的问题;在说的方面,计算机能够组织的语言和自然语言之间还有着较大差距。这两方面缺陷的解决方案都是当今语音技术的重点发展方向。因此intel将在未来几年中着重进行更高水平算法的开发工作,同时还要确定这些算法与实际应用的结合方式。由于不认为自己可以独力完成这些工作,intel已经与7家该领域的主要研究机构确定了合作关系,并准备在今后扩大这个合作队伍。”

  对于计算机平台计算水平的发展,intel公司上海有限公司架构实验室总经理张仲先生介绍说:“平台的计算水平是语音技术发展的重要基础,因此ia结构将开发更先进的技术以支持语音技术算法的发展。到1999年上半年,ia体系在客户端的各主打产品都的性能都将得到提升,其中工作站用户将得到tanner 500mhz处理器,高性能pc的用户可以得到katmai 500mhz处理器,移动计算用户的笔记本电脑将装备移动计算专用的奔腾Ⅱ333mhz处理器,而赛扬366mhz处理器会配备给基本pc的用户。其中最吸引人的是katmai技术的出台,它在intel原有的p6总线、动态执行、mmx技术的基础上,增加了内存流架构、新的多媒体指令和并发simd-fp架构,为语音应用程序在ia架构上运行得更顺畅提供了有力保证。”


  intel将建立行业标准吗?


  intel在此次“语音技术国际论坛”上的一系列动作未免引起观者的怀疑:intel公司是否希望通过“国际语音技术研究组织”的成立,在业界建立起语音技术的行业标准,进而一匡天下,实现市场的整合呢?gelsinger先生否认了主动建立行业标准的可能性,同时也否认了推出语音应用软件产品或将语音技术整合到intel处理器中的可能性。按照他的说法,intel在语音技术领域将扮演一个技术提供者的角色,该公司在语音技术方面的任何成果都将与所有软件商共享。对于某些软件商已经拥有的语音技术内核,容志诚博士说intel不会要求他人废弃自己原有的技术,是否将intel的技术与软件商自己的技术融合以及如何融合完全是软件商自己的事情,intel不会对此置喙。容志诚博士还对行业标准问题进行了一点有趣的补充,他说:“如果我们的技术受到软件厂商和用户的广泛欢迎,使其成为标准未尝不可,就象已经成为标准的pc 99和ac '97一样。是否成为标准取决于技术的发展水平。”

  intel公司在语音技术上的这种态度,明显可以体现出其正在努力改变自己竞争形象的痕迹,正由单纯的芯片巨人向基于ia架构的全方位模块化解决方案提供商迈进,而后一种形象的树立,无疑会为intel公司在芯片市场上的成功锦上添花。



  中国市场不可小视


  在采访之初,记者就认为intel选择北京作为首届“intel '98语音技术国际论坛”的召开地点是有其特定意义的,随着采访的进行,这一猜想得到了证实。gelsinger先生说:“中国是一个空间广大而充满活力的市场,选择这里作为第一界语音技术国际论坛的召开地,表明了intel公司对这块拥有特殊语言环境的市场的重视,这也说明了为什么在intel的首批语音技术合作伙伴中有四家是中国的研究机构(中国科学院自动化所、清华大学、香港科技大学和香港中文大学),这样的组合必将加速汉语语音技术的迅速发展,为汉语用户创造良好的使用环境。”

  事实上,我国市场确实值得各大公司加以重视。根据idc(国际数据公司)的统计数据,自1996年起,我国pc出货量一直保持着超过31%的增长势头,按照这样的增长率,2000年我国pc机出货量将超过600万台,而2001年将超过800万台,是全球平均增长率的2倍。在这样庞大的市场中发展语音技术,是机会也是挑战。

  无论市场表象是机会还是挑战,对中国用户来说,发展语音技术必然是一件好事,这主要体现在两个方面:其一,语音技术第一次使计算机开始迁就人的使用习惯,改变了以往人迁就计算机的历史,对于许多在信息大潮中被卷入计算机用户行列的中国用户来说,这样的特性大大降低了计算机的使用难度,为满足更多的用户需求铺平了道路;其次是使用质量的提升,语音技术的介入使用户脱离了繁琐的使用培训,很轻易地就能够实现高速、高质量的文字输入或计算机化管理。这两个优点可以极大地方便中国用户的使用,也为该技术在中国市场的广泛应用创造了有利条件。

  目前国内有不少厂家和研究机构正在进行语音技术的研究工作,比如北京汉王科技公司采用ibm公司viavoice98平台开发的汉王听写系统、中国科学院自动化研究所的非特定人、连续语音听写系统和汉语语音人机对话系统等,其字准确率或系统响应准确率均达到90%。intel上海有限公司软件客户管理部门经理洪力先生向记者介绍说:“intel在汉语语音系统的发展中将起到一个‘搭台’的作用,也就是说与国内厂商建立合作组织,同时帮助一些国外厂商进入国内开发市场,使双方的经验、优势得到有效地融合,为用户创造更好的产品。‘搭台’——‘我搭台,你唱戏’的意思。”

  不管谁搭台、谁唱戏,在中国这块充满活力的巨大市场上,相信一定会有非常先进的语音应用技术被不断开发出来,为日益庞大的用户队伍提供新的得力工具。就象patrick gelsinger先生在演讲中所说的:“我们相信,语音技术将免除键盘给中国用户带来的诸多不便,为越来越多的中国用户打开通向计算机领域的大门。”