
| 出版日期:2002-02-25 总期号:1095 本年期号:12 |
|
IBM与计算机进行交流
十年之后, IBM公司有希望制造出可以理解20种不同口语的设备,包括不同的口音、重音和上下文连接,可以通过它直接复制法律、医疗和法庭证据。 虽然这些工作也可以由人来完成,但是那需要薪水、午餐和医疗保险,这就是为什么IBM公司将它的新发明称作“超级人类语言识别系统”的原因了。 这个项目计划在2010年结束,项目的目标很明确——使机器的语言识别能力超过人类。 个人电脑、个人数字助理(PDA)以及移动电话实现“听说”功能已经很多年了,但是由于某些因素的制约人们很少能真正从中获益。机器在理解口音、重音特别是上下文关系方面存在困难。另外,即使最高级的技术也需要大量反复适应同样的声音才能有大幅度的进步,而市场化则需要缩短部署时间。 基于语音识别技术的产品在市场上处于领先地位已经有一段时间了,其中包括移动电话、PDA、汽车仪表板以及互动的电视等。 项目中正在解决的一个问题是音频虚拟识别,其中包括开发计算机视觉技术去改进语音识别的准确性。例如:通过拍摄驾驶员嘴唇的运动来排除道路上嘈杂的噪音干扰等。 IBM公司正在不断听取客户的需求,例如希望通过移动电话和手持设备来“听取”电子邮件。 |
|||||||||||||||||