
| 出版日期:2000-12-25 总期号:984 本年期号:96 |
|
目标: 交流无障碍
宋宇 2001年1月1日,“七国语言电话语音同声翻译计划”将正式启动,到2004年结束。届时,利用公共电话网络系统和国际互联网,通过移动电话、固定电话、计算机终端等设备,说中、日、英、德、意、韩、法7种不同语言的人们可以实现在旅行期间的各种场景对话。 从一看到“同声翻译计划”这个概念,就有一种说不出的振奋。如果这个计划能够实现,那么对我们每个人来说,不同语种将不再是交流的障碍,交流将变得无比自由。可是,高兴之余又不能不心存疑虑。谁都知道,机器翻译的研究进行了几十年,到今天,还是没有一个能真正满足人们需要的实用产品问世。然而,对机器翻译来说,只是将书面文字从一种语言翻译成另一种语言。毕竟,比起口语来,书面文字可要规范多了。 想想,“同声翻译计划”是要把口头语言实时地翻译成另一种语言,现在连机器翻译这种书面工作都不能尽如人意,要实时翻译口头语言,即使只是在旅行中的特定场合下,这可能吗?这究竟是个实实在在的科学计划,还是仅仅是个商业炒作呢?怀着一探究竟的心理,记者独家采访了“同声翻译计划”中方负责人中科院自动化所徐波研究员。 2004年的旅行 今年10月,国际语音翻译研究协会(C-STAR)核心会议在日本召开,经过紧张的答辩,中科院自动化所模式识别国家重点实验室正式成为“同声翻译计划”的第七个核心成员,自此,中文被纳入了国际语音互译的大家庭。谈到那次会议,徐波研究员很是自豪,“由于我们在语音识别、口语理解和翻译方面的出色工作,C-STAR经过四年多的考察才正式将中文纳入该计划,而中国是进入这一计划的惟一的发展中国家。” 徐波研究员为记者描述了2004年系统完成时的情形:两个说不同语言的人在进行通话时,主叫方只需拨通一个特定的号码,同声翻译服务中心就会自动呼叫另外一方,并将两种不同的语言进行实时翻译。现阶段,该计划主要是为了满足旅行者异国旅行的需要而开发的,因此,对话场景初步限定为预定旅馆、购买机票、餐馆对话、外币兑换等旅行中常见的场合。 实际上,同声翻译计划的核心是一种被称为“国际公共语言”的中间语言。在同声翻译系统中,每一种语言都经过语音识别技术处理成计算机可以辨认的语言,然后直接被翻译成国际公共语言,再由国际公共语言翻译成所需要的语种,最后经过语音合成后播放出来。徐波研究员认为,该计划中最重要的是国际公共语言的制定。他表示,这种语言应该是十分规范化的,只有这样,才能使千变万化的口头语言更容易翻译成另外的语种。此外,它必须具有足够强的表达能力,才能不丢失有用的信息;同时,还要兼顾每种语言的特色,使得翻译出来的语言更符合各国的文化特色;而且,要兼顾七种语言与它进行互译时的复杂程度,否则翻译的工作量服务器可就不堪承受了。 信心源于实力 对2001年正式启动的这项计划,模式识别国家实验室的研究人员信心十足。当然,信心首先源于实力。语言处理技术作为一种新兴技术,各国开始的时间都不太长,而且我国从这项技术出现伊始就投入了研究。目前,我国在语言处理领域中拥有许多领先技术。徐波研究员表示,虽然从技术上讲,集语音识别、机器翻译和语音合成于一体的直接语音翻译具有很大的挑战性,但实际上,这些都是现有技术可以解决的。即使是难度较大的机器翻译,由于界定了场合,翻译中的词汇量和语言现象大大减少,因此而变得相对简单得多。说起机器翻译,徐波研究员相信,由于有很多新算法出现,两年内自然语言翻译肯定会有重大突破。 2001年这项计划正式启动,意味着七国将根据自己在试验阶段的经验,决定选取哪些场合作为服务场景、确定研究开发的次序,以及规范中间语言,同时,还要制定每种语言与服务器之间的传输协议等。 徐波研究员认为,现阶段急需解决的技术问题有两个:一是系统对用户口语的识别能力,因为使用电话不同于非常安静的环境,会有很多环境噪声干扰系统的识别;二是可靠性问题,系统必须有足够的能力正确理解各种口音。为更好地解决这两个问题,模式识别国家重点实验室将把精力主要放在语音识别和自然语言理解两方面。 对“同声翻译计划”的市场前景,专家们非常看好,由于它无需用户端任何的硬件支持,使用现有的终端就可以接受这项服务,而不需要增加硬件支出。谈到未来的使用费,专家们认为,随着需求这种服务的用户的增加,服务费用将会变得很便宜。
“同声翻译计划”原理图 ◆小资料 国际语音翻译研究协会C-STAR(Consortium for Speech Translate Advanced Research)成立于1991年,由日本的ATR、美国的卡内基梅隆大学(CMU)和德国的Karlsruhe大学等单位发起,其目的是建立语音翻译技术的国际性合作研究关系,实现资源共享,推动语音翻译技术研究的快速发展,最终实现基于自动翻译技术的全球自由通讯。1996 年9 月,该组织发展为C-STAR Ⅱ,并拥有包括上述研究机构在内的12个国家的 20 个著名企业及研究机构作为联系会员。其中,CMU、Karlsruhe、ATR、意大利的科学技术研究所、韩国的高级网络服务技术部和法国的自动翻译研究所六家单位为核心成员。核心成员之间具有更密切的合作关系,彼此之间实现充分的数据共享,共同制定有关标准和数据格式,条件成熟时核心成员之间通过国际互联网或国际长途电话进行双向多语种之间的语音翻译联合实验。 到目前为止,C-STAR 组织已分别于1993年和1999年两次进行了语音翻译的联合实验。1996年9月,中国科学院自动化研究所模式识别国家重点实验室被邀请作为联系会员参加C-STAR Ⅱ,徐波和黄泰翼研究员以联系会员的身份先后于1996年、1998年和1999年三次参加了在日本ATR、法国Grenoble和德国Swizegen举行的C-STAR Ⅱ会员研讨会,并在会上报告、演示了研究组在“863”等项目支持下在语音识别、口语理解和翻译方面取得的成果。实验室在该领域的工作给核心会员留下了极其深刻的影响。2000年10月,经过答辩,C-STAR正式接受中科院自动化研究所模式识别国家重点实验室为第七个核心成员。 |
|||||||||||||||||