繁体版 | 简体版 | 手机版
您当前的位置:Home> 科技前沿> 最新发现> 科技> > 正文
语音机器人的语言困局(二) 突破旧框框
时间:2013-04-23 12:49 来源:美国资讯网
字号:【
语境提醒 心中有数
研究表明,在遇到“bank”之类多义词时,人们可以从上下文中获取线索,很快锁定正合需要的那个意义:“swim”(游泳)提示河岸,而“check”(支票)则提示银行。
 
    打造交谈机器人的最初尝试简单得令人难以置信——用语法规则对机器人进行设置就大功告成了。这是IBM公司对701翻译机所采用的招数。由于冷战时期,苏联一举一动都为美国所关注,因此701在首次公开展露功夫时接受的任务就是把俄文翻成英文。1954年,介绍此项目的宣传资料解释了701 如何处理两种语言间的差异(如词序的不同)。例如,俄文的“gyeneral mayor”(少将)翻成英文是“major general”,这样,每当翻译机遇到俄文中的mayor这个词时,它便检查其前面的单词。如果正好是gyeneral,它在翻成英文时就把两个词的顺序倒过来。
    这样简单的系统居然也能玩翻译,其原因之一在于,701只认得250个俄文单词,因此识别其数据库中的每一个“形容词+名词”组合不算什么麻烦事。但许多语言都有数十万个单词,而英语的单词可能超过一百万。假设英语中一半的单词具有多种意义应该是说得过去的,不过那样一来,程序员就必须考虑 5 000亿种单词组合。如果把这些组合都写入程序,以每秒写一个组合计算,程序员要花1.6万年才能写完。
    不巧的是,短语gyeneral mayor在俄语中其实是个异类。一般说来俄语中的此类词序与英语相同,而与西班牙语这样的语言相反(西班牙语中形容词通常跟在名词后面)。对词汇量较大的翻译机来说,一个显而易见的解决方案是为它设置诸如“英语和俄语中的形容词在名词前面,而西班牙语中的形容词在名词后面”之类的规则,并附上一张例外情况的列表。这一招不仅可以大大减少规则的数量,同时也让系统能够搞定新的单词。但问题在于,解释例外的规则本身可能又有例外。科学家尚未发现一套可以完美解读英语、俄语或其他任何一种语言的抽象规则,尽管语法教科书的出版商不愿意承认这一点。
    但这些系统之所以脆弱,不仅是因为语法规则不可能做到尽善尽美,而且是因为像领悟单个词汇的意义这样看似简单的任务,其实都暗含着复杂的玄机。
 
( 编辑:admin)
    美闻网---美国生活资讯门户
    版权申明 | 关于我们 | 广告服务 | 联系我们
    ©2012-2014美闻网版权所有