[转帖]机器翻译,路在何方(原发于《大众软件》2004年第2期)
机器翻译,路在何方(原发于《大众软件》2004年第2期)王槊 | 真实 | 出处:原创-IT| 2004年04月22日 02:08 | 阅读 2383 次
从头说起
机器翻译概念及原理
机器翻译(machine translation),又称机译(MT),是利用计算机把一种自然语言转变为另一种自然语言的过程。用以完成这一过程的软件叫做机器翻译系统。
目前机器翻译主要有两种形式,MT和TM。MT(machine translation)就是我们常见的基于规则的机器翻译软件,如金山快译、东方快车等,其主要用途是为了帮助英文不好的用户提供翻译参考,但准确性不高。MT的关键技术有4个方面:单词分析、语法分析、意义分析和文理分析。它的工作过程是,先把语句分成几个单词,通过存放于机器数据库内的电子字典查清词义,根据语法规则分析语句的意思,并把它变换成概念构造,然后借助语言模型生成目标语言。尽管从原理上来看,要实现这一系列步骤并不困难,但由于语言的特殊性和多样化,以及人工智能技术发展水平的限制,目前要做到不同语种间正确互译是不可能的,这也是为什么现在的机器翻译软件无法满足人们的要求,翻译出来的结果往往令人啼笑皆非的原因。
研究人员发现MT遇到的瓶颈,便决定在人工智能技术不会有重大突破的前提下,绕过技术上的难题,另辟蹊径,利用其他手段发展机器翻译,这就是TM(Translation Memory,翻译记忆),如雅信CAT、塔多思等。TM主要面向专业翻译人员和机构设计,以翻译记忆和人机交互为核心,主要是为了帮助专业翻译人员提高翻译效率,减少重复劳动,降低翻译成本,要求使用者具备独立的翻译能力。TM绕开了语言学的瓶颈,其原理是基于数据库,将翻译过的所有材料以句子为单位存入数据库。翻译时系统会自动对电子文档进行分析,100%匹配的句子可以自动替换,部分匹配的句子可根据匹配度提出翻译建议,新句子则通过系统提供的翻译建议进行人工翻译。而每次翻译又为以后积累句子。对于新用户,系统会给他提供诸多专业词库,并能将以前的翻译作品进行回收存档。科学研究表明,翻译中的重复工作量约为30%,TM翻译软件使“相同的句子永远不需要翻译第二遍”,从而提高了工作效率。
从20世纪40年代电子计算机诞生之日起,世界上的许多国家就开始了对机器翻译的研究。但是,由于受当时计算机能所限,以及这项技术本身既涉及到语言学又涉及到计算机技术,所以很长一个时期毫无建树。鉴于此,1966年美国国立科学院成立的自动语言处理咨询委员会(the Automatic Language Processing Advisory Committee)发表了一份在机器翻译界被斥为“臭名昭著”的ALPAC报告。报告中主要说的是:经过调查,机器翻译速度慢,准确率差,比人工翻译费用高得多,在近期或可以预见的未来,开发出实用的机器翻译系统是没有指望的。此报告一出,导致各国纷纷停止了对机器翻译研究的经费支持,对机器翻译研究造成了很大的损害,直到70年代中期机器翻译才开始在世界范围内复苏。虽然大多数专家学者都把“臭名昭著”这顶帽子扣在这份报告头上,但从目前机器翻译的水平来看,这份报告提出的观点似乎正是今天的现实,这不能不说很具有讽刺意义。
机器翻译在我国
我国从20世纪50年代便开始研究机器翻译,是世界上最早研究机器翻译,并拿出成果的国家之一。机器翻译研究从一开始就受到了国家的高度重视,1956年被列入当时的《科学发展纲要》,以后则列为“六五”、“七五”以及“863”等重大科研项目。
中国最早的机器翻译系统是俄汉翻译系统。据一位不愿透露姓名的中国社会科学院语言所资深专家(文中以“语言所专家”表示)回忆,由于当时与苏联交好,便把俄文翻译作为主要发展方向。最早的成果是1959年,作为建国十周年献礼,中科院语言所和计算所合作在全国仅有的一台苏联帮助制造的104型电子管计算机上翻译了10句俄语。对于现在来说,翻译10句话实在微不足道,但在当时却是迈出了非凡的第一步,因为那是中国人第一次亲手证明了计算机不仅可进行数学运算,还可进行逻辑运算。
第二套机器翻译系统仍然是俄汉翻译,主要用在机床制造领域。语言所专家表示,这反映了当时的工业水平。这个系统的辞典、语法规则都比较详细,几乎涵盖了俄语的所有语法现象。可惜的是,这套系统还没等到上机实验,“文革”开始了。直到最后,这套系统也一直也没能从文档材料变成真正的应用程序。“那套系统的语法分析水平已经相当高了,甚至比美国还要高。”老专家不无惋惜地说,“因为欧美语言之间的语法规则比较相似,很多情况下只要实现词对词翻译就可以,但中文语法与它们却千差万别,所以我们实现的难度比它们大得多。”
“文革”开始后,研究人员们上山下乡,机器翻译研究也就一直处于搁置状态,直到72年才重新开始。当时中科院、北京外国语大学、中国科技情报所以及各部委的情报部门共同参与了国内第一套英汉翻译系统的开发。这套系统被用于翻译国外文献的题录,但因为当时对英汉翻译还不熟悉,所以效果并不理想。
“文革”结束后,机器翻译的研究工作逐渐恢复正常。1980~1985年,中国社会科学院语言所与军事科学院合作开发了JFYⅢ翻译系统,这是全国第一套全文翻译系统,主要用于军事科学用语的翻译。这套系统获得了国家科技进步二等奖和军内进步二等奖。80年代末,研究人员在这套系统的基础上加入了大容量词典,并在语法上进行了一些改动,最后卖给了中软公司,这就是译星的前身。从20世纪90年代初译星商品化的成功开始,中国的机器翻译界开始逐步进入发展热潮期。
热潮的兴起
现在回顾机器翻译在国内的发展轨迹,可以发现90年代那股热潮的形成并非偶然。我们可以发现,这个行业一直在和中国的IT业共同发展前进。
译星最先迈出了中国机器翻译软件商品化的第一步,接着,中科院软件所的“863”成果--智能型英汉机器翻译系统(即快译通)以470万美元的价格卖给了香港权智集团。两次市场运作的成功对于国产软件商品化具有开拓性的意义,它们极大地刺激了整个国内软件市场,也为日后机器翻译形成行业起了很大的推进作用。
技术角度上,无论是国内还是国外,那段时间都处在一个技术思潮的攀升阶段。“当时机器翻译的整体水平在世界范围内都上了一个新台阶。”微软亚洲研究院自然语言组主任研究员周明博士说。“以前的机器翻译软件都没有图形用户界面,即使用户有需要,繁琐的命令行界面也让大部份人望而却步。随着软件业逐渐成熟,图形界面给了用户极大的方便。因为界面友好,软件变得易于使用,就算技术上没有真正的创新,也会让人们更加乐于接受。”
计算机在国内的逐渐普及,给机器翻译的发展创造了条件。语言所专家对记者说:“20世纪80年代末,90年代初是中国计算机发展的一次商业运作高潮期,个人电脑从那个时候开始出现在人们眼中。由于当时计算机对人们来说还非常神秘,人们对计算机的认识还很肤浅。机器翻译软件的出现,使人们第一次知道计算机还能做这样的工作,以为能够完全能代替人来完成翻译工作。”然而,对计算机产品不了解并不能怪在国人头上,他说:“那时候想买计算机是很困难的,甚至需要特批。北京当时根本买不到,我们在深圳和广州等了一个多月,才弄到四台286,对于普通百姓来说,就更不用指望了。”所以,一旦出现一个突破口,人们对新鲜事物的好奇心,对知识的渴求,以及对高新技术强烈的求知欲必然造就一个井喷式的发展状态。
从国内的大环境来看,当时又逢互联网刚刚在国内兴起,中文信息还很少,用户非常需要翻译软件来辅助他们快速阅读英文信息。而像PHOTOSHOP、3DSMAX、COREDRAW、AUTOCAD等大型软件在国内还没有中文版,对于英文水平不高的用户来说,只能通过第三方途径将其汉化才能正常使用。
然而,在某种程度上,这种发展带来的影响未必是积极的。人们的计算机知识水平并不一定会随计算机的普及而上升,突如其来的所谓知识风暴很可能让人们把原本就神秘的计算机看得更加神化。正如这位专家所说,人们以为计算机什么都能做到,以为机器翻译软件完全可以代替人的工作。这样,如果机器翻译一旦达不到人们想象的水平,人们对它的信心就会一落千丈,而事实也证明了这一点,这将在下面的文章中逐步说明。
盛极而衰?
当译星们掘到第一桶金的时候,软件厂商们尝到了机器翻译软件市场的甜头。我们经常看见这样一种现象,一旦出现一个能赚取利润的点,许多厂商便一拥而上,全然不顾自己的技术水平和市场的消化能力。交大铭泰信息本地化事业部的副总经理闫栗丽在接受记者采访时说:“在机器翻译软件最高潮的时期,各厂家为了争夺市场,采用一些过分的宣传误导了用户,有的甚至说自己的翻译准确性达到了90%以上,这导致了用户对翻译软件期望过高,而实际使用时又失望过大,用户对机器翻译软件产生了不信任感,导致整体市场口碑下降,用户满意度越来越低。”
机器翻译作为一门横跨语言学与计算机技术的边缘学科,不是每个厂商都有能力开发的,但市场上满天飞的机译软件又是哪来的?语言所专家透露,其实很多软件都是厂商请研究所帮助开发的,经过一些后期加工,换个界面,打上公司的标识,就堂而皇之地摆上了货架。
据那位专家回忆,当年北京高立公司请他主持开发了一套机器翻译软件,该软件是国内第二套全文翻译系统(第一套是译星)。高立公司靠这套软件赚了五六十万,接着又以15万美元的价格将该软件的非买断使用权卖给了香港伟易达公司。后来国家星火计划看中高立公司的发展前景,贷款120万给它。然而高立并没有把这笔钱花在继续研究这套软件上,而是投资做了出租汽车公司。再后来因为内部原因,高立公司解散,软件也就没再做下去。这是一个典型事例,一些厂商并不是为发展技术而做产品,而是只把眼光放在赢利上,什么赚钱就投资做什么,等到钱赚够了,公司或者停滞不前,或者把眼光投到其他更能赚钱的项目上去。即使在今天,这种情况也并不少见。
雪上加霜的是,20世纪90年代是盗版软件在国内横行的高峰期。盗版直接损害了开发商的利益,正版软件销量的影响导致开发商没有足够的资金投入做出更好的产品。闫栗丽说:“市场竞争在1998年到了白热化程度,1999年底开始恶性竞争,厂商不得已打起了价格战。一些实力薄弱的公司无力支撑,退出市场。而剩下的公司虽然保住了市场份额,但由于破坏了正常的价格体系,市场整体的价值减少,相对成本提高,利润越来越低,在这种情况下,开发商对市场调研和技术创新的投入都要缩减,产品的进步自然也就越来越小。”
另一个很严重的问题是市场需求与研究水平不成正比,“现在的市场没有当时那么热,一个很大的原因是有很多更新鲜的东西吸引消费者的眼球。当时的软件种类很少,每推出一种就会受到很多关注,现在就不同了。”周明博士谈到这一点时表示。“但是,这也与用户眼光的提高有关。这些年机器翻译的水平并没有明显提高,与20世纪90年代相比,那个时候水平比较低,技术上一个台阶是比较容易的,现在想要再上一个台阶就难了。”当人们发现机器翻译根本达不到自己的理想,这个市场自然也就被冷落了。
机器翻译技术本身存在的问题是阻碍其发展的硬伤。目前不仅在中国,整个世界范围内机器翻译技术都没有很大的突破。试图用机器通过有限的规则和语料提高翻译准确性,在短期内无法实现。在语言智能化研究理论不成熟的情况下,MT软件研究在技术上碰到瓶颈,无法解决一个单词在不同语言环境下的词义选择问题,同样也无法在复杂多变的语境中正确选择语法规则,因此,翻译水平无法实现明显提高。我国著名计算语言学与机器翻译专家董振东说:“人尚且做不到什么都能翻译,何况机器。专业翻译人员,包括一些有名的翻译家都会在翻译上犯错误,只是人类会掩盖,即使翻译出来的东西是错误的,他也会保持语句的通顺,给人正确的感觉。而机器不会这么做,有什么错误都会直接显示出来,这也是机器翻译让人感觉错误百出的原因之一。”
从行业的角度,闫栗丽说:“虽然每年国家和开发机器翻译软件的企业都在投入大量的经费进行机器翻译研究,但是科研机构的研究大多偏重于理论,很少有实际成果应用于市场,而企业自己投入研发的经费也有限,大家各自为政,都在重复地进行低水平投入,技术彼此都不公开,各自为政,技术成长缓慢。语言研究是一个需要庞大投入的工程,单纯依靠算法的改进是无法实现实质性的技术突破的,需要大量的人力物力进行语料整理、加工和分析,所以,如果没有统筹规划和庞大的资金支持,很难真正实现质的飞跃。”
路在何方
“机器翻译的发展已经进入了一个误区,各级人员之间都是脱节的。研究人员只管研究,不去考虑用户需要什么,只想着把一切都做得大而全。用户只管使用软件,并不关心技术上的细节;而上层为研究工作投资的一方对技术也不了解,结果往往就是听见用户抱怨软件不好用。” 董振东对记者说。“所以在一次会议上,我提出研究人员应该到用户中去,了解他们到底需要什么,从研究角度进行技术重组,而不应该一味地研究技术。对于翻译人员来说,他们需要的是帮助,而不是引导。机器应该充当的是跨语种信息处理工具,而不是代替人进行自动翻译的工具。”
发挥机器翻译的自身优势也是决定机器翻译未来走向的重要因素之一。机器翻译的质量虽然不能和人相提并论,但有许多优势是人所不具备的,最有趣的例子是前不久,董振东先生告诉记者:美国要开发一种口语翻译机,专门用来审讯与美国人语言不通的塔利班俘虏。如果用人来做翻译,由于语言不通,即使翻译被塔利班收买,对美国人信口胡说,美国人也不会知道,而机器就不可能出现这种情况。这机器现在有没有发明出来,能到什么翻译水平还不得而知,但这至少是一个相当好的发展领域。此外随着计算机处理速度的不断上升,更多优点正在被逐渐体现出来。比如计算机在翻译一些固定格式的文档时,可以自动将内容按照格式输入,并且可以生成多种语言,在这一点上,人肯定无法与机器相比。
利用现有技术,充分结合市场
国内机器翻译的现有技术水平并不比国外差,但为什么国外的一些翻译产品,如德国塔多思(TRADOS)能在国际上处于领先地位?塔多思是典型的TM类软件,其核心产品Translator's Workbench(翻译工作平台)直接和微软Word集成,界面友好,此外还有强大的网络共享、术语管理、翻译项目管理,以及格式转换处理功能,为专业翻译领域提供了一整套解决方案。它们按照专业细分市场,为不同的客户进行定制翻译,这正是国内机器翻译行业的薄弱之处。几乎所有的厂商和研究机构都在追求大而全,以为能够满足各种客户的需求,其实不然,这不仅是博而不精,而且也造成了资源的浪费。董振东说:“现在大家都不划分市场,却反过来打价格战,打来打去最后把自己给封杀了。其实现在国内本化市场很大,把市场切碎,对目标进行细化是非常必要的,这正是国外软件的成功之处。翻译人员不是万能的,他可能只翻译法律,或者只翻译医学,所以只要按照用户的需求进行开发,就会收到很好的效果,又能避免资源浪费。”
从技术上来说,TRADOS能做到的,我们完全能做到,但它的成功并不仅仅是靠技术,而是其按专业定制,细分市场的营销模式。董振东说:“机器翻译系统说到底还是应用系统,就是应该把我们现有的技术让人们应用起来,没有用到的技术就真的是没有用的技术,金子只有被放在市场上才能体现出价值。这和单纯发展理论不同,研究人员不仅应该知道怎么去研究,还要知道用户需要什么,根据用户需要的改变随时改变自己的研究方向,要学会培育市场,引导市场。加入WTO之后,市场的面变宽了,现在最重要的就是把我们现有的技术优势发挥出来,进行重组,而不是什么都做。机器翻译这个行业一定要先开拓市场,让市场形成良性循环,而不应该一味地向国家伸手要钱,久而久之这样下去,国家就会对此失望。”
周明也表示,应当把技术和应用相结合,关键是如何把现有资源利用起来。用户考虑的方面有很多,价钱、方便性和需要程度等。中国的人口基数虽然很大,但真正对此有需求的人并不多。只有十分需要或者十分便宜,才有购买的可能。中国人对价钱比较在意,而且有从众心理,如果大家都买,自己也要买。但这不意味着要打价格战,价格战不利于市场的良性发展,质量、服务和信誉度才最被用户看重。高端产品取决于软件水平,而低端则取决于价格,做好低端市场是非常必要的。在线翻译是一个很重要的发展趋势,虽然在国内愿意付钱使用这项服务的人还不多,但如果解决了收费问题,这种不需要个人进行维护的翻译系统的前景还是十分被看好的。他认为,随着中外交流的发展,中国GDP的持续增长,PC和手机用户的增加,internet的高速发展,语言翻译、手机翻译、互联网翻译(电子邮件、跨语言的查找和搜索引擎结果的翻译等等)、多语言写作和生成技术等等的需求会持续增加。这样,随着市场和收费系统的完善,翻译软件的销量会大幅度提高。
语言所专家指出,机器翻译市场必须要有正规的运作方式,一定要建立起自己的营销系统,并且要依靠大公司,否则肯定做不成大买卖。而翻译系统商品化的同时,研究方面仍然要继续。另外,要集中人力、物力、财力,把劲使到一处。这种探索性科学项目为了能够保证长期运作,必须要有国家资助,而且国家的投资应该投到专项上,并要清楚地知道,这笔投资应该用在哪,怎么用。中国的翻译软件和技术要想有更大的发展,就要培育产业。目前中国要迅速国际化、要很好迎接国际公司进入,最重要的途径就是发展本地产业,本地产业是否发达直接影响国家的综合竞争实力。通过改变营销和服务模式,使得用户可以更方便快速获得更为优质的服务,从而推动整个业界的创新和革命。
技术上如何突破
在现有的技术条件下,比较现实的解决方案是发展通过基于统计或基于实例的机器翻译方法。基于统计的机器翻译把机器翻译看成一个信息传输的过程,用一种信道模型对机器翻译进行解释。假设目标语言文本T是由一段源语言文本S经过某种编码得到的,那么翻译的目标就是要将T还原成S,这也就是一个解码的过程。基于统计的方法不需要对大量知识的依赖,直接靠统计结果消除歧义和选择译文,避开了语言理解的诸多难题。基于实例的机器翻译(如雅信CAT)是不通过深层的分析,而仅仅通过已有的经验知识,通过类比原理进行翻译。人类的翻译过程是首先正确分解输入句子,将句子分解为短语碎片,接着把这些短语碎片译成其他语言的短语,最后把这些短语合并成长句。每个短语碎片采取类比的原则进行翻译。这一方法的基本原理是:系统的主要知识源是双语对照的翻译实例库,每当输入一个源语言句子S时,系统找出和S最为相似的句子S',并模仿S'的译文T'构成S的译文T然后输出。基于实例的机器翻译方法具有以下一些优点:系统中知识以翻译实例和语义词典等形式存在,可以很容易地利用增加实例和词汇的方式扩充系统;在利用了较大的翻译实例库,或者输入能和实例精确匹配时容易产生高质量的译文只要记忆库中存在外形同输入相似的句子,就可以进行匹配。而从语料库中获取的知识颗粒度比较小,对自然语言的刻画更为细腻、真实和准确。基于统计的机器翻译方法和基于实例的机器翻译方法都是使用语料库作为翻译知识的来源。机器翻译经过这么多年的发展积累,大规模语料库的获得要比以前容易得多,所以只要保持对翻译数据库的更新和维护,翻译效果就会随使用的时间增长而逐步提高。
虽然基于统计和基于实例的机器翻译实现起来相对容易,但终究不是从机器翻译的根本——人工智能技术上解决问题。“假设要从人工智能上有所突破,那只能在神经网络和模糊计算上寻找出路。”语言所专家这样告诉记者。神经网络是通过对人脑的基本单元---神经元的建模和联结,来探索模拟人脑神经系统功能的模型,并研制一种具有学习、联想、记忆和模式识别等智能信息处理功能的人工系统。神经网络的主要特征是:有大规模的并行处理和分布式的信息存储能力,有良好的自适应、自组织性,以及很强的学习功能、联想功能和容错功能。与当今的冯.诺依曼式计算机相比,更加接近人脑的信息处理模式。模糊计算则是描述模糊现象和处理模糊信息的计算方法。它把信息原来“是”或“非”的不确定性,转换为“一定程度”的“是”或“非”的确定性,例如:“高与矮”、“厚与薄”、“冷与热”、“年轻与年老”,这些非量化的模糊信息,在模糊技术中用一个叫隶属值的基本单位来表述。对不同高矮、厚薄、冷热及年轻的“程度”,给出不同的隶属值,这样便可用定量的数学方法来表述和处理模糊信息。电脑不能处理非量化的模糊信息,是因为电脑依据的传统运算方法无法描述事物的模糊概念。人脑的模糊思维为电脑的发展提供了活的样板。为了探索人工智能,使电脑模仿人脑,进行更多的智力劳动,模糊计算便应运而生。可以看见,两者都是通过对人脑的结构和推理方式的模拟来实现计算机的智能化。“只有人脑才能和人脑相比”——这看似废话,对于机器翻译来说,却是技术上真正意义的突破口。
用户如何选择
我们把用户分成两种,普通用户和专业翻译人员。普通用户不希望使用相对复杂的TM,不想自己创建翻译数据库;他们不需要计算百分之几的准确率,只是想汉化一些非中文版的软件,简单翻译一下外国网站,或者简要了解一篇文章的大概意思,对于这类用户,金山词霸、东方快车一类的MT软件仍然是他们关心的对象。对于如何为这些用户解决问题,金山公司表示,2004年第二季度会推出新版金山快译和金山词霸。金山快译会加入更多的语法和语境分析,但与过去的产品相比,翻译效果不会有质的变化,原因仍然是业界整体技术水平没有提高;而交大铭泰则表示将保留东方快车、东方大典等产品线,但未透露何时推出新品,也未透露技术细节。铭泰强调的是面向不同用户,产品各有侧重点,但因为单机软件的利润比较低,所以未来将以为企业和厂商提供翻译解决方案为主要方向。按照厂商的话来理解,这类用户似乎只有3种选择:要么转而使用TM,要么继续忍受不能令人满意的翻译结果并等待技术上的突破,要么就用词典软件的屏幕取词。总之,在人工智能没有达到理想的高度之前,谁也没办法解决这个问题。作为业内资深专家,董振东也表示,MT类软件的翻译效果会随着技术逐渐提高而有一定改进,但不要指望会很快见到很大的提升。MT类软件还是有自己市场的,用户选择购买何种翻译软件,取决于用户的需求。作为普通用户,虽然准确性不高,但简单易用的MT类软件更适合他们。而对于专业翻译人员,他们需要更方便的辅助翻译工具,所以功能丰富,语料库庞大的TM是不二之选。这里并不存在孰优孰劣的问题,任何一种软件,只要能满足某一部分人需求就是好东西。
尾声
在本文写作之初,董振东先生曾对记者说:“媒体对机器翻译关注的角度该改变了,不要总是摆事实。可以说机器翻译现在的水平与10年前并没有多少提高,10年后可能还是如此。可是消费者们不了解这个,看见媒体报道之后,发现技术没有进步,就会感到失望,更不会买产品了,这样对这个行业永远也不会有帮助。作为媒体,应该与厂商和用户形成良性循环,起到一个正确引导的作用,共同解决现有的问题。”
董振东先生所说的话是很有道理的,行业的发展离不开媒体的关注。然而,记者看到的却是,机器翻译的声音似乎已经在媒体上消失很久了。
最后我必须要说的是,感谢所有接受采访的专家。感谢董振东先生拿出午休时间接受记者采访;感谢中国社会科学院语言所的傅爱萍女士为记者引见了那位中国机器翻译界的老前辈;感谢那位不愿透露姓名的老专家用宝贵的周末休息时间与记者畅谈;感谢微软亚洲研究院的周明博士百忙之中抽出时间耐心为记者解答疑问;感谢交大铭泰的闫栗丽女士在第一时间回答了记者所有问题。另外还要感谢中文信息学会的秘书长曹右琦女士为记者联系了以上接受采访的专家们。
http://home.donews.com/donews/article/6/61904.html
[转帖]机器翻译,路在何方(原发于《大众软件》2004年第2期)
不要用计算机的短处与人的长处去比拼,应该是机器翻译研究方向的一个指导准则。人工智能技术是对人的长处的模拟,这还不是现阶段计算机的水平所能达到的。基于统计和基于实例的机器翻译技术应该是现阶段发挥计算机长处的两条坦途,但是这并不能突破机器翻译的瓶颈。所以正如文中所言,如何利用现有的机器翻译的技术特点去寻找适当的应用应该是做机器翻译研究的人们需要关注的一个重要的方面。对市场和用户的关注,尤其是对互联网的各种应用的观察和探究会给我们一定的启示吧。页:
[1]