[博客摘读]机器翻译的需求与发展
几种翻译需求---- 当我们讨论机器翻译系统和翻译工具的发展时,首先需要区分四种基本的翻译需求:第 一是传统型,它要求翻译结果和人(翻译家)翻得一样好,即翻译结果达到出版水平; 第二种需求对翻译质量的要求稍低一些,尤其是对文体的要求较低,用户这时最感兴趣 的是了解某篇文章的基本内容,因此希望翻译速度越快越好;第三种需求是对话双方一 对一的交谈(打电话或者在Internet聊天室里聊天)或无需写在纸上的演讲(如外交场合 的谈话);第四种需求是在信息检索、信息抽取、数据库访问等多语言系统里所需进行 的翻译。
----第一种机器翻译需求是为了传播思想。自机器翻译系统出 现之日起,这种需求可以说在某种程度上得到了满足。然而,要想达到用户需要的质量, 机器翻译输出结果常常还需要由翻译家修改或进行"后编辑"。在很多情况下,这些修 改都是必需的,因此机器翻译系统实际上只是产生了一个"草稿型"译文。如果要减少 后续的修改,就必须在翻译前对输入文件进行规整,对所用词语和句子结构进行"限制", 使机器翻译系统不至于产生太多必须修改的错误。
----第二种需求是为了了解信息而使用机器翻译系统,这一需 求实际上已经作为第一种需求的副产品得到了实现。既然机器翻译系统尚不能直接产生 高质量的译文,因此用户能从未经编辑的译文中找出或猜出他们需要的东西也是很有帮 助的,毕竟翻译出一部分总比一点没有翻译要好。在这种情况下,尽管机器翻译的译文 结果很糟糕,但随着PC价格越来越低廉,这类机器翻译系统的需求量也大大增加了。
----第三种需求是以交流信息为目的的机器翻译。由于信息更 新速度很快,不可能由人来翻译,用户需要马上得出翻译结果以便传达信息的基本内容。 例如基于Internet的在线翻译系统,它能实时进行翻译,但翻译质量难尽人意。有些机器 翻译系统目前正在探索如?quot;自然"地扮演自己的角色。另一种用于人际交流的机器翻 译系统是口语翻译系统,它可以用在电话交谈、商务会谈等场合。目前有很多专家正在 研发这类系统,其难点在于语音合成和自动翻译。这一领域的研究尽管进展缓慢,但我 们仍然可以希望将来在非常受限的领域里应用在线口语机器翻译系统。
----第四种机器翻译需求是信息访问系统提出的。在这里,机 器翻译软件被集成到一系列子系统中,这些子系统包括如下几类:
数据库的全文搜索和检索系统,一般是科学、医学和技术期刊杂志的电子版,或 文献信息检索系统;
从文本,特别是新闻报道中提取信息;
对文本进行综述的系统;
查询非文本数据库系统。
----目前,这方面有几个项目正在欧洲进行,目的是使所有欧 盟成员国都能访问数据和信息源,无论用什么源语言。
未来需求及发展
----尽管近年来针对微机和Internet的机器翻译服务有上升 趋势,但实事求是地说,还没有一个机器翻译系统特别适合于自由职业的翻译工作者, 也就是那些既不隶属于一个大公司也不在一个翻译组织里工作的人。据调查,有些翻译 工作者曾试图使用商用PC翻译软件,但需要进行"后编辑"的工作量太大,机器翻译输 出结果太差,无法满足他们的需求。尽管人们希望能针对这一潜在的大市场开发出低成 本的翻译辅助工具,例如术语协调软件、对齐软件等,但目前还没有产品面市。
----目前面临挑战的另一个应用领域是将用户的输入译成用 户所知甚少或未知的外国语,这时用户并不想充当双语翻译家的角色。机器翻译系统可 以给出大致"粗略"的译文,至少可以告诉用户大致说的是什么。但对那些不知道目标 语言的翻译,目前还没有什么解决办法。最近日本研制出一些廉价的产品,可以对特定 的"外语授权(foreign language authoring)"提供服务。例如,写一封商务信函(基于标 准短语和文件模板),但对其他领域或较长的文件,因为"规矩套路"很少,所以还不能 编写。目前有几个研究小组正在研究交互式系统,发送者按照模板要求编写文档,如果 输入文件足够"正规化",机器翻译系统就能保证语法和语言风格的正确输出。
----同样,将机器翻译技术与信息访问、信息提取和文摘软件 结合在一起的尝试也处于研究阶段,目前市场上还没有商用产品,但开发商已经意识到 其潜在的市场。例如,AVENTINUS项目是专门为警察部队在辑毒和执法方面开发的, 用欧盟任何一种语言都可以访问中央数据库并查询关于毒品、犯罪和嫌疑犯的信息。目 前,世界各国对这类跨语言应用的兴趣越来越大。最吸引人的应用是"跨语言信息检索", 即允许用户用自己的语言搜索外语数据库。在这一系统中,大部分工作集中于如何建立 和操作合适的翻译字典,以便将查询词串与数据库文档中的词和词组相匹配。相信在不 久的将来会有这方面的商用软件出现。
----未来还有一种应用是公众迫切需要的,这就是口语翻译。 但从商业角度或者研究角度看,全自动口语翻译还是一件十分遥远的事情。20世纪80年 代,语音识别和语音合成技术取得的进展使人们感到口语翻译是可行的目标。日本ATR 公司建立了一个自动语音识别中心,目标是开发一个依赖于讲话者的实时日英、英日电 话翻译系统。这一系统开始是面向旅馆预定房间和办理会议注册手续,后来增加了其他 一些口语翻译系统。JANUS系统是卡耐基梅隆大学与德国Karlsruhe公司的合作研究项 目。研究者与ATR合作形成一个合作体(C-STAR),每个研究者开发其母语(英语、 德语、日语)的识别和生成模块。
----口语翻译可能是目前机器翻译研究中最富有创新意义的 领域,吸引了最多的资金和公众注意力。但观察家们并不相信这一领域在近期能取得迅 速进展,因为书面语机器翻译花了数十年才达到现在的水平。口语翻译方面的另一项努 力始于1993年5月由德国科学技术部出资支持的VERBMOBIL项目。该项目的目标是开 发一个便携式商务谈判的辅助工具,好几所德国大学参与了这项对话语言学、言语识别 和机器翻译设计的基础性研究工作。目前系统原型的开发已经接近尾声,很快将有演示 产品出现。
人与机器翻译的比较
----审视机器翻译的发展与现状,我们可以看到,使用计算 机进行自然语言翻译并没有也不可能对职业翻译家的饭碗有什么威胁。翻译家的翻译技 巧将继续得到重视。例如,机器翻译从来没有也不敢试图涉猎文学或法律文件的翻译。 与之相对应的是,在Internet上粗略翻译电子邮件文本方面也没有什么方法能与机器翻译 相比--人在速度方面比不过机器,即使翻译家愿意承担这类毫无保留价值的并常常是 写得很差的文件的翻译工作,也难与机器翻译软件匹敌。
----我们可以根据几种翻译需求来比较人与机器翻译的相对 优缺点。对于"传播思想"的需求来说,凡是需要翻译某个特定领域(科学、技术、医 学、法律或文学)的某段特殊文字,由人工翻译的质量更可靠且成本较低。而另一方面, 机器翻译的字典维护和更新以及译后编辑需要较高的成本,因此只有当需要翻译某个领 域的大量重复性文件时才是划算的。对这类翻译任务,翻译工作者会望而却步,因为工 作量太大,且重复度太高,而且还要保持术语的一致性。简而言之,机器翻译适合于处 理大量的、重复度高的技术资料、软件本地化手册、实时天气预报等资料,而人工翻译 在语言非重复性的复杂文本方面有着无可替代的作用。
----对于为了解信息而需要翻译的情形,显然使用机器翻译比 较理想,因为此时对翻译质量要求不高。翻译家不打算而且也很反感被要求"粗略"地 翻译科学技术资料。当一个人只是想大致了解一下某篇文章的内容,并不想知道该文的 一切细节,而且他也并不讨厌看到译文文体拙劣、语法错误百出时,机器翻译足可满足 这种需求。
----对于信息交流来说,在未来的一段时间里,人工翻译在翻 译商务信函方面将继续起着主要作用,尤其是翻译那些内容比较敏感或与法律有关的文 件。但对个人信件来说,机器翻译可能会用得越来越多。而对电子邮件、网络页面的信 息提取以及基于计算机的信息服务来说,机器翻译可能是唯一可行的解决方案。
----对于口语翻译而言,口语翻译家将继续占领市场,因为还 没有迹象表明自动口语翻译会取代外交和商贸领域的口译家。尽管人们正在开展在高度 受限领域的电话翻译研究,且未来也有希望实现,但对大量电话交谈来说,不可能出现 什么系统来代替口译家。
----机器翻译系统正在开拓人工翻译从未涉及的领域:帮助需 要用外语写作的作家生成文章草稿、在线电视解说词翻译、翻译数据库信息等。也许将 来还会出现更多的新应用领域,但这些应用不会对职业翻译家构成威胁,因为这些领域 是职业翻译家未曾涉猎的。今后,机器翻译与人工翻译将会各司其职、和谐共存。
页:
[1]