机器翻译,有时简称为MT(不要与计算机辅助翻译,机助人译(MAHT)或交互式翻译 混淆),是计算语言学的一个子领域,它研究如何使用软件将文本或语音从一种语言翻译到另一种语言。
在基本层面上,机器翻译用一种语言中的单词简单地替换另一种语言中的单词,但仅凭这一点通常无法产生良好的文本翻译,因为需要对目标语言中的完整短语和最接近的短语进行识别。用语料库统计和神经技术解决这个问题的领域正在快速发展,它带来了更好的翻译、处理类型语言学的差异、习语的翻译和异常的隔离。[1]
当前的机器翻译软件通常允许按领域或专业进行定制(如天气预报),通过限制允许的替代范围来提高输出。这种技术在使用正式或公式化语言的领域特别有效。因此,政府和法律文件的机器翻译比对话或不太标准化的文本更容易产生有用的输出。
提高输出质量也可以通过人工干预来实现:例如,如果用户已经明确识别出文本中哪些单词是专有名称,一些系统就能够更准确地翻译。在这些技术的帮助下,机器翻译被证明是一种帮助人类翻译的有用工具,并且在非常有限的情况下,甚至可以产生可以原样的输出(例如天气报告)。
机器翻译的进展和潜力在历史上一直备受争议。自20世纪50年代以来,许多学者质疑实现高质量全自动机器翻译的可能性,首先是Yehoshua Bar-Hillel 。[2]一些评论家声称翻译过程自动化在原则上存在障碍。[3]
机器翻译的想法可以追溯到17世纪。1629年,勒内·笛卡尔提出了一种通用语言,在不同语言中的等效使用同一个符号。[4]“机器翻译”领域出现在瓦伦·韦弗[5]翻译备忘录(1949年)。该领域的第一位研究人员叶霍萨·巴尔-希勒尔(Yehosha Bar-Hillel)在麻省理工学院开始了他的研究(1951年)。乔治敦大学MT研究小组随后(1951年)在1954年公开展示了它的乔治敦-IBM实验系统。MT研究项目在日本和俄罗斯(1955年)出现,[6][7]第一次MT会议于1956年在伦敦举行。[8][9]随着美国机器翻译和计算语言学协会(1962年)的成立和国家科学院(1964年)成立自动语言处理咨询委员会(ALPAC)来研究机器翻译,研究人员陆续加入该领域。然而,ALPAC报告(1966年)发现长达十年的研究没有达到预期,真正的进展要慢得多,资金大大减少。[10]根据国防研究和工程局局长(DDR & E)1972年的一份报告,在一次冲突中,Logos MT系统成功地将军事手册翻译成越南语,从而重新确立了大规模MT的可行性。
法国纺织研究所还使用机器翻译将摘录翻译成法语、英语、德语和西班牙语(1970年);布里格姆·扬大学开始了一个通过自动翻译来翻译摩门教文本的项目(1971年);施乐公司利用SYSTRAN翻译技术手册(1978年)。从20世纪80年代末开始,如计算能力的增加和成本的便宜,人们对机器翻译的统计模型越来越感兴趣。各种机器翻译公司纷纷成立,包括Trados (1984年),它是第一个开发和营销翻译记忆技术的公司(1989年)。哈尔科夫国立大学开发了第一个俄语/英语/德语-乌克兰语商业机器翻译系统(1991年)。
网络上的机器翻译始于SYSTRAN提供小文本的免费翻译(1996年),随后是AltaVista·巴别尔菲什,其每天能收到50万个请求(1997年)。Franz Josef Och(谷歌未来的翻译开发主管)赢得了DARPA的speed MT竞赛(2003年)。在此期间,更多的创新包括MOSES、开源统计MT引擎(2007)、日本手机的文本/短信翻译服务(2008)和内置英语、日语和汉语语音到语音翻译功能的手机(2009)。最近,谷歌宣布Google翻译翻译大致足够一天(2012年)完成100万本书的翻译。
早在1946年, A. D. Booth 和其他人就提出了使用数字计算机翻译自然语言的想法。瓦伦·韦弗在1949年写了一份重要的备忘录“译本”。乔治敦实验绝不是第一个这样的应用,1954年在伯克贝克学院 (伦敦大学)的APEXC 机器上演示了英语到法语的初步翻译。当时发表了几篇关于这个主题的论文,甚至在流行杂志上也发表了一些文章(例如,Clow和Zacharov在1955年9月的“无线世界”杂志上发表了一篇文章)中。当时伯克贝克学院也开创了一个类似的应用,通过计算机阅读和编写盲文文本。
人类的翻译过程可以描述为:
在这个表面上简单的过程背后是一个复杂的认知操作。要完全理解源文本的含义,译者必须解释和分析文本的所有特征,这一过程需要深入了解语法、语义、语法、习语等,还有源语言以及其使用者的文化。译者需要同样深入的知识来重新编码目标语言的意思。
机器翻译面临的挑战是:如何给计算机编程,使其像人一样“理解”文本,并以目标语言“创造”一个听起来好像是一个人写的新的文本。
在其最普遍的应用中,这超出了当前的技术。尽管它工作得快得多,但是没有人参与的自动化翻译程序或过程,甚至不能产生接近人类译者所能产生的质量的输出。然而,它能做的是提供一个通用的,虽然不完美的,原始文本的近似,得到它的“要点”(一个叫做“注册”的过程)。这对于许多目的来说都是足够的,包括保证在一些苛求正确率的情况下,充分利用翻译人员有限而昂贵的时间。
这个问题可以通过多种方式来解决,通过这些方式的演变可以使精度得到提高。
机器翻译可以使用基于语言规则的方法,这意味着单词将以语言方式翻译——目标语言中最合适的(口头)单词将替换源语言中的单词。
人们经常认为机器翻译的成功需要首先解决自然语言理解问题。[11]
通常,基于规则的方法解析文本,通常需要创建一个中间的符号表示,从中生成目标语言的文本。根据中间表示的性质,一种方法被描述为语际机器翻译或基于转移的机器翻译。这些方法需要大量具有形态学、句法和语义信息的词典和大量规则集。
给定足够的数据,机器翻译程序通常足以让一种语言的母语人士理解另一种母语人士所写内容的大致意思。困难在于获得足够的正确类型的数据来支持特定的方法。例如,统计方法工作所需的大量多语言语料库对于基于语法的方法来说是不必要的。但是,语法方法需要一个熟练的语言学家来仔细设计他们使用的语法。
为了在密切相关的语言之间进行翻译,可以使用被称为基于规则的机器翻译的技术。
基于规则的机器翻译范例包括基于转移的机器翻译、语际机器翻译和基于词典的机器翻译范例。这种类型的翻译主要用于创建词典和语法程序。与其他方法不同,基于规则的机器翻译使用两种语言的形态和句法规则以及语义分析,涉及更多关于源语言和目标语言的语言学信息。基本方法包括使用源语言的解析器和分析器、目标语言的生成器和实际翻译的转移词典将输入句子的结构与输出句子的结构联系起来,为目标语言提供生成器,并为实际翻译提供一个转移词典。基于规则的机器翻译最大的缺点是一切都必须明确:为了应对这种情况,拼写变化和错误输入必须成为源语言分析器的一部分,并且必须为所有歧义情况编写词汇选择规则。适应新领域本身并不难,因为核心语法在不同领域是相同的,特定领域的调整仅限于词汇选择调整。
基于转移的机器翻译
基于转移的机器翻译类似于语际机器翻译,因为它从模拟原始句子含义的中间表示创建翻译。与语际翻译不同,它部分依赖于翻译中涉及的语言对。
语际
语际机器翻译是一种基于规则的机器翻译方法。在这种方法中,源语言,即要翻译的文本,被转换成语际语言,即独立于任何语言的“语言中性”表示。然后从语际中生成目标语言。这个系统的一个主要优点是随着目标语言数量的增加,中间语言变得更有价值。然而,唯一在商业层面上运行的语际机器翻译系统是康德系统(Nyberg和Mitamura,1992),该系统旨在将卡特彼勒技术英语(CTE)翻译成其他语言。
基于词典的
机器翻译可以使用基于字典条目的方法,这意味着单词将被字典翻译。
统计机器翻译尝试使用基于双语语料库的统计方法生成翻译,如加拿大议会议事录语料库,加拿大议会的英法记录和欧洲议会的记录EUROPARL。如果有这样的语料库,翻译相似的文本可以取得很好的效果,但是这样的语料库对许多语言对来说仍然很少见。第一个统计机器翻译软件是IBM的CANDIDE。谷歌过去几年使用SYSTRAN,但在2007年10月转而使用统计翻译方法。[12]2005年,谷歌使用联合国材料中的大约2 000亿字来培训其系统以提高内部翻译能力,翻译准确性提高。[13]谷歌翻译(Google Translate)和类似的统计翻译程序通过检测数亿份以前由人类翻译的文档中的模式,并根据这些发现进行智能猜测来工作。一般来说,给定语言的人工翻译文档越多,翻译质量就越可能好。[14]统计机器翻译的新方法,如METIS II和PRESEMT使用最小语料库大小,而不是侧重于通过模式识别推导句法结构。随着进一步的发展,可能允许统计机器翻译在单语文本语料库的基础上进行。[15]SMT最大的缺点包括对大量的平行文本的依赖,和在词法丰富的语言(尤其是翻译成这种语言)方面的问题,并且它无法纠正单例错误。
基于实例的机器翻译(EBMT)方法是由高娜在1984年提出的。[16][17]基于示例的机器翻译基于类比的思想。在这种方法中,使用的语料库是包含已经翻译的文本的语料库。给定一个要翻译的句子,从这个语料库中选择包含相似子句子成分的句子。[18]然后用类似的句子将原句子的子句子成分翻译成目标语言,之后这些短语组合在一起形成一个完整的翻译。
混合机器翻译(HMT)利用了统计和基于规则的翻译方法的优势。[19]几个混合机器翻译组织声称它们使用了规则和统计的混合方法。这些方法有许多不同之处:
最近,随着神经机器翻译的出现,一种结合了规则、统计和神经机器翻译的新版本的混合机器翻译正在出现。该方法允许在规则引导的工作流中受益于预处理和后处理,以及受益于NMT和SMT。缺点是固有的复杂性,这使得该方法只适用于特定的用例。对于复杂的用例,这种方法的支持者之一是Omniscien技术公司。
作为一种基于深度学习的机器翻译方法,神经机器翻译近年来取得了快速进展,谷歌宣布其翻译服务现在使用这项技术优于其以前的统计方法。[20]
消除歧义关心的是当一个词有不止一个意思时,找到一个合适的翻译。这个问题最早是在20世纪50年代由Yehoshua Bar-Hillel。[21]他指出,如果没有“通用百科全书”,机器永远无法区分一个单词的两种含义。[22]今天有许多方法可以克服这个问题。它们可以大致分为“浅”方法和“深”方法。
“浅”方法假设对文本一无所知。他们简单地将统计方法应用于歧义词周围的词。深”方法假定对这个词有全面的了解。迄今为止,“浅”方法更成功。[23]
克劳德·皮龙(Claude Piron)是联合国和世界卫生组织的长期翻译,他写道,机器翻译在最好的情况下,可以自动化翻译工作中较容易的部分;更困难和更费时的部分通常包括做大量的研究来解决源文本中的歧义,这是目标语言的语法和词汇迫切需要解决的:
理想的“深”方法需要翻译软件自己做这种歧义消除所需的所有研究;但这将需要比目前更高程度的人工智能。一种“浅”方法,即只简单地猜测皮龙提到的模糊英语短语的含义(也许基于给定语料库中更经常提到的战俘集中营),有合理的机会相当频繁地猜错。根据皮龙的估计,一种涉及“询问用户每一个模糊之处”的“浅”方法只能使专业翻译工作的25%自动化,而剩下的75%更难由人类完成。
机器翻译的一个主要缺陷是它不能以与标准语言相同的精度翻译非标准语言。基于启发式或统计的机器翻译以语言的标准形式从各种来源获取输入。基于规则的翻译本质上不包括常见的非标准用法。这导致从方言源到口语的翻译出现错误。在移动设备中使用机器翻译时,对临时口头翻译的限制提出了一些问题。。
狭义的命名实体是指现实世界中的具体或抽象实体,包括人、组织、公司、场所等。也指时间、空间、数量,如2011年7月1日、79.99美元等。[25]
命名实体出现在统计机器翻译中分析的文本中。在处理命名实体时出现的最初困难是简单地在文本中识别它们。考虑一个特定语言中常见的名称列表来说明这一点——最常见的名称因语言而异,并且也在不断变化。如果机器翻译器无法识别命名实体,它们可能会被错误地翻译为普通名词,这很可能不会影响翻译的 BLUE 评级,但会改变文本的人类可读性。[26]也有可能在未被识别时,命名实体将从输出翻译中被省略,这也将影响文本和消息的可读性。
处理命名实体的另一种方法是使用音译而不是翻译,这意味着你可以找到目标语言中与源语言中的名称最接近的字母。已经有人试图通过在翻译过程中添加音译步骤来将这一点结合到机器翻译中。然而,这些尝试仍然有其问题,甚至认为会降低翻译质量。[27]命名实体仍然被错误地识别,单词在应该音译的时候没有被音译,在不应该音译的时候被音译。例如,对于“南加州”,第一个词应该直接翻译,而第二个词应该音译。然而,机器通常会音译两者,因为它们将它们视为一个实体。像这样的单词对机器翻译者来说很难处理,即使是那些有音译成分的。
人们认识到,缺乏对命名实体翻译问题的关注,除了为命名实体翻译创建一个良好的系统的复杂性之外,还可能是由于缺乏用于这项任务的资源。命名实体翻译的一种方法是音译而不是翻译这些单词。第二是创建一个“不翻译”列表,它有相同的最终目标——音译与翻译。[28]然而,这两种方法仍然依赖于命名实体的正确识别。
成功命名实体翻译的第三种方法是基于类的模型。在此方法中,命名实体被令牌替换,以表示它们所属的类。例如,“特德”和“埃里卡”都将被“人”类标记替换。通过这种方式,可以分析人名的统计分布和使用,而不是单独查看“特德”和“埃里卡”的分布。基于类的模型解决的一个问题是特定语言中给定名称的概率不会影响翻译的分配概率。斯坦福大学(Stanford)关于改进这一翻译领域的研究给出了一些例子,由于训练数据中每个名字出现的次数不同,英语中作为目标语言的“大卫要去散步”和“安吉要去散步”会有不同的概率。斯坦福的同一项研究(以及其他改进命名识别翻译的尝试)的一个令人沮丧的结果是,许多时候,包含命名实体翻译方法会导致翻译的 BLUE 分数下降。[28]
本体是知识的形式表示,包括在一个领域中的概念(如对象、过程等)以及它们之间的一些关系。如果存储的信息是语言性质的,可以说是词典。[32]在 NLP 中,本体可以用作机器翻译系统的知识来源。通过访问大型知识库,系统可以自行解决许多(尤其是词汇)歧义。在以下经典例子中,作为人类,我们能够根据上下文解释介词短语,因为我们使用存储在词典中的世界知识:
"我用显微镜/望远镜/双筒望远镜看到了一个人/一颗星/一个分子."[32]
机器翻译系统最初无法区分含义,因为语法不变。然而,有了一个足够大的本体作为知识的来源,就可以减少在特定上下文中对歧义词的可能解释。自然语言处理中本体的其他使用领域包括信息检索、信息提取和文本摘要。[32]
1993年为基于PANGLOSS知识的机器翻译系统生成的本体可以作为如何编译用于 NLP 目的的本体的示例:[33]
虽然没有系统提供无限制文本的全自动高质量机器翻译的法宝,但许多全自动系统产生合理的输出。[34][35][36]如果域受到限制和控制,机器翻译的质量将得到显著提高。[37]
尽管机器翻译程序有其固有的局限性,但它们在世界各地都有使用。可能最大的机构用户是欧盟委员会。例如由哥德堡大学协调的项目Molto从欧盟获得了237.5万欧元的项目支持,以创建涵盖欧盟大多数语言的可靠翻译工具。[38]当削减人力翻译的预算时,机器翻译系统的进一步发展可能增加欧盟对可靠的机器翻译项目的依赖。[39]欧盟委员会(通过其ISA方案)捐助307.2万欧元,用于创建MT@EC,这是一个专门针对欧盟行政需求的统计机器翻译程序,以取代以前基于规则的机器翻译系统。[40]
2005年,谷歌声称使用专有的统计机器翻译引擎获得了有希望的结果。[41]]阿拉伯语<->英语和中文<->英语中使用的统计翻译引擎谷歌语言工具,在美国国家标准与技术研究所(National Institute for Standards and Technology)进行的测试中,总分为0.4281,高于排名第二的IBM BLEU-4的0.3954(2006年夏天)。[42][43][44]
随着最近对恐怖主义的关注,美国军方一直在自然语言工程上投入大量资金。IQT电信[45](一个主要由美国情报部门资助的风险资本基金,旨在通过私营企业来刺激新技术)造就了像语言编织者这样的公司。目前,军事界对诸如阿拉伯语、普什图语和达里语等语言的翻译和处理感兴趣。在这些语言中,重点是关键短语和通过使用手机应用程序在军人和平民之间快速交流。[46]美国国防部高级研究计划局(DARPA )的信息处理技术办公室主持着像 TIDES 和巴比伦翻译器这样的项目。美国空军给予了一份价值100万美元的合同,开发一种语言翻译技术。[47]
近年来,社交网络在网络上的显著崛起为机器翻译软件的应用带来了另一个利好——应用于Facebook等实用程序,或Skype、谷歌聊天、MSN Messenger等即时消息客户端——允许说不同语言的用户相互交流。大多数移动设备也发布了机器翻译应用程序,包括移动电话、平板、掌上电脑等。由于这些工具的便携性,它们已被指定为移动翻译工具,以支持使用不同语言的合作伙伴之间的移动商务联网,或者促进外语学习和无人陪伴的出国旅行,而不需要人工翻译的中介。
尽管美国政府在1966年成立的自动语言处理咨询委员会称为人类翻译的不起眼的竞争对手,[48]但机器翻译的质量现在已经提高到可以在线协作和医疗领域中应用的程度。这项技术在缺少人工翻译的医疗环境中的应用是另一个研究课题,但是由于准确翻译在医疗诊断中的重要性,出现了困难。[49]
许多因素会影响机器翻译系统的评估。这些因素包括翻译的预期用途、机器翻译软件的性质和翻译过程的性质。
不同的程序可以很好地用于不同的目的。例如,统计机器翻译(SMT)通常表现优于基于示例的机器翻译(EBMT),但研究人员发现,在评估英语到法语的翻译时,EBMT表现得更好。[50]同样的概念也适用于技术文件,因为它们的形式语言更容易被SMT翻译。
然而,在某些应用中,例如用受控语言编写的产品描述,基于字典的机器翻译系统已经产生了令人满意的翻译,除了质量检查之外,不需要人工干预。[51]
有各种方法可以评估机器翻译系统的输出质量。最古老的是使用人工[52]评估翻译的质量。尽管人工评估很耗时,但它仍然是比较不同系统(如基于规则的系统和统计系统)的最可靠方法。[53] 自动化评估方法包括 BLEU 、 NIST 、METEOR 和Lepor。[54]
完全依赖未经编辑的机器翻译忽略了这样一个事实,即人类语言中的通信是嵌入在语境中的,并且需要一个人以合理的概率理解原始文本的语境。的确,即使是纯人工翻译也容易出错。因此,为了确保机器生成的翻译对人类有用,并实现可出版质量的翻译,这种翻译必须由人类审查和编辑。[55]已故的克劳德·皮龙写道,机器翻译在最好可以自动完成翻译工作中更容易的部分;更难和更费时的部分通常包括做大量的研究来解决源文本中的歧义,这是迫切需要目标语言的语法和词汇来解决的。这种研究是必要的预编辑的前奏,以便为机器翻译软件提供输入,从而使输出不会毫无意义。[56]
除了歧义消除问题之外,由于机器翻译程序的训练数据水平不同,准确性也会降低。基于实例的翻译和统计机器翻译都依赖于大量的真实例句作为翻译的基础,当分析太多或太少的句子时,准确性就会受到威胁。研究人员发现,当一个程序被训练成203529个句子对时,准确性实际上会降低。[50]刚超过10万个句子时,训练数据达到最优,这可能是因为随着训练数据的增加,可能的句子数量增加,从而更难找到准确的翻译匹配。
在21世纪初,口语和手语之间的机器翻译选项受到严重限制。人们普遍认为聋人可以使用传统的翻译。然而,与手语相比,口语中的重音、语调、音高和时间表达方式有很大不同。因此,聋人可能会误解或混淆基于口语的书面文本的含义。[58]
研究人员Zhao等人(2000年)开发了一个名为TEAM(机器从英语翻译成美国手语)的原型,该原型完成了英语到美国手语的翻译。该程序将首先分析英语文本的句法、语法和形态学方面。在这一步之后,程序访问了一个符号合成器充当ASL的字典。这个合成器包含了完成ASL符号必须遵循的过程,以及这些符号的含义。一旦整个文本被分析,完成翻译所需的符号被定位在合成器中,就会出现一个计算机生成的人,并使用ASL向用户比划英语文本。[58]
^阿尔巴特,托马斯·弗里茨。"用于自动估计翻译时间的系统和方法."美国专利0185235,2012年7月19日。.
^Yehoshua Bar-Hillel (1964). Language and Information: Selected Essays on Their Theory and Application. Reading, MA: Addison-Wesley. pp. 174–179..
^"Madsen, Mathias: The Limits of Machine Translation (2010)". Docs.google.com. Retrieved 2012-06-12..
^浜口, 稔 (30 April 1993). 英仏普遍言语计画. 工作舎. pp. 70–71. ISBN 978-4-87502-214-5. 普遍的文字の构筑という初期の试みに言及するときは1629年11月にデカルトがメルセンヌに宛てた手纸から始まる、というのが通り相场となっている。しかし、この问题への関心を最初に诱発した多くの要因を吟味してみると、ある种の共通の书字という构想は明らかに、ずっと以前から比较的なじみ深いものになっていたようである。…フランシス・ベイコンは、1605年出版の学问の进歩についてのなかで、そのような真正の文字の体系は便利であると述べていた翻译自 Knowlson, James. UNIVERSAL LANGUAGE SCHEMES IN ENGLAND AND FRANCE 1600-1800..
^Delavenay, Émile. LA MACHINE A TRADUIRE (Collection QUE SAIS-JE? No.834). Translated by 别所照彦. Presses Universitaires de France. 英国人A.D.ブースとロックフェラー财団のワレン・ウィーバーとが同时に翻訳问题に手をつけたのは1946年のことであった。(translation (assisted by Google translate):It was in 1946 when the English A. D. Booth and Warren Weaver at Rockefeller Foundation begun to study the issue on translation at the same time.).
^上野, 俊夫 (1986-08-13). パーソナルコンピュータによる机械翻訳プログラムの制作 (in Japanese). Tokyo: (株)ラッセル社. p. 16. ISBN 494762700X. わが国では1956年、当时の电気试験所が英和翻訳専用机“ヤマト”を実験している。この机械は1962年顷には中学1年の教科书で90点以上の能力に达したと报告されている。(translation (assisted by Google translate): In 1959 Japan, the National Institute of Advanced Industrial Science and Technology(AIST) tested the proper English-Japanese translation machine Yamato, which reported in 1964 as that reached the power level over the score of 90-point on the textbook of 1st grade of junior hi-school.)CS1 maint: Unrecognized language (link).
^https://web.archive.org/web/20221028213927/http://museum.ipsj.or.jp/computer/dawn/0027.html.
^Nye, Mary Jo (2016). "Speaking in Tongues: Science's centuries-long hunt for a common language". Distillations. 2 (1): 40–43. Retrieved 20 March 2018..
^Gordin, Michael D. (2015). Scientific Babel: How Science Was Done Before and After Global English. Chicago, Illinois: University of Chicago Press. ISBN 9780226000299..
^上野, 俊夫 (1986-08-13). パーソナルコンピュータによる机械翻訳プログラムの制作 (in Japanese). Tokyo: (株)ラッセル社. p. 16. ISBN 494762700X.CS1 maint: Unrecognized language (link).
^John Lehrberger (1988). Machine Translation: Linguistic Characteristics of MT Systems and General Methodology of Evaluation. John Benjamins Publishing. ISBN 90-272-3124-9..
^Chitu, Alex (22 October 2007). "Google Switches to Its Own Translation System". Googlesystem.blogspot.com. Retrieved 2012-08-13..
^"Google Translator: The Universal Language". Blog.outer-court.com. 25 January 2007. Retrieved 2012-06-12..
^"Inside Google Translate – Google Translate"..
^https://web.archive.org/web/20221028213927/http://www.mt-archive.info/10/HyTra-2013-Tambouratzis.pdf.
^高娜,男,1981年。类比原则下的日英文机械翻译框架,载于《人工和人类智能》,A. Elithorn和R. Banerji(编辑。)北荷兰省,第173-180页,1984年。.
^"the Association for Computational Linguistics – 2003 ACL Lifetime Achievement Award". Association for Computational Linguistics. Retrieved 2010-03-10..
^https://web.archive.org/web/20221028213927/http://kitt . cl . uzh . ch/clab/satzaehnlichkeit/tutorial/Unterlagen/Somers 1999 . pdf.
^Adam Boretz. "Boretz, Adam, "AppTek Launches Hybrid Machine Translation Software" SpeechTechMag.com (posted 2 MAR 2009)". Speechtechmag.com. Retrieved 2012-06-12..
^"Google's neural network learns to translate languages it hasn't been trained on"..
^机器翻译的里程碑–第6条:Bar-Hillel和FAHQT的不可行性。 Archived 12 3月 2007 at the Wayback Machine作者:约翰·哈钦斯.
^Bar-Hillel (1960),"语言的自动翻译"。可在http://www.mt-archive.info/Bar-Hillel-1960.pdf 在线获取.
^Hybrid approaches to machine translation. Costa-jussà, Marta R.,, Rapp, Reinhard,, Lambert, Patrik,, Eberle, Kurt,, Banchs, Rafael E.,, Babych, Bogdan,. Switzerland. ISBN 9783319213101. OCLC 953581497..
^克劳德·皮龙,Le défi des langues(《语言挑战》),巴黎,L'Harmattan,1994年。.
^[张政。计算机语言学与机器翻译导论。外语教学与研究出版社,2010年].
^https://web.archive.org/web/20221028213927/http://www . cl . cam . AC . uk/~ ar 283/eacl 03/workshops 03/W03-w1 _ eacl 03 baby ch . local . pdf.
^赫尔曼雅各布,u .,奈特,k . &哈尔,D. (2008)。统计机器翻译学习中的姓名翻译何时音译。计算语言学协会。389–397。.
^https://web.archive.org/web/20221028213927/http://nlp . Stanford . edu/courses/cs 224n/2010/reports/singla-nirajuec . pdf.
^https://web.archive.org/web/20221028213927/https://dowobeha.github.io/papers/amta08.pdf.
^https://web.archive.org/web/20221028213927/http://homepages.inf.ed.ac.uk/mlap/Papers/acl07.pdf.
^https://web.archive.org/web/20221028213927/https://www.jair.org/media/3540/live-3540-6293-jair.pdf.
^皮耶克·沃森:本体。作者:Mitkov,Ruslan(编辑。)(2003:《计算语言学手册》,第25章。牛津:牛津大学出版社。.
^Knight, Kevin. "Building a large ontology for machine translation (1993)" (PDF). Retrieved 7 September 2014..
^"Melby, Alan. The Possibility of Language (Amsterdam:Benjamins, 1995, 27–41)". Benjamins.com. Retrieved 2012-06-12..
^Adam (14 February 2006). "Wooten, Adam. "A Simple Model Outlining Translation Technology" T&I Business (February 14, 2006)". Tandibusiness.blogspot.com. Retrieved 2012-06-12..
^"Appendix III of 'The present status of automatic translation of languages', Advances in Computers, vol.1 (1960), p.158-163. Reprinted in Y.Bar-Hillel: Language and information (Reading, Mass.: Addison-Wesley, 1964), p.174-179" (PDF). Retrieved 2012-06-12..
^"Human quality machine translation solution by Ta with you" (in 西班牙语). Tauyou.com. 15 April 2009. Retrieved 2012-06-12..
^"molto-project.eu". molto-project.eu. Retrieved 2012-06-12..
^SPIEGEL ONLINE, Hamburg, Germany (13 September 2013). "Google Translate Has Ambitious Goals for Machine Translation". SPIEGEL ONLINE.CS1 maint: Multiple names: authors list (link).
^"Machine Translation Service". 5 August 2011..
^谷歌博客:机器翻译(作者:弗朗兹·奥赫).
^"Geer, David, "Statistical Translation Gains Respect", pp. 18 – 21, IEEE Computer, October 2005" (PDF). Ieeexplore.ieee.org. 27 September 2011. doi:10.1109/MC.2005.353. Retrieved 2012-06-12..
^"Ratcliff, Evan "Me Translate Pretty One Day", Wired December 2006". Wired.com. 4 January 2009. Retrieved 2012-06-12..
^""NIST 2006 Machine Translation Evaluation Official Results", November 1, 2006". Itl.nist.gov. Retrieved 2012-06-12..
^"In-Q-Tel". In-Q-Tel. Archived from the original on 20 May 2016. Retrieved 12 June 2012..
^Gallafent, Alex (26 Apr 2011). "Machine Translation for the Military". PRI's The World. PRI's The World. Retrieved 17 Sep 2013..
^Jackson, William (9 September 2003). "GCN – Air force wants to build a universal translator". Gcn.com. Retrieved 2012-06-12..
^https://web.archive.org/web/20221028213927/http://www.nap.edu/html/alpac_lm/ARC000005.pdf.
^"Using machine translation in clinical practice"..
^Way, Andy; Nano Gough (20 September 2005). "Comparing Example-Based and Statistical Machine Translation". Natural Language Engineering. 11 (3): 295–309. doi:10.1017/S1351324905003888. Retrieved 2014-03-23..
^muegg(2006),“受限文本的全自动高质量机器翻译:案例研究”,载于翻译和计算机。第二十八届国际翻译和计算机会议记录,2006年11月16日至17日,伦敦伦敦:阿斯利布。ISBN 978-0-85142-483-5。.
^"Comparison of MT systems by human evaluation, May 2008". Morphologic.hu. Archived from the original on 19 April 2012. Retrieved 12 June 2012..
^安德森博士(1995年)。机器翻译作为第二语言学习的工具。卡利科杂志。13(1)。68-96岁。.
^Han等人(2012),“莱葩:具有增强因子的机器翻译的稳健评估度量”,载于第24届国际计算语言学会议录(COLING 2012):海报,第441-450页印度孟买。.
^科恩观察到(第14页):“科学翻译是一个将所有活动减少到技巧的时代的目标。然而,很难想象一台文学翻译机器比人脑本身更简单,拥有所有的知识、阅读和辨别能力。”.
^请参阅自2001年以来每年进行的NIST测试和双语评估替代学习.
^尼诺,安娜。“外语学习中的机器翻译:语言学习者和导师对其优缺点的看法”ReCALL:the Journal of euroccall 21.2(May 2009)241–258。.
^赵,l .,腌鱼(英国),k .,舒勒,w .,沃格勒,c . &帕尔默,M. (2000)。从英语到美国手语的机器翻译系统。。计算机科学讲义,1934:54–67。.
^"Machine Translation: No Copyright On The Result?". SEO Translator, citing Zimbabwe Independent. Retrieved 24 November 2012..
暂无