Algorithm 版 (精华区)
发信人: AA (积极的人生、美好的人生), 信区: Algorithm
标 题: 基于语料库方法的机器辅助翻译研究(zz)
发信站: 哈工大紫丁香 (2002年05月23日10:32:05 星期四), 站内信件
基于语料库方法的机器辅助翻译研究
机器辅助翻译系统研究的目标是利用九十年代兴起的语料库统计方法,充分体
现人机分工协作,优势互补的辅助翻译思想,结合中文自然语言处理的最新技术,
为最终开发出能够有效提高翻译效率的辅助翻译工具打下坚实的技术基础。研究内
容主要包括:人机互助翻译思想的具体实现;翻译记忆库和术语库查询技术;双语
句子自动对齐算法研究;双语术语自动获取算法研究等。
研究背景:
机器翻译软件从主导思想上可分为两大类:机器自动翻译软件和机器辅助翻译软件
。自动翻译软件符合人们的理想,即不需任何人工干预而自动生成译文。目前在全
球范围内已开发出数目可观的软件产品,也已经涉及到所有主要语种,但产品技术
含量参次不齐,总体上讲翻译质量还远远不能满足人们的普通需要。机器翻译的难
点在于语言的歧义消解问题。语言单位无论从小到大都存在歧义,并且在语法、语
义和语用每个层面上都有表现。
计算机只能对定量(精确)的信息进行处理,如果靠人抽象总结出的一些自然语言
规律去处理和分析语言,也许会在某一方面达到较好的结果,但是人类自然语言中
,有许多定性(不精确)信息的介入,会产生许多计算机无法解决的复杂语言问题
。在人工智能理论未取得突破性研究以前,让计算机完全代替人来做一些具有高级
智能的工作,在理论和技术上都存在着难以逾越的障碍。
因此,目前只有采用自然语言处理中基于语料库的统计方法,充分体现人机分工协
作,优势互补的辅助翻译思想,才能获得高质量的译文,这一思想已在国外同类软
件中得到体现。
研究方法与研究内容:
通过计算机的有效参与,利用语料库统计方法和翻译记忆库和术语库技术,避免人
工翻译的重复劳动和术语不一致现象,从而有效的提高翻译效率和翻译质量。在具
体翻译过程中,人机分工协作,由人完成创造性的工作,而机器随时协助人们的翻
译处理,自动提供已有的翻译记录和术语。同时,机器不断学习人的翻译,作为以
后翻译的基础。通过辅助翻译系统,可以确保相同句子不被翻译两次,类似句子和
短语可以提供范例。因此,节省了大量人工翻译中用于术语和短语查询的时间和相
同句子的重复翻译时间。研究内容主要包括:人机互助翻译思想的具体实现;翻译
记忆库和术语库查询技术;双语句子自动对齐算法研究;术语自动获取算法研究。
关键技术问题:
机器辅助翻译系统研究拟解决的关键科学与技术问题主要包括:
· 人机互助翻译思想的体现,包括交互式分析(用户帮助系统得出正确的源语言
结构,尤其是对复杂句子,多义词进行排歧等),交互式转换(用户参与选择与源
语言结构等价的目标语言结构,排除不适当的转换),交互式生成(用户协作产生
流畅译文,用户在省略、指代、主题化方面对生成提供指导)。
· 翻译记忆库和术语库技术快速查询技术,即如何在大规模翻译记忆库和术语库
中快速查找到用户所需的例句和术语知识,以便及时用于交互式翻译系统。
· 双语句子自动对齐算法研究,用于实现原文与译文句子的自动对齐,以利于翻
译记忆库的有效扩充。
· 术语自动获取算法研究,主要解决术语及新词等翻译难点,有效提高译文的术
语一致性。
--
人世间的事谁也无法掌握
该执著的 永不怨悔
改舍去的 不在牵挂
改珍惜的 好好把握
※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: NLPCenter.hit.edu.cn]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:3.662毫秒