Algorithm 版 (精华区)

发信人: ssos (存在与虚无), 信区: Algorithm
标  题: 机器翻译跟着感觉走
发信站: 哈工大紫丁香 (2001年06月30日19:39:03 星期六), 站内信件

机器翻译跟着感觉走
图灵在《机器能思维吗?》中把人工智能的突破口归结为教会机器理解和使用自然语言
,真是远见卓识。机器翻译自计算机诞生之日起就成为语言学家和计算机科学家的兴趣
焦点,信心百倍地投入其中,屡败屡战。历史应该敬重这些有着勇气与热忱的研究者,
但敬重并不意味着支持和赞同:毕竟人类对与思维有着千丝万缕联系的自然语言缺乏基
本的认识——我不是在贬低语言学家的工作,两千多年来他们对语言现象描述的积累已
经够多的了——在乔姆斯基理论创立之前(即本世纪五十年代),几乎所有的语言规律
都还隐藏在神秘的面纱后面。乔姆斯基开始了一个新时代。
问题远没有人们想象得那么简单,语义的形式化的困难很快就又让人类的热情遭受到打
击。八十年代至今,计算语言学家不得不把工作的重心转移到计算语义学上。在如今百
家争鸣的乱世,谁也甭说自己的理论就是比别人的好。机器翻译跟着感觉走,流行什么
就受什么影响(例如,统计的方法导致语料库语言学的盛行)。统计学只能辅助揭示规
律,帮助人们提出假设,真正解决问题还得靠本学科自己的努力。现在的气候并不适合
机器翻译的发展,语义的形式化的困难一日不解决,机器翻译就一日没有希望。自然语
言语义的形式化,首先应该面向人,然后是机器。如果一套语义的形式化理论对人来说
是好的(可操作性强的),它转化为可计算的可能性就大些。直接面向机器去形式化自
然语言的语义难免目标太高容易偏离方向。
近几年国外的研究动态,多是把重心放在基础理论的研究上。理论的一点点进步就能避
免许多盲目的冲动的机器翻译的尝试。我看到国内有些人把机器翻译抬高到仿佛就是计
算语言学的代名词的高度很不以为然。计算语言学首先包括语言的数学刻画,然后才是
计算机的算法实现。如果不把对机器翻译的理论支撑的认识提高一个层次,机器翻译仍
逃脱不了跟着感觉走的命运。
形式语义学也称逻辑语义学或真值条件语义学,现在可以说是计算语义学的一个分支。
“计算语义学”(computational semantics)是九十年代初提出的计算语言学的分支领域
,它的含义更广泛一些,即一切自然语言语义的形式化的研究(个人观点,也许不对)

自然语言语义的形式化的困难,不用说大家都清楚。语义学有没有可能出现类似Chomsk
y在句法理论中所作出的伟大的革命呢?计算语言学正在积蓄力量,众多的计算语义学的
理论如雨后春笋般诞生,有的的确是昙花一现。不过,这是一个好现象:不好的东西遭
淘汰,好的东西保留下来。至于形式语义学是不是一个强有力的工具,历史还没有给出
验证,我的观点是中庸的,试试看吧。逻辑的东西比较枯燥,用一堆很抽象的工具去刻
画推理或定义语义,有点“高射炮打蚊子”的味道。我相信好的理论是那些描述复杂性
较小的理论,数学的美其中就包括简洁性。按照“简洁标准”,现有的计算语言学理论
都称不上成功的理论。
我曾读过法国数学大家Thom的一本讲“突变理论”的书,Thom谈到了利用突变的思想解
决自然语言语义分类的问题。这可能是对我刺激最大的一本书——数学的连续性的方法
用到语言学的研究中,简直不可思议!Thom是突变理论的创始人之一,得过Fields奖,
哲学思想也很深刻。我从他的著作中学到的是——不要轻易地放弃一个新颖的想法,问
题的解决办法往往就出于此。
语料库语言学的研究是非常必要的,统计的方法也是计算语言学研究不可缺少的。“统
计->提出猜想->验证猜想->提出理论->解决问题”的步骤是稳健的,我非但不反对而是
极力地提倡。国外利用Hidden Markov模型做了很多研究工作,XRCE甚至有它的FSC(有
限状态计算)工具。我想国内的语料库语言学的研究者们是不是也应该尝试一下该模型
在汉语句法-语义分析中的应用呢?至少好的研究工作我没见到,可能是因为我的孤陋寡
闻。

--

   
<<社会契约论>>是一本好书,应当多读几遍
风味的肘子味道不错,我还想再吃它      

※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: 202.118.230.220]
[百宝箱] [返回首页] [上级目录] [根目录] [返回顶部] [刷新] [返回]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:5.187毫秒