Algorithm 版 (精华区)

发信人: ssos (存在与虚无), 信区: Algorithm
标  题: 计算语言学需要多方面合作
发信站: 哈工大紫丁香 (2001年06月30日19:35:46 星期六), 站内信件

计算语言学需要多方面合作
计算语言学(Computational Linguistics)是一门交叉学科,需要语言学家,数学家和计
算机科学家的多方面合作。计算语言学的早期的实践工作是机器翻译,随着计算机的发
展,自然语言的计算机处理逐渐扩展至智能检索,语言识别,信息自动摘取,电子词典
等有具体目的和用途的研究领域(一般称为自然语言处理)。而计算语言学则常指代自
然语言的可计算理论(针对计算机而言)。
计算语言学的研究过程一般分为:
语言学家提出语言问题和语言理论
数学家(或逻辑学家)把语言问题(或理论)形式化——对人而言
对人来说是可操作的形式理论,对机器而言可能一点用也没有,所以数学家要和计算机
科学家合作将形式化的语言理论转化为可计算理论
将理论写成算法
将算法编写成可上机实现的程序
传统的语言学是基于经验的,缺少形式规则和令人信服的体系。语言学家有很多语言的
素材却只停留在经验的层面上;数学家对语言的研究依赖于语言学家的帮助,同时语言
学家也能从数学家那里得到语言研究的数学方法;计算机科学家身兼两项任务:一是工
程的具体实现,二是与语言学家和数学家的交流——把形式化的语言问题(或理论)转
化为可计算的理论。计算语言学在国外(指那些发达国家)是一门热点学科,因为网络
时代的到来把语言信息交流的任务提到日程上来了。美国的一些大学甚至开设了计算语
言学系。我国的计算语言学起步较晚,再加上研究资金的限制和对计算语言学的重视不
够,计算语言学的基础理论研究落后西方十年到二十年或者更多。不同于英语,汉语计
算语言学有它自己的特点,如词的切分问题就是一个难题。
能被算法描述的语言只有可数个,但全体语言的集合却是不可数的,这说明“绝大多数
”语言是无法找到算法描述的。自然语言是否属于“算法无法描述”类呢?我不知道…

如果自然语言 L(或者汉语)属于“算法无法描述”类,那么接下来的问题就是找 L的
最大的“可算法描述”的子集 S;如果幸运--- L属于“算法可描述”类,我们大可放心
地慢慢地寻找这个算法。
国外的研究动态表明:计算语义学(Computational Semantics)正在逐渐成为计算语言学
中不可缺少的研究领域,自然语言语义的形式化已成为计算语言学家最为关注的热点话
题。目前,计算语义学还停留在理论的探讨阶段,应该引起我国计算语言学界的重视,
至少现在起步加强这一领域的研究还不算晚。

--

   
<<社会契约论>>是一本好书,应当多读几遍
风味的肘子味道不错,我还想再吃它      

※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: 202.118.230.220]
[百宝箱] [返回首页] [上级目录] [根目录] [返回顶部] [刷新] [返回]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:9.609毫秒