Algorithm 版 (精华区)
发信人: ssos (存在与虚无), 信区: Algorithm
标 题: 语言学与统计学
发信站: 哈工大紫丁香 (2001年06月30日19:45:14 星期六), 站内信件
语言学与统计学
“统计方法只是从事物的外在数量上的表现去推断该事物可能的规律性。统计方法本身
不能说明何以会有这个规律,这是各专门学科的任务。”
“统计方法在纯科学研究方面也很有用。一方面,科学规律性的东西一般总是隐藏得比
较深,最初总是从其数量表现上通过统计分析看出一些线索,然后提出一定的假说或学
说,作进一步深入的理论研究。当理论研究 提出一定的结论时,往往还需要在实践中加
以验证。就是说,观测一些自然现象或专门安排的实验所得资料,是否与理论相符、在
多大的程度上相符、偏离可能是朝哪个方向等等问题,都需要用统计分析的方法处理。
”
-----选自《基本统计方法教程》
傅權、胡蓓华 编著
统计学不是数学,它没有公理体系,虽然(数理)统计学用到许多数学方法。统计中人
为的因素太多,所以当你见到一串统计数字的时候,一定先要搞清楚它用的是什么统计
方法,否则很容易上当受骗呵。在统计学中,至高无上的准则是:
存在就是合理的
谎话重复千遍就成了真理
统计学对自然语言处理有没有用?
如果上帝不准备让人类了解细节,我们只有靠统计的方法去猜上帝的想法了。谁知道语
言规律的细节是不是上帝想保密的东西,所以语言学的研究用统计的方法是保险的,起
码可以辅助发现一些“规律”吧。贝叶斯分析在语言学中较为常用。
经验论和唯理论之争由来已久。元哲学还无法判定二者孰对孰错,或许就没有对与错的
问题罢。数学仅仅是人类认识自然即猜测上帝意图的一件工具而已,还有许许多多的工
具呢。仁者见仁,智者见智,萝卜白菜各有所爱,没有人会限制你选择什么方法。
哲学从本体论,经认识论到语言哲学,中途历经坎坷,人类终于认识到首先要搞清楚定
义再争也不迟的道理。绕来绕去,问题出在初始状态上,大家的定义不统一,规则不统
一,再争下去也不会有什么结果。
我同意一切“好用”的“科学”的理论,当然也包括统计学如果它真的“好用”。记不
得小的时候我是怎么学会操纵语言的,但有一点可以肯定:当时我绝对不懂得统计的方
法(我是在大学才开始学习数理统计的)。或许人先天就具备统计的能力?如果是,那
么统计的规则就是乔姆斯基的“泛语法”规则了。
语言中的约定俗成的现象对人理解语言有多少的作用尚待讨论,但计算语言学更关心的
是自然语言中哪些是可被形式化描述的,哪些是人天生具有的能力(即泛语法)。试想
一个小孩子学习自然语言,如果基于统计,怎会在短短的两三年里学会自由地造句?除
了词汇,即便把规则的统计也考虑进去,问题还是困难,因为元规则还在认识之外;加
上了元规则,又得考虑元元规则……。如此延伸,不知要到哪儿为止。
统计的方法的确可以发现语言中的约定俗成的现象,但这只是次要的问题,或者说,这
些发现只能起到辅助研究的作用。统计难免会面临一些语言噪声的干扰,如何去掉噪声
仍是个困难的问题。所以,别寄太多的希望在统计的身上。
有人赞成语言学研究中的多方法的使用,不同的问题用不同的方法。我认为,没有必要
去强求一种方法能包治百病,物理学中量子理论和相对论不就是针对不同的研究对象吗
?如果,计算语言学是一门科学,它的研究方法就不可能是唯一的。
我们不应过分夸大某些流行的做法,只有拿出好的结果或经过严格的数学的论证才有资
格说某某理论是“好用的”。
最后强调一点:语言不等于约定俗成。
--
<<社会契约论>>是一本好书,应当多读几遍
风味的肘子味道不错,我还想再吃它
※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: 202.118.230.220]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:2.350毫秒