精华区文章阅读

发信人: ssos (存在与虚无), 信区: Algorithm
标  题: Chomsky的语言哲学观
发信站: 哈工大紫丁香 (2001年06月30日19:45:38 星期六), 站内信件

Chomsky的语言哲学观
Chomsky的Universal Grammar完全不同于传统意义上的语法学，从认识论角度看，Univ
ersal Grammar是一种元语法学——它企图揭示的是人类语言行为的心理机制（这里Cho
msky有一个假设：人类操纵语言的心理机制是相同并可以遗传的或者说是在人脑中天生
固有的——这个假设纯属哲学问题，与语言学本身无关），或者说Chomsky想在所有自然
语言语言语法（要假设每一个自然语言都存在一部描述它的语法）中寻找规律，正是这
个规律制约了人类至今没有选取某些语法体系并且永远也不会选取它们。
以下是Chomsky的主要论著，从中可以看出他对Universal Grammar认识的过程：
[1957] Syntactic Structure
[1959] On Certain Formal Properties of Grammars
[1961] On the Notion ‘Rule of Grammar’
[1962] Explanatory Models in Linguistics
[1963] Introduction to the Formal Analysis of Natural Languages
[1965] Aspects if the Theory if Syntax
[1966] Cartesian Linguistics
[1968] Sound Patten of English
[1968] Some Controversial Questions in Phonological Theory
[1970] Remarks on Nominalization
[1970] Deep Structure, Surface Structure and Semantic Interpretation
[1971] Conditions on Transformation
[1971] Chomsky: Selected Readings
[1975] Logical Structure of Linguistic Theory
[1976] Reflections on Language
[1980] On Binding
[1980] Rules and Representations
[1982] Lectures on Government and Binding
[1985] Knowledge of Language: It’s Nature, Origin and Use
Chomsky早年受结构主义的影响（其导师Zelling Harris就是一位结构主义语言学家），
后来逐渐怀疑结构主义的方法论和认识论，从描写语言学派中脱离出来。Chomsky的语言
哲学可以归结为两点：
[1] 语言反映了心理
[2] 语言能力中包含固有的可遗传的成分
Chomsky的哲学观点基本上是唯物论的，即承认物质决定意识。在反对逻辑实证主义的同
时，Chomsky认识到结构主义语言学在描述自然语言上的缺陷——语言的递归性没有得到
充分的体现，即人类对自然语言的潜在无穷的认识能力被排除在语言学研究之外。
例如，
梁山伯爱祝英台
阿Q知道梁山伯爱祝英台
孔乙己知道阿Q知道梁山伯爱祝英台
……
结构主义的描述方法是罗列，即
N+V+N
N+V+N+V+N
N+V+ N+V+N+V+N
……
Chomsky利用语类(category)作“桥梁”，用以下的重写规则（Rewrite Rule）或短语结
构规则（Phrase Structure Rule）刻画这一类句子：
S->NP VP
NP->N
VP->NP VP
VP->V NP| V S
这就是所谓的语言的“递归性”。
Chomsky的Universal Grammar(UG)试图揭示人类的语言机制，可以说UG是自然语言的元
语言（描述对象语言的语言被称为“元语言”）。Chomsky认为这种“语言机制”先天存
在的原因是：
[1]  儿童在有限的时间内（0岁—4岁）能够掌握母语（即用母语交流）；
[2]  掌握语言L意味着可以产生潜在无穷多“合理的”L的语句。
于是，Chomsky假设在人的头脑中共有着一部可遗传的Universal Grammar，不同的自然
语言只是被“激活”的参数不同。儿童在接受母语L有限的语句的刺激之后，L的框架就
可以被确定下来。而产生潜在无穷多的语句是靠重写规则中的递归定义实现的，这里Ch
omsky有一个明显的假设（虽然他没直说）：自然语言可以允许任意长度的语句的存在。

人类的思维在逻辑层面上的确是相同的——这是由于人的生理的构造决定的。人的眼睛
和触觉可以辨认和区分个体，于是自然数概念的产生就成为可能。试想如果人的感觉一
片混沌以至于区分不了个体，1，2，3……的语义就无从说起。概念的抽象是人类进化为
智能生物的关键，一个声音如果赋予了一个概念，声音的在场就可以取代承载概念的事
物或事件的在场——这是语言存在的先决条件（即使在动物界，也存在这样的行为，我
们把它归结为动物寻求生存的自然选择）。从具体对象到对象的类的概念的跨越，语言
实现了“思维的经济性”——以小的代价扩展了人类的认知范围，成为人类思维及其交
流的主要载体。在逻辑思维中，信息量总是在递减，概念的不同层级提供了逻辑思维信
息量递减的可能。例如，“苏格拉底要死”并不比“所有人都要死且苏格拉底是人”的
信息量多。语言在形成的时候迎合了逻辑思维的这个特点。
先姑且承认Chomsky所说的“语言机制”是存在的，这个“语言机制”首先应该包括“逻
辑机制”（语言机制中的非逻辑机制要服从逻辑机制的要求）。“语言机制”对于我们
人类来说是一个黑箱，直接描述这个黑箱是不可能的——我们不能用对象语言描述对象
语言形成的机制，不然，就进入死循环。像其他自然科学一样，模型的外在表现如果接
近自然的外在表现，这个模型所基于的理论就成为描述自然的工具（但不可以说它就是
“自然规律”！）。同理，一个数学或逻辑的形式化模型的外在表现如果接近语言机制
（这里，如果我们把语言机制等同与所有自然语言共有性质的集合，则这个集合非空，
因为它至少包括一个语言规律：反身代词的所指必然在反身代词之前出现）的外在表现
，我们就可以把这个模型所基于的数学或逻辑的理论视为“自然语言的元语言”，但不
可以认为它就是“语言机制”。我想，像Chomsky这样的大哲学家是能够区分模型和描述
对象的。
我认为Chomsky在给出“语言机制的先天性”的理由[1]的时候忽视了一点，就是有限的
语料如何“激活”语言机制——这里必须有一个“激活条件”，即控制外来刺激在什么
情况下“激活”或者“不激活”语言机制。接着我们要问下面的问题：
[1]  这个“激活条件”是否属于“语言机制”？
[2]  控制“激活条件”的条件又是什么？
……
明显地，这是一个陷阱。
Chomsky在给出“语言机制的先天性”的理由[2]的时候又忽视了一点，就是“自然语言
L允许任意长度语句的存在”只是一个假设，在实际的语料中我们所见到的都是有限长度
的，这是由人的心理条件的制约和向右（或左）无限延伸的文法（3型文法）缺少结构上
的自明导致的。我们甚至可以通过语料统计和心理测试得到语句长度的上限（Chomsky把
人看成上帝了，可以洞悉一切）。事实上，人类之所以能够创造潜在无穷的合理的语句
，是因为人类概念（或语义）抽象的能力是潜在无穷的。从经验可以看出：自然语言L（
在所有语料中出现）的语句的的句法结构的数目是有限多的，层出不穷的是词汇的语义
和在一定语境中的语句的语义。也就是说，人类可以用同一个语句在不同的语境中表达
不同的语义。相反，在相同的语境中，用不同的语句表达相同的语义就困难多了。当然
，Chomsky的理由[2]较之描写主义语言学派的做法进步多了，我反对它作为“语言机制
的先天性”的Chomsky式的理由——语义构造的潜在无穷才是语言机制的先天性的理由。

语言能力的形式描述正是Chomsky的理想，这个模型至今没有建立起来。Chomsky在建立
GB理论之前（1975年）写过一本书：Logical Structure of Linguistic Theory。这是
一部巨著（国内介绍乔氏理论的语言学家似乎对这本书不太感兴趣，可能是太厚的缘故
）。此后，乔氏似乎灵感如泉涌一般，今天这个理论，明天那个理论，害得全世界的语
言学家跟着乔氏跑得不亦乐乎。
[1980] On Binding
[1982] Lectures on Government and Binding
[1986] Barriers
可是在GB理论中，乔氏丝毫没提他对自然语言的逻辑结构的思考，甚至精心地抹去这些
思考的痕迹。在GB理论中，表层结构诱导逻辑形式，这近乎可笑。虽然在“最简方案”
里已经没有D结构和S结构（这两个东西是很容易引起误解），
但逻辑形式仍是一个被诱导出来的东西。有人说“张三讨厌谁？”的逻辑形式是“谁是
张三讨厌的人？”，我认为“张三讨厌谁？”更好地表达了lambda x.讨厌(x,张三)：x
位置空缺，这里该填什么正是提问者所关心的。
乔氏将这些思考换了一种形式表达出来——这就是大家见到的举世闻名的“支配约束理
论”和“最简方案”（乔氏擅长树上的操作，对家谱结构研究甚深）。
Chomsky对形式语言做了一个分类，强烈地影响了计算机程序设计语言(句法皆弱等价于
CFG)的发展。自然语言比计算机程序设计语言从句法和语义上都要复杂得多，自然语言
的句法和语义的关系也不像程序设计语言的句法和语义的关系那么“清白”……
到底程序设计语言的那一套做法对自然语言适不适用？自然语言可不可能在Chomsky的分
类之外？自然语言落在哪个类里呢？
如果自然语言类和每个都有交集(即自然语言的这个部分可以用真CSG描述，那个部分可
以用CFG描述……)，是不是就说明形式语言的分类对自然语言不适用？
自然语言的形式描述不仅包括NLP，还包括一些定性的刻画。如果自然语言对于人来说是
可形式化的，我们能够用类似拓扑学的数学理论定性地描述它，这不也是一个很大的进
步吗？所以，我认为NLP至少应包括：
NLP by mathematics
NLP by computer
几何学并不是研究现实世界里对象的几何性质，而是研究抽象的理念世界（不同的公理
体系导致不同的模型）里的对象的几何性质。这让我想起一个问题：
当我们提到某个“自然语言”L时，指的是活生生的L语料（来自口语、报纸、书籍...）
还是一个抽象的L的模型？

--


<<社会契约论>>是一本好书,应当多读几遍
风味的肘子味道不错,我还想再吃它

※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: 202.118.230.220]

Algorithm 版 (精华区)