Science 版 (精华区)

发信人: zjliu (Robusting), 信区: Science
标  题: 第七章 玻璃房中的农民经济(2)
发信站: 哈工大紫丁香 (Sat Dec 14 15:44:01 2002) , 转信

 

第七章 玻璃房中的农民经济(2)
  荷兰德的回答大致上是,你在这样的环境中学习是因为你必须这样做:"进化才不在
乎问题是否得到了清晰的界定。"他指出,适应性作用者只是对外界对它的回报做出反应
。它们用不着对这报酬来自何方做出假设。事实上,这就是他的分类者系统的全部意义
之所在。从算法上说,这些系统都被严格界定,然而它们却能够在完全没有被明确界定
的环境中运作。既然分类者规则不过是对于世界的假设,而并非"事实",那它们就可能
会相互矛盾。而且,因为这个系统始终在对这些假设进行探测,从中区别出哪些假设是
有用的,能够使其得到报酬,所以它甚至能从支离破碎的信息中,在于变万化、不可预
测的环境中学习。
  "但它采取的并非是最优化行为。"经济学家抱怨说。经济学家确信,一个理性的作
用者会最大化地使用自己的"功能"。
  "相对于何种事物的最大化?"荷兰德问道。让我们来谈谈你们的界定不清的标准:
在任何真实世界的环境中,可能性的空间大得使任何一个作用者都无法找到,甚至无法
分辨什么是最优化。更何况环境也许会发生无法预料的变化。
  "这整个的归纳法概念使我入迷。"阿瑟说。"你可以设想,作用者面对的是界定不清
的问题、界定不清的环境和完全不知走向的变化,你就在这种情况下从事经济学研究。
当然,你只要略想片刻就会认识到,这就是生命的全部含义。人们经常要在含糊不清的
情况下做出决定,甚至连自己都对此不明不白。你是在蹚泥塘,不断改变自己的思想、
不断拷贝别人的经验、不断尝试以往的成功经验。事实上,经济学家以前谈论过这种行
为方式。但我们现在要找出能够对此做出精确分析的方法,将此融入理论的内核。"
  阿瑟记得那段时间发生的一次重要的争论,那场争论触及到了最核心的难题。"那是
10月至11月份之间的一次长时间的讨论。"他说。"阿罗、汉恩、荷兰德和我,也许有五
六个人吧。我们刚刚认识到,如果你用这种方法来进行经济学研究,如果这就是桑塔费
的方法,那么在经济学中也许根本就没有均衡可言了。经济就会像生物环境一样:永远
在进化、变迁、永远在探索新的发展领域。"
  "现在我们担心的是,似乎不可能在这种情况下研究经济学。因为经济学意味着对均
衡的了解。我们习惯于用观察蝴蝶的办法来研究问题,即,把蝴蝶钉在厚纸板上,把它
们摆平衡,然后再仔细观察它们,而不是让它们在你身边自由飞翔。所以汉恩说:'如果
事物并不会重复出现,如果事物并非处于均衡状态,我们的经济学家该怎么说呢?你如
何预测事情?又如何形成一门科学呢?'"
  荷兰德对这个问题非常认真,对此思考良久。他对他们说,让我们看一看气象学吧
。天气从来不会是一成不变的,从不会有一模一样的天气。我们对一周以上的气候基本
上是无法事先预测的,但我们却能了解和解释天上的各种天气现象,能够辨认出像锋面
、气流、高压圈等重要的气象特征。我们能够理解气象动力,能够理解它们如何相互作
用,从而在局部地区产生不同的气象状况。一句话,尽管我们无法对气象做完全的预测
,但气象学却仍不失为真正的科学。科学的本质在于理解和诠释,而这正是桑塔费希望
对于经济学和其他社会科学所做出的贡献。他说,就像气象学能够了解和解释锋面一样
,他们对具有动力的社会现象也能够理解和解释。
  "荷兰德的回答对我来说是一个启示,让我激动不已。我已经对经济的大部分都无法
趋于均衡这个问题思考了近十年了,但却不知道离开了均衡如何从事经济学研究。约翰
(荷兰德)的论述一下子就打开了我头脑中的困结,使我茅塞顿开。"
  阿瑟说,确实,1988年秋季的这些谈话使我真正认识到,桑塔费概念会给经济学带
来何种深远的变化。"许多人,包括我自己都曾经天真地假设过,我们从物理学家和从事
计算机学习的人们那儿获得的将是新的算法、新的解决问题的方法和新的技术框架。但
结果却大不相同。我们获得的经常是一种新的态度、看待问题的新角度和全新的世界观
。"
达尔文的相对论原则
  荷兰德在桑塔费度过他一生中最快活的时光。他最喜欢的事莫过于和一群才思敏捷
的人坐在一起讨论各种问题。但更重要的是,这些谈话促使他对自己的研究做出了重要
的方向性改变。正是这些谈话,再加上他不知道该如何拒绝马瑞·盖尔曼,使他就范了

  "马瑞不愧为施压能手,"荷兰德笑道。他说,1988年夏末,盖尔曼打电话到密西根
找他。"约翰,你一直在做基因算法的研究。现在我们需要一个例子来驳斥创世主义者。
"盖尔曼说。
  反对"创世科学"的斗争确实一直是盖尔曼热情投身的许多事情之一。他几年前就卷
入了这件事。当时路易斯安那州最高法院举行了一个听证会,为是否要把在学校像传授
达尔文的进化论一样传授创世科学做为一条法律进行辩论。盖尔曼说服了几乎全美国科
学界他称之为"瑞典奖"得主,即诺贝尔奖得主,在一份协助法庭解释的简报上签了名,
呼吁撤销这条法律。州立最高法院确实以七票对二票的表决结果否定了这条法律。但事
后盖尔曼读到了报纸的报道,才意识到事情远不止是少数宗教狂热者的问题。"人们写信
来说:'当然,我不是一个极端主义分子,我根本就不相信创世科学的一派胡言。但在我
们的学校传授的所谓进化论的科学似乎也有问题。这个世界当然不可能是由盲目的机会
而诞生的。'他们不是创世主义者,但他们也无法相信,仅仅机会和选择就能创造出我们
目所能及的一切。"
  所以,他对荷兰德说,他的主意是,拿出一系列计算机程序,或甚至计算机游戏也
行,向这些人展示这一切是怎么发生的。这些计算机玩艺儿可以向人们揭示,机会和选
择的压力,在一代又一代的生长繁衍中,能够产生多么巨大的演化和变迁。你只要安排
好原始条件——基本上也就是一个星球——事情就会发展成熟。盖尔曼说,事实上,他
正考虑在研究所组织一个研讨会,专门来讨论这样的计算机游戏。荷兰德能为此做些什
么吗?
  嗯,不,荷兰德实际上不情愿帮这个忙。当然他很欣赏盖尔曼的想法和计划,但他
的研究工作已经排得满满的了,其中包括他还要设计一个能应用于阿瑟的经济学模型的
分类者系统。从这一点来说,盖尔曼的进化模拟会分散他的精力。再说,他已经完成了
基因算法,他看不出来用另一种形式再做一遍能有什么新名堂。所以荷兰德一口拒绝了
盖尔曼的要求。
  那好吧,盖尔曼说。但为什么不想想再说呢。没过多久,盖尔曼又打电话给他:约
翰,这件事确实十分重要。他问荷兰德能不能改变主意。
  荷兰德做了再次拒绝,但他已经看到,要坚持下去不会那么容易。所以在和盖尔曼
做了一场长谈之后,他放弃了一切抵抗。"好吧,"他对盖尔曼说:"我试试看。"
  荷兰德承认,其实那时他反正也到了强弩之末了。在盖尔曼给他打来的那两次电话
之间,他盘算着怎样才能让盖尔曼接受他的拒绝,他也已经开始越来越多地考虑,如果
他只能同意的话,他该从何处入手做这件事。而且他开始认识到,做这件事也许会带来
许多机会。进化当然远远不止是随机变化和自然选择。进化同时也是实现和自组。但正
是在这一点上,尽管考夫曼、朗顿和许多其他人做了最大的努力,但仍然没有人能做出
全面的理解。也许这是一个进一步提高认识的机会。荷兰德说:"我开始认真考虑这件事
,我认识到,我可以做一个让马瑞满意的模型,同时从研究的角度,我也能在其中做点
有趣的事。"
  这个模型其实就是他早在七十年代所做的模型的再现。那时他正努力研究基因算法
和撰写《适应》这本书。那时他应邀去芬兰的一个学术会议上做一个演讲。为了好玩,
他决定找一个全然不同的话题:生命的起源。
  他说,他把这个学术报告称为"自发的涌现",他的论文也是基于这个观点。现在回
想起来,他当时的研究角度与自动催化模型相当接近。当时,差不多在同一时期,考夫
曼、曼弗莱德和奥托·罗斯特也正在建立自动催化模型,但都是在孤军奋战。"我的论文
不是这样一种计算机模型,而是可以用来做数学运算的正式模型。我力图显示,可以设
计一个自动催化系统,这个系统可以产生简单的能够自我复制的实体,其计算速度要比
通常快得多。"
  创世主义者仍然喜欢引用的那些通常的计算法,是科学家们在五十年代提出来的。
争论的焦点是,自我复制的生命形式不可能起源于初始原汤中的随机性化学反应,因为
这样所要求的时间要远远超过宇宙的年龄。这就好像期待英国博物馆地下室的猴子从乱
敲键盘开始,进化到能够创造出莎士比亚全集:它们会做到这一步的,但这需要非常漫
长的时间。
  但荷兰德并不像考夫曼和其他人那样被这个观点击得溃不成军。他想,随机的化学
反应固然很不错,但化学催化剂又起到什么作用呢?这就一定是非随机的吗?所以荷兰
德在他的数学模式中假设分子的太初原汤,即,由不同长度的弦线连接的任意的符号,
受到自由漂浮的"酶"的作用。"酶"就是对弦线发生作用的运作体。"它们就像拷贝(cop
y)这种非常原始的运作者,依附在任意一根弦线上,对其进行拷贝。"荷兰德说。"其实
我能够证明一个定理。如果一个系统中有这些运行体漂浮其中,假如各种长度的任意弦
线,也就是建设砖块,能够相互组合,那么这个系统就会产生自我复制的实体,其产生
的速度会远远快于纯粹的随机行为。"
  荷兰德把那篇关于自发涌现的论文称为"一个单一的观点",他以前和后来都再也没
有写过这样的论文。但涌现和自组的问题却一直在他的脑海里盘旋不去。事实上,一年
前在罗沙拉莫斯时他还就此和法默、朗顿、考夫曼等人做了长时间的反复讨论。"所以,
马瑞的高压使我想到,也许对此进行深入研究的时机已经成熟了。也许现在我会为这些
想法建立一个真正的计算机模型。"他说。
  在断断续续地对分类者系统做了这些年的研究以后,建立一个计算机模型对他来说
似乎是手到擒来的一件事。既然在最初的论文中,自由漂浮的运行体具有规则的效果—
—"如果你遭遇如此这般的弦线,则对其采取如此这般的行动"——那现在要做的事是,
就这样把它们写入程序,把这个模型弄得越像分类者系统越好。但荷兰德一开始按这个
思路思考就意识到,他的分类者系统有一个严重的哲学上的缺陷。在那篇关于自发涌现
的论文上,自发性是真实的,涌现也完全是来自内部的,但分类者系统尽管具有学习的
功能和发现突发规则群的能力,但却仍然存在在紧要关头突然出现,从而扭转了局面的
外部因素。这个系统仍然依靠程序员的影子操纵。"分类者系统获得奖赏只是因为我决定
了输赢的规则。"荷兰德说。
  这一点一直令他烦恼不已。撇开宗教的问题不说,现实世界运转正常,并不需要宇
宙仲裁人的裁决。生态系统、经济体系和社会等所有这一切都在依循达尔文的相对论原
则运行。每个人经常不断地在与其他人相互适应。正因为如此,我们就不可能掂量着一
个作用者说:"它的强健度为1.375。"生物学家分辨说,无论"强健"意味着什么,自从
达尔文时代以来,强健度已不可能是一个单一而确定的数字。这就好像是拿一个体操运
动员和一个相扑摔跤手做比较,这个问题是毫无意义的,因为这两者之间不存在一个共
同的衡量标准。一个特定的生物体的存活和繁衍的能力有赖于它跻身于怎样的生存空间
。它周围都有什么别的生物体、它能得到什么样的资源,甚至与它以往的历史也有关。

  荷兰德说:"这一观点的改变极其重要。"确实,进化生物学家用一个名词来表述其
重要性:生态系统的生物体不只是演化,而是共同演化。生物体不是像费什这一代生物
学家所认为的那样,是通过攀登某种抽象的强健制高点来得以变迁的(古典人口基因学
中关于强健最大化生物体的观点,与新古典经济学的关于功能最大化作用者的观点看上
去如出一辙)。而在现实中,生物体在共同演化的无限复杂之舞中,经常在循环往复、
相互追逐。
  荷兰德说,从表面上看,共同演化像是一片混沌。在研究所里,考夫曼喜欢将此比
喻成在一个橡皮场景中攀登强健度的制高点。每攀登一步,整个橡皮的场景就会变一次
形。然而,这样的共同演化之舞所产生的结果却一点儿都不混乱。在自然界中,花朵靠
蜜蜂的帮助来受精繁殖、蜜蜂靠花蜜来维持生命。猎豹追逐吞食瞪羚,瞪羚则能从猎豹
的爪下逃生。共同演化产生了无数能够完美地相互适应,并能适应于其生存环境的生物
。在人类社会中,共同演化之舞产生了同样完美的经济与政治的相互依存之网,比如像
同盟与竞争,以及供求关系等。这正是阿瑟的玻璃屋经济的动力之源。在阿瑟的这个概
念中,你能够观察到人工经济作用者在相互适应。这是深埋在阿瑟和考夫曼的自动催化
技术变迁分析中的动力之源,这也是在这个没有中央权威的世界上隐藏于各国关系之中
的动力之源。
  荷兰德说,确实,共同演化是任何复杂的适应性系统突变和自组的强大力量。他由
此而明白,如果他真要想从最深层次来理解这些现象,他就必须从他的系统中排除来自
外部的奖赏机制。但不幸的是,他也知道,对来自外界奖赏的假设是与分类者系统的市
场比喻紧密相关的。在荷兰德建立的分类者系统中,每一条分类者规则都是一个极小、
极简单的作用者,它们一起参与内部经济体系,在这个内部经济体系中,通用的货币就
是每个作用者的"强度",而唯一的财富之源就是来自最终用户的回报,即来自程序员。
如果不彻底改变分类者系统的构架,就根本无法绕过这个问题。
  所以,荷兰德要做的就是彻底改变分类者系统的构架。他认为,他需要的是一个全
然不同的、更加彻底的对相互作用的比喻:战斗。他设计了一个生态系统,在这个高度
简化的生物社区中,数字化的生物体在数字化的环境中游荡,寻找着赖以维生和繁衍的
资源,这些资源就是数字化的水、草、壳物、草莓等。当这些生物碰到一起时,它们当
然会试图将彼此作为资源。荷兰德说:"我把这与我女儿曼加的'邮寄怪兽'的游戏做了比
较。在这个游戏中,你有很多攻击和防守的可能步骤,你怎样利用这些可能的步骤,决
定了你在与其它怪兽战斗中的输赢。"
  更具体一些说,生态系统代表的环境是一片广袤的平原,其中遍布着"泉眼",从泉
眼里喷出以a、b、c、d为象征的各类资源。单独的生物体随意地漫游在这个环境中,像
平静而温和地在四野吃草的羊一样一路吞食资源,并储存到自己的内部资源库中。但只
要当两个生物体相遇,它们马上就会从羊的状态转入狼的状态,相互进攻。
  在接下来的战斗中,战斗的结果取决于每个生物体的那对"染色体",这染色体只是
一组资源象征符号串成的两个序列,比如aabc和bbcd。"如果你是其中的一个生物体,那
么你就用你的每一序列的'攻击性'染色体与对方的第二序列'防御性'染色体相匹配,如
果它们俩能够相互匹配,那你就得到高分。这种情形非常类似于免疫系统:如果你的攻
击能对应对方的防守,那你就打开了缺口。而对方也对你报之以交互的行动,即,他的
攻击与你的防守相匹配。这种相互作用极其简单。主要看你的攻击与防守能力能否强过
对手。"
  他说,如果回答是肯定的,那你就能饱餐一顿:你对手储备库里所有的资料符号和
它的两个染色体序列都归你所有了。而且,如果吃掉你以前的对手意味着,目前你的储
备库里有足够的资料符号来复制你自己的染色体,那么你就能通过创造一个全新的生物
体来自我繁衍,其中也许会有一、两个变种。但如果情况不是这样的话,那你就回去接
着吃草。
  婉转一些说,这个生态系统不完全是盖尔曼想要的那种,使用者会感到没有什么好
玩的,也没有一点儿新奇的图像。但荷兰德才不会去理会这些呢。他会打入一串密码和
符号来启动这个系统,然后看到它产生出更多的密码,看到一行行字母数字乱码像瀑布
一样在屏幕上涌现出来(那时他的计算机已经升级到苹果二型机了)。这个生态系统是
荷兰德式的游戏。在这个游戏中他终于排除了明显的外来回报。他说:"这是一个封闭的
圈子。你真正回到了'如果我不能寻找到足够的资源来复制我自己,我就无法生存'这样
一个概念。"他抓住了他认为是生物竞争本质的东西。现在他可以把这个系统当作知识乐
园,当作一个探索和了解共同演化的真正作用的地方。"我将生态系统中的很多现象都列
入了研究计划。我想证明,即使用这个极其简单的结构,每种现象也都能够以这种或那
种方式显现出来。"
  荷兰德最有兴趣研究的生态现象是被英国生物学家里查德·达金斯称为进化的军备
竞赛现象。这就是为什么植物的表层演化得越来越坚硬,越来越能产生有毒的化学驱虫
剂来抵抗害虫袭击的原因。而害虫也演化出更坚硬的颚和更复杂的化学抵抗机制来与之
抗争。在这点上,红皇后假设又是著名的一例。这个假设来自于《爱丽丝梦游仙境》一
书。书中的人物红皇后告诉爱丽丝,她必须以最快的速度奔跑才能呆在原来的地方。进
化的军备竞赛似乎是自然界日益复杂化、日益专业化的主要的推动力量,正如冷战中真
正的军备竞赛是日益复杂化、日益专业化武器产生的主要推动力量那样。
  在1988年秋季,荷兰德当然无法就进化的军备竞赛做太多的研究。那时他的生态系
统还只是一个书面设计。但在一年左右时间里,这个系统就运作得非常成功了。"如果从
非常简单的生物体开始,只用一个字母来代表生物体的进攻性染色体,用另一个字母来
代表防御性染色体,那么我就会看到多字母染色体的生物体(这些生物体可以通过变种
来加长它们的染色体)。它们在共同演化。如果一个生物体把攻势增强了一些,另一个
生物体就会增强其防御力量。因此它们越变越复杂。有时它们还会分裂,这就产生了一
个新的物种。"
  荷兰德说:"这时我看到,如此简单的机制能产生军备竞赛和物种的形成,我的兴趣
更加浓厚了。"
  特别是,他想了解进化中的一种深层的自相矛盾性。事实上,这种无情的竞争不但
导致了进化的军备竞争,也导致了共生现象和其它形式的合作现象。确实,荷兰德把各
种形式的合作作为自己的研究兴趣毫不奇怪。这是生物进化的根本问题,更别说这也是
经济学、政治科学和所有人类现象的根本问题。在这个竞争激烈的世界上,生物体究竟
为什么会相互合作?为什么他们会对轻易就会翻脸的"同盟者"门户开放?
  著名的"囚犯的两难境地"很精彩地揭示了这个问题的本质。"囚犯的两难境地"最初
是由一群数学家从博弈理论发展而来的。这个故事说的是:两个囚犯被分别关在独牢里
。警方对他们俩共同犯的一个案子进行审讯。两个囚犯都可以做出自己的选择:他要么
供出他的同伙(即背叛他),要么保持沉默(也就是与他的同伙合作,而不是与警方合
作)。现在,这两个囚犯都知道,如果他俩都保持沉默的话,他俩都会被释放,只要他
们拒不承认,警方无法给他们定罪。但警方也完全明白这一点。所以他们给这两个囚犯
一点儿刺激:如果他们其中的一个人背叛,告发了他的同伙,那么告发的囚犯就会被无
罪释放,同时还会得到一些奖赏。而他的同伙就会被按最重的罪来判决,而且为了羞辱
他,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯相互背叛的话,
两个人都会被按最重的罪来判决,谁也不会得到奖赏。
  所以,这两个囚犯该怎么办呢?是相互合作还是相互背叛?从表面上看,他们应该
相互合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细
考虑。A犯不是个傻子,他马上就意识到,他根本就无法相信他的同伙会不向警方提供对
他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力
实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论
是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保
持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑而向
警方交待了,那么,A犯反正也得服刑,起码他不必在这之上再受罚款。所以其结果就是
,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。
  当然,在现实世界里,信任与合作很少达到如此两难的境地。谈判、人际关系、强
制性的合同和其它许多因素左右了当事人的决定。但囚徒的两难境地确实抓住了不信任
和需要相互防范背叛这令人沮丧的真实的一面。让我们看看冷战时期两个超级大国将自
己锁定在一场四十年的军备竞赛中,其结果对双方都毫无益处。还有看上去永无止境的
阿以僵局,和各国的贸易保护主义的永恒倾向。在自然界,看一看过于相信他人的生物
也许会被吃掉。所以这个问题又出现了:为什么所有生物体都敢于相互合作呢?
  这个答案大部分来自荷兰德在密西根大学巴奇小组的成员罗伯特·爱克斯罗德组织
的一场计算机竞赛。爱克斯罗德是一个政治科学家,对合作的问题久有研究兴趣。他组
织这个竞赛的思路非常简单:任何想参加这个计算机竞赛的人都会扮演其中一个囚犯的
角色,然后这个程序会被成双成对地融入不同的组合,参与者就开始玩"囚犯的两难境地
"的游戏,每个人都要在合作与背叛之间做出选择。但这里有个不同之处:他们不只玩一
遍这个游戏,而是一遍一遍地玩上200次。这就是博弈理论家所谓的"重复的囚犯的两难
境地",这更逼真地反映了某种经常而长期的人际关系。而且,这种重复的游戏允许程序
在做出合作或背叛的抉择时参考对手程序前几次的选择。如果这两个程序只玩过一个回
合,则背叛显然就是唯一理性的选择。但如果这两个程序已经交手过多次,则双方就建
立了各自的历史和在这方面的声誉。然而,对方的程序将会如何举动却极难确定。确实
,这是爱克斯罗德希望从这个竞赛中了解的事情之一。一个程序能总是不管对手做何种
举动都采取合作的态度吗?或者,它能总是采取叛卖行动吗?它是否应该对对手的举动
回之以更为复杂的举措?如果是,那会是怎么样的举措呢?
  事实上,竞赛的第一个回合后交上来的十四个程序中包含了各种复杂的策略。但使
爱克斯罗德和其他人深为吃惊的是,桂冠属于最简单的策略:针锋相对(TIT FORTAT)
。这是多伦多大学心理学家阿纳托·拉帕波特(Anatol Rapoport)提交上来的策略。针
锋相对的策略以合作开局,但从此以后就采取以其人之道,还治其人之身的策略。那就
是,针锋相对的策略实行了胡萝卜加大棒子的原则。它永远不先背叛对方,从这个意义
上来说它是"善意的"。它会在下一轮中对对手的前一次合作给予回报,从这个意义上来
说他是"宽容的"。但它会采取背叛的行动来惩罚对手前一次的背叛,从这个意义上来说
它又是"强硬的"。而且,它的策略极为简单,对手程序一望便知其用意何在,从这个意
义来说它又是"简单明了的"。
  当然,因为只有为数不多的程序参与了竞赛,针锋相对策略的胜利也可能只是一种
侥幸,但也许不是。在上交的十四个程序中,有八个是"善意的",它们永远不会首先背
叛。而且这些善意的程序都轻易就赢了六个非善意的程序。为了决出一个结果来,爱克
斯罗德又举行了第二轮竞赛,特别邀请人们从针锋相对策略那里将桂冠夺过来。这次有
六十二个程序参加了竞赛,针锋相对策略又一次夺魁。结论是无可争议的。好人,或更
准确地说,善意的、宽容的、强硬的、简单明了的人,确实总是赢家。
  荷兰德和巴奇小组的其他成员对这一切当然深为着迷。"我一直对'囚犯的两难境地
'深感苦恼,"荷兰德说。"这是我不喜欢的事情之一。所以看到这个竞赛结果我非常高兴
。这真令人鼓舞。这游戏太棒了。"
  针锋相对策略的胜利对生物进化和人类事务所具有的深刻含义是显而易见的。爱克
斯罗德在1984年发表的《合作进化》一书中指出,针锋相对策略能导致社会各个领域的
合作,包括在最无指望的环境中的合作。他最喜欢举的例子就是第一次世界大战中自发
产生的"自己活,也让他人活"的原则。当时在前线战壕里的军队约束自己不开枪杀伤人
,只要对方也这么做。处于无人区的军队根本无法与地方军队取得联系,而且他们当然
不会是朋友。但使这个原则能够实行的原因是,双方军队都已陷入困境数月,这给了他
们相互适应的机会。
  在这本书的其中一章中,爱克斯罗德还指出,针锋相对的相互作用使得自然界即使
没有智能也能产生合作关系。这一章是他与他的合作撰写人,巴奇小组的生物学家威廉
姆·汉弥尔顿共同写的。在这方面他们举了地衣等例子:真菌从地下的石头中汲取养分
,为海藻提供了住食,而海藻反过来又为真菌提供了光合作用;金蚁合欢树为一种蚂蚁
提供了住食,而这种蚂蚁反过来又保护了该树;无花果树的花是黄蜂的食物,而黄蜂反
过来又为无花果树传授花粉,将树种撒向四处。
  更广泛地说,共同演化会使针锋相对的合作风格在这个充满背信弃义劣行的世界上
蔚然成风。爱克斯罗德说,假设少数采取针锋相对策略的个人在这个世界上通过变种而
产生了。那么,只要这些个体能相互遇见,足够在今后的相逢中形成利害关系,他们就
会开始形成小型的合作关系。一旦发生了这种情况,他们就能远胜于他们周围的那些背
后藏刀的类型。这样,参与合作的人数就会增多。很快,针锋相对式的合作就会最终占
上风。而一旦建立了这种机制,相互合作的个体就能生存下去。如果不太合作的类型想
侵犯和利用他们的善意,针锋相对政策强硬的一面就会狠狠地惩罚他们,让他们无法扩
散影响。爱克斯罗德写道:"这样,社会进化的齿轮就会有所掣肘。"
  这本书出版不久,爱克斯罗德就与荷兰德当时带的研究生史蒂芬尼亚·福莱斯特(
Stephanie Forrest)共同将这种合作的情形用计算机模拟了出来。问题是,共同演化的
一个人群是否能通过基因算法来找到针锋相对的策略。结果答案是肯定的:在计算机运
作之中,会出现针锋相对的策略,或与之类似的策略,并很快在该群人中流行开来。荷
兰德说:"当这种情况出现时,我们都高举双手,三呼万岁!"
  当荷兰德谈到,研究所的人应该像观察"锋面"那样观察社会科学时,他指的正是这
种关乎合作起源的针锋相对的机制。他说,当他在设计开发生态系统时,他脑海里盘旋
的是整个关于合作的问题。合作的机制当然不可能出现在这个程序的第一版本中,因为
他在第一个版本中设入了单个生物体总是会互斗这样一种假设。但在新的版本中,他力
图完善生物体演化的各个方面,包括其合作的可能性。确实,他想把生态系统设计成某
种能够共同演化的、"整体的"模型。
  "在研究所,除了生态系统之外,我们还在创建其他三个模型,一个是股市模型,一
个是免疫系统模型,还有一个是斯坦福大学经济学家汤姆·沙金特建立的贸易模型。我
发现这些系统之间具有非常相似的特点。它们都有'贸易'的存在,都有以各种方式进行
交换的货物,都有'资源转换'机制,比如通过酶或各种生产过程实现资源的转换。而且
它们都有作为技术发明之源的'交配选择'机制。所以我由此开始创建一个完整的共同演
化的模型。我记得史蒂芬尼亚·福莱斯特、约翰·米勒和我坐了下来,努力想弄清楚,
如何在生态系统中设入最小的装置,来模拟出所有这些特点?我们的结论是,用不着改
变基本的模型,只消在进攻和防御染色体上增加内容就能做到这一点。我提供可以由染
色体来界定的额外的分辨体,从而增加了贸易的可能性,这些分辨体类似于商标,或细
胞表面的分子标签。同时我必须在这个生态系统中加上一条类似规则的东西,我这是第
一次这么做。这条规则是:'如果其他人显示这样的识别标签,则我就和他进行贸易,而
不是进行战斗。'这就产生了合作的演化,以及说谎和模仿这类非常规现象。我基于这样
的设想,草拟出如何做一个沙金特式的模型的想法,然后就开始构思如何通过从另一个
方向把生态系统设计成看上去像一个免疫系统的模型。现在的生态系统模型正是由此而
来的。"
  荷兰德说,生态系统的这个统一的版本做得非常成功。这个系统可以演示合作演化
,同时也可以演示食肉动物和猎物之间自发形成的关系。这一成功激励我开始研究设计
更高级版本的生态系统。"我目前正在编写的最新版本能演示多细胞生物体的演化。所以
现在我们不只限于探讨贸易,我希望我们还能探讨个体和组织的涌现。每个作用者都极
力提高其繁殖率,但又总是受到总体组织延续的制约,这里面有许多值得研究的名堂。
癌症就是这方面的一个很好的例子,就先不谈美国的自动化工业的情形了!"
  荷兰德说,这种模型的实际应用为期还早,但他确信,这方面的一些优秀的计算机
模拟也许会比桑塔费其它研究项目对这个世界做出的贡献要大。"如果我们做得好的话,
那些不是科学家的人,比如华盛顿的官员们,可以不需要了解这些模型运行的详情便能
够建立这类模型,从而助使他们把握各种政策性选择的真正含义。"他说,从大体上说,
这样的模型就像政策的飞行模拟器一样,能够使政治家模拟经济的强迫着陆,而不需要
让两千五百万人都搭上这架飞机。这些模型甚至不必做得很复杂,只要能让人对情况的
发展和最重要变量的相互作用力产生逼真的感受就行了。
  荷兰德承认,当他在华盛顿谈论这个飞行模拟概念时,并没有引起听众的重视。大
多数当政的政治家都忙于躲闪迎面而来的打击,无暇顾及下一次飞行的政策问题。另一
方面,他显然不是唯一从模拟角度来考虑策略的人。1989年,加州奥林达的麦克塞斯公
司推出了一种叫"模拟城市"的游戏。这个游戏可以让玩者扮演市长的角色,面对犯罪、
污染、交通堵塞、抗税等种种问题,努力使他或她的城市繁荣昌盛起来。这个游戏很快
就跃上了畅销排行榜之首,同时赢得了真正的城市规划管理人的高度信赖。他们说,尽
管"模拟城市"的游戏在具体细节上去冗删繁,但它找对了感觉。荷兰德当然也买了这个
游戏,而且非常喜欢它。"'模拟城市'是我所知道的最好的一个飞行模拟概念的例子。"
他说。桑塔费研究所正认真和麦克塞斯公司商谈改造"模拟城市"的接口,使其能够用于
桑塔费的许多模拟中。荷兰德现在正和麦克塞斯公司一起开发一个用户友好介面的生态
系统版本,使任何人都能在上面做计算机实验。
心智的网络实验室
  与此同时,阿瑟在桑塔费经济学项目的最初这段日子中也对计算机实验发生了浓厚
的兴趣。"我们就像在从事常规经济学那样用计算机程序来做数学分析和定理证明,但因
为我们研究的是报酬递增率、学习以及适应性和归纳法这些界定含糊的概念,所以问题
往往复杂得无法用数学来解决。因此我们不得不借助计算机来观察事情的发展结果。计
算机就像一个网络实验室,我们可以由此观察我们的思想变成行动的结果。"
  但阿瑟的问题是,即使在桑塔费,经济学家们一想到用计算机模型也会变得神经高
度紧张。"我猜我们不得不在经济学中引入计算机模拟了,但我想我已经上了年纪,很难
改变了。"有一天午餐时阿罗闷闷不乐地说。
  "感谢上帝,我的小伙子,如果定理的时代要退出历史舞台了的话,我也就随之而退
场了。"六十多岁的汉恩在另一个场合这么说。
  阿瑟不得不承认经济学家的怀疑和犹疑是有一定道理的。在很多方面,他自己也有
同感。他说:"在经济学领域,计算机模拟全无成功之例。在我个人的早期经历中,我和
我的同事杰佛里·麦克尼考花了很长时间来观察模拟模型在经济学的作用,我们得出了
两个结论,这两个结论现在已成为普遍的共识。第一个结论是,总的来说,只有那些不
能做分析性思考的人才借助计算机模拟。经济学要求用演绎法和逻辑分析,而计算机模
拟却正好与之相反。第二个结论是,你只要把自己的假设设置于计算机模型,就可以从
计算机模拟中想得到什么结论就能得到什么结论。人们经常从基本的政治角度出发,比
如,我们需要降低税收,那么就做一个对降低税收如何如何有利的假设。我和杰佛里设
计了一种游戏,它能够深入到模型里去发现改变一个假设怎样改变了整个结果。其他人
也做过类似的事。所以计算机模拟在社会科学,特别是在经济学领域里声名狼藉,就好
像是无赖的手法。"
  事实上,即使是这些年以来,阿瑟发觉自己对"模拟"这个词仍然有一种警惕心。他
和他的同事们更愿意将经济学程序称为"计算机实验",这个词体现了荷兰德和桑塔费的
物理学家所实践的某种严谨性和准确性。他说,荷兰德和物理学家们从事计算机模拟的
方法给了他很大的启发。"我认为这太妙了。到了极为小心的人手里,所有的假设都经过
仔细斟酌,整个算法明确清晰,模拟就像实验室的实验一样具有可重复性和严谨性,在
这种情况下,我发现计算机模拟是无懈可击的。事实上,物理学家在告诉我们,有三种
可以从事科学研究的方法:数学理论、实验室的实验和计算机模拟。你必须反复使用这
三种方法。当你发现计算机模拟的结果似乎不符合常情,你就回过头去从理论上理解它
,然后再以理论为依据,回到计算机模拟或实验室去印证。对我们许多人来说,似乎经
济学研究也可以照此办理。我们开始认识到,以往的经济学过于自我局限,只对能用数
学进行分析的问题做研究。但现在我们进入了归纳法的世界,一切都变得极为复杂,我
们可以用计算机实验来拓展研究的范围。我把这视为一个势在必行的发展方向,一种解
放。"
  当然,阿瑟希望桑塔费经济学项目能开发出足以说服其他经济学家的计算机模型来
。或,起码不要使他们再次失望。确实,到1988年秋天时,阿瑟和他的经济学项目组已
经用了好几个这样的计算机实验了。
  阿瑟与荷兰德的合作直接诞生了最初的玻璃房经济的设想。"1988年6月,我到桑塔
费后意识到,我们需要从一个切实的问题入手,而不是一开始就建立完整的人工经济学
模型。这个想法引出了人工股市模型。"
  阿瑟解释说,在经济学的所有陈芝麻烂谷子的问题中,股市行为是最古老的问题之
一。这是因为新古典经济学发现华尔街完全不可理喻。有论点说,既然所有的经济作用
者都是完全理性的,那所有的投资者必然是完全理性的人。而且,既然这些完全理性的
投资者对所有股票的长远预期获利都掌握同样的信息,那他们对每股股值的估计,即,
在扣除利率后的预期净利,就应该总是一致的。照此推理,这种完全理性的市场就永远
不可能陷入投机性的炒做和崩盘,股市最多只会由于对各种股票预期的最新信息而稍有
波动。无论怎样,根据逻辑推理,纽约股票交易所大厅必然是个非常安静的地方。
  但事实上,纽约股票交易所大厅几乎成了一个失控之地,形形色色的泡沫和崩盘在
大起大落,横扫交易大厅,就更别提人群的恐惧心理和不安全感、以及狂喜和聚众闹事
的欲念搅成一锅粥的情状了。如果有个火星人订阅一份星际版的华尔街日报,读完报纸
后也许会认为股市是一个什么活物。阿瑟说:"在有关股市的报道中,记者总是用描述心
理的词汇来描述股市:股市极度紧张不安、股市萎靡沮丧、股市信心十足。"股票交易所
本身就是人工生命的一种形式。阿瑟说,所以他们在1988年认为,用桑塔费的方式来模
拟股市似乎是唯一能够解释股市的方法。"我们的想法是做小面积的剖析,先用常规的新
古典经济学的完全理性的作用者的假设来做模拟,然后再用能够像人类那样学习和适应
环境的人工智能作用者取而代之。这个模型有一个股市,作用者可以在其中自由买卖。
随着他们对贸易规则的掌握,你会看到各种市场行为涌现出来。"
  问题显然在于,会发生什么样的涌现行为?这些作用者会像常规经济学描述的那样
安然自若地进行股票交易吗?或者,它们的行为模式会如风起云涌的股市那样逼真吗?
阿瑟和荷兰德毫不怀疑会发生后一种情况。但事实上,即使在研究所,很多人也对此抱
怀疑态度。
  阿瑟对1989年3月份的一次会议的记忆尤为深刻。当时荷兰德从安·阿泊返回研究所
,另外还有几个人也来参加在小教堂举行的这个经济学研讨会。当谈到股市模型的这个
题目时,沙金特和明尼苏达大学的莱蒙·马里蒙都激烈地争辩说,适应性作用者叫的价
会很快向股票的"基价"靠拢,也就是,肯定会出现新古典经济学理论预期的那种情况。
他们说,股市也许会出现偶尔的上下波动,但作用者无法真正别有所为。基价就像一个
无限巨大的万有引力场一样将它们紧紧吸引得不离左右。
  "我和约翰(荷兰德)相互望望,然后一个劲地摇头。我们说,这不可能。强烈的直
觉告诉我们,我们建立的股市具有自我组织行为方式的巨大潜能,会越变越复杂,新的
、丰富多采的行为会涌现出来。"阿瑟说。
  阿瑟回忆说,他们就此发生了一场激烈的争论。当然,阿瑟知道,自从1987年9月召
开了第一次经济学研讨会以后,沙金特对荷兰德研究学习的方式就一直持有浓厚的兴趣
。其实沙金特早在这之前就开始研究学习对经济行为的影响。而马里蒙当时就像阿瑟一
样对计算机实验极感兴趣。但在阿瑟看来,马里蒙和沙金特似乎并不真正把学习当作研
究经济学的新视角。他们似乎把学习当作巩固常规经济学理论的一种方法,就好像是在
用这种方法来理解经济作用者在不完全理性的情况下是如何摸索到新古典经济学的行为
模式的。
  公平地说,阿瑟必须承认,这两个人有理由这样认为。沙金特在他研究的"理性的期
望"理论之外,还掌握了一些实验证据来支持他们的论点。研究者证明,在一系列让学生
们扮演股票交易者的计算机模拟实验中,实验对象的交易价格很快就会集中到股票基价
上。而且,马里蒙和沙金特也在进行他们自己的桑塔费式的计算机模拟实验:一种被称
为"威克塞尔三角"的老问题。情节是这样的:三个不同类型的作用者生产和消费三种不
同类型的货物,其中之一最终变成了一种交换的中介:钱。当马里蒙和沙金特用分类者
系统替代了原来模型中的理性作用者后,发现这个系统每一次都回到新古典经济学的结
论上(也就是说,交换的媒介是库存成本最低的货物——比如说,是金属磁盘,而不是
鲜牛奶)。
  尽管如此,阿瑟和荷兰德仍然不放弃努力。阿瑟说:"问题是,逼真的适应性行为真
的会导致理性期望的结果吗?我认为,答案是肯定的,但这只有在面对非常简单的问题
、或这个问题一再出现的情况下才有可能。从根本上说,理性期望的理论是说,人类并
不愚蠢。这就像玩连圈叉的井字游戏一样(tic-tac-toe),几次以后就能学会预测对
手的行为,于是双方就能把这个游戏玩得滴水不漏。但如果是在一个决不会重复出现的
情况下,或在非常复杂的情况下,作用者必须做大量的算计,那么你对作用者的要求就
太高了。因为你这就是在要求它们了解自己的期望、把握市场的驱动力。把握其他人的
预期。以及其他人对其他人的预期的预期、等等。很快,这些倒霉的作用者就会陷于无
法预期的状况。"在这种情况下,阿瑟和荷兰德认为,作用者就会处于极不均衡的状况,
导致理性期望值的"万有引力"就会变得非常微弱,动力和意外事件就会主宰一切。
  阿瑟回忆说,这场既友好又激烈的争论持续了一段时间。当然,结果双方谁也没有
退让。但阿瑟明显感到这对他是一场挑战:如果他和荷兰德相信他们的股市模拟能展现
逼真的涌现行为,那么,他们就必须证明这一点。
  但不幸的是,股市模型的编程工作时续时断。1988年6月的一天,在午餐时间,阿瑟
和荷兰德粗拟了这个计算机模拟的初槁。当时他们俩都在桑塔费的首期复杂系统暑期班
上担任讲师。那年夏天,荷兰德回到安·阿泊,用阿瑟唯一了解的计算机语言,BASIC语
言,编写了完整的分类者系统和基因算法(这使荷兰德终于摆脱了用十六位进制符号编
写程序。他只得自学了BASIC语言。但从此他只用BASIC语言编写程序)。那年秋季,在
经济学项目开始的最初几个月,荷兰德回到了桑塔费。他一回到桑塔费就和阿瑟一起进
一步开发股市模型。但由于将此编写为生态系统占去了荷兰德许多时间,而阿瑟又苦于
行政事务缠身,所以股市模型编写进展缓慢。
  更糟糕的是,阿瑟开始意识到,尽管分类者系统的概念有许多强处,但使用起来却
麻烦甚多。他说:"起初,桑塔费的人都认为分类者系统是全能的,能解答股市的问题,
也能在早上替你煮咖啡。所以我曾经和荷兰德开玩笑说:'嘿,约翰,分类者系统真的能
够产生低温核聚变吗?'"
  "到了1989年初,戴维·莱恩和里查德·派尔默组织了一个专门研究荷兰德思想的小
组,每周有四次午餐前的聚会。那时候荷兰德已经离开了桑塔费,但我们花了一个月的
时间来研究他的《归纳法》一书。当我们深入到分类者系统技术之中的时候,我发现,
对分类者系统的构架设计必须十分小心,才能保证它在实际中能够运用,而且还必须对
规则之间环环相扣的环节设计得十分周密。同时,你设计的可能会是'深度'分类者系统
,那就是,一个规则激活另一个规则、再激活另一个规则,从而引起长长的连锁反应的
分类者系统,或者,你设计的可能是'广度'分类者系统,即,刺激-反应式的系统,它
能在稍有差别的情况下能产生150种反应方式。我的经验是,广度系统的学习功能非常强
,而深度系统则不然。"
  阿瑟和荷兰德以前的学生史蒂芬尼亚·福莱斯特对这个问题做了许多探讨。福莱斯
特现在在新墨西哥大学,是桑塔费研究所的常客。她告诉阿瑟,问题出在荷兰德的水桶
队列算法上。这个算法能够对各种规则论功行赏。如果水桶队列算法能够倒过来奖励上
几代规则,那等到倒溯到这些规则的鼻祖的时候,奖品已经所剩无几了。所以毫不奇怪
,为什么浅显系统的学习功能较佳。确实,对水桶队列算法的提炼与改良已经成为分类
者系统研究中最紧迫的一环了。
  阿瑟说:"这些使我开始对分类者系统产生了怀疑。随着我对这个系统越来越熟悉,
这个系统的弊端也就变得越来越明显了。然而,我越是仔细研究这个系统,就越是叹服
其中所包含的思想:你的脑子里可以有许多相互矛盾的假设,这些假设可以相互竞争,
因为这样你就不必把某种专家预先编入这个系统,我真的非常欣赏这个思想。我开始从
与荷兰德略有不同的角度来构想他的系统。我把它们想成是普通的计算机程序,有许多
模数和分支点,但其程序每次都要自己判断究竟该激活哪一个模数,而不是沿着固定的
序列来激活这些模数。一旦当我开始把它们构想成是一种自我适应的计算机程序,我就
感到顺畅得多了。我认为这正是荷兰德的成就之所在。"
  他说,不管怎样,他们终于完成了股市模型的版本。沙金特对最初的设计提出了许
多简化办法,对这个版本的出台给予了很大帮助。1989年春末,杜克大学物理学家里查
德·派尔默也加入了进来,以他高超的编程技术大力支持了这个模型的出台。
  同时,派尔默和荷兰德、阿瑟一样,也被这个模型深深吸引住了。他说:"这个模型
关系到自我组织,这正是我深感兴趣的研究领域。大脑是怎样组成的?什么是自我意识
的本质?生命是怎样自发产生的?我的脑子里一直盘旋着这些重大的问题。"
  另外,他正在为自己已经花费了大量时间来从事的另外一个桑塔费研究项目感到焦
虑不安。这个项目就是"双重喊价竞赛"模型,这是他和卡内奇麦伦大学的约翰·米勒和
威斯康星大学的约翰·鲁斯特共同设计开发的。这个最终于1990年初举办的竞赛是在19
87年9月第一次经济研讨会上构思的。这个模型在原理上与爱克斯罗德在10年前设计的模
型非常类似。但这个模型不是重复运作"囚犯的两难境地"的游戏,而是包含了交易者对
付像股票交易这样的商品市场的各种策略。是不是最好一开盘就叫价?是不是先别做声
,等到最好的价格出现时再叫价?因为买卖双方在这样的市场上都是自发叫价的,所以
这个系统就被称为"双重叫价",而答案却是冥然不知的。
  派尔默说,这个竞赛游戏应该非常有趣,对他和他的同事来说,为这个游戏编程当
然也是一个很大的挑战。但这个模型中的作用者基本上是静态的。对他来说,这个竞赛
游戏根本就没有阿瑟和荷兰德式模型的神奇魅力。在阿瑟和荷兰德式的模型中,你可以
看到作用者越变越复杂,能够发展成为自己真正的经济生命。
  派尔默从早春就开始以全副精力投入了股市模型的设计和开发。1989年5月,他和阿
瑟完成了股市模型的初版。按照他们设计的意图,这个模型在开始时,其作用者完全愚
昧无知,都是一些随意制定的规则,让它们自己学会如何叫价。他们发现,这些作用者
就像他们预期的那样,学习进展神速。
  他们观察到,这个系统每一次运行的结果都像见了鬼似地符合汤姆·沙金特的预言
。阿瑟说:"在这个模型中,单股的股息是三美元,折扣率为百分之十,这样,股票的基
价为三十美元。而股价真的就在三十美元上下浮动,证明了常规经济学理论的正确!"
  阿瑟深感懊丧和烦恼。现在唯一可做的似乎是把沙金特从斯坦福大学叫回来,祝贺
他的胜利。"但有一天早上我和里查德走进办公室,在我的苹果机上运作这个系统。我们
一直在观察其运作,一边讨论着如何改进这个程序。我们注意到,每当价格达到三十四
美元时,作用者就会买进。我们可以把这种情况图示化,情况似乎很异常。我们以为是
这个模型出了错误。但当我们又苦苦思考了一个多小时以后,才认识到这个模型并没有
错误,而是这些作用者发现了技术分析的原始形式。那就是,这些作用者开始相信,如
果股价上涨到一定程度,就会继续看涨,那就买进。但当然,这种认识变成了一种自圆
其说的预言:如果在股价达到三十四美元时有足够的作用者意欲购买,那就会造成股价
继续看涨。"
  而且,当股价跌到二十五美元时,就会发生正好相反的情况:作用者都会尽力卖出
,这样就对股市看跌也形成了一个自圆其说的预言。这正是股市出现泡沫和崩盘的道理
!阿瑟为之精神大振,就连平时最小心翼翼的派尔默都受到了他热情的感染。阿瑟说,
这个结论在这个模型的最新的、更完整的版本中一再得到确认。但在1989年5月的早晨他
们就意识到他们成功了。
  "我们马上意识到,我们已经从这个系统中窥见了突发特征的一线希望,看到了一线
生命的曙光。"
 



--

※ 来源:.哈工大紫丁香 http://bbs.hit.edu.cn [FROM: 202.118.229.86]
[百宝箱] [返回首页] [上级目录] [根目录] [返回顶部] [刷新] [返回]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:205.222毫秒