精华公布栏

发信人: freely (* 风铃 *), 信区: Management
标  题: 生活中的游戏——博弈无处不在(转载)
发信站: 哈工大紫丁香 (2001年12月29日18:32:45 星期六), 站内信件

【以下文字转载自 Economics 讨论区】
【原文由 rainy 所发表】
content "日常生活中的一切，均可从博弈论得到解释，大到近段时间北约轰炸南
联盟，小到今天早上你突然咳嗽了几声。因为生活的本质，就是在进行一场游戏。

可能你觉得，北约轰炸南联盟用博弈论来分析是可以的，但对自己早上咳嗽也可以
用博弈论来理解觉得不可思议，因为自己就一个人，和谁进行游戏？非也，并非只
有你一人，还有一个叫做“自然（Nature）”的“人”，你在同它进行游戏。你可
以把“自然”理解为无所不能的上帝，上帝现在有两种策略，让你生病或不生病。
你咳嗽了，你就不得不根据自己咳嗽的信息判断上帝的策略，然后采取对应的策略
。上帝采取让你生病的策略，你就采取吃药的策略来对付；上帝采取不让你生病的
策略，你就采取不予理睬的策略。看，这不就是一场你和上帝进行博弈的游戏吗？

“自然”是研究单人博弈的重要假定。比如一个农夫种庄稼也是同自然进行博弈的
一个过程。自然的策略可以是：天旱、多雨、风调雨顺。农夫对应的策略分别是：
防旱、防涝、放心地休息。当然，自然究竟采用哪种策略并不确定，于是农夫只有
根据经验判断（或根据气象预报）来确定自己的行动。如果估计今年的旱情教重，
就可早做防旱准备；如果估计水情严重，就早做防涝准备；如果估计是风调雨顺，
农夫就可以悠闲地东转转西走走了。又比如，农夫该在土地上种小麦还是水稻？也
是一个同自然进行博弈的游戏。自然可以选择小麦买高价还是水稻卖高价，农夫则
根据对自然的可能行动的猜测来确定自己的行动。与一般的博弈不同的是，不管“
自然”采取何种策略，也不管你采取何种策略，“自然”的支付（或得益）都是为
0的。

生活中更多的游戏不是单人博弈，而是双人或多人的博弈。比如：商场谈判、政治
斗争、夫妻吵架、恋爱结婚……都是这类博弈。

再给大家介绍一个有趣的博弈例子。它出自张维迎教授的《博弈论与信息经济学》
，讲的是猪圈里有一头大猪和一头小猪，猪圈的一头有一个饲料槽，另一头装有控
制饲料供应的按钮。按一下按钮就会有10个单位饲料进槽，但谁按谁就要付出2个
单位的成本。若大猪先到，大猪吃到9个单位，小猪吃到一个单位；若同时到，大
猪吃7个单位，小猪吃3个单位；若小猪先到，大猪吃六个单位，小猪吃4个单位。
各种情况组合扣除成本后的支付矩阵可如下表示（没格第一个数字是大猪的得益，
第二个数字是小猪的得益）：

　　　　　　　小猪

　　　　　按　　　等待

大猪　按 5，1　　　 4，4

　　　等待 9，-1 　　0，0

在这个例子中，我们可以发现，大猪选择按，小猪最好选择等待，大猪选择不按，
小猪还是最好选择等待。即不管大猪选择按还是不按，小猪的最佳策略都是等待。
也就是说，无论如何，小猪都只会选择等待。这样的情况下，大猪最好选择是按，
因为不按的话都饿肚子，按的话还可以有4个单位的收益。所以纳什均衡是（大猪
按，小猪等待）。

这个例子是一个多劳不多得的例子。现实中这种情况是很普遍的，一些努力工作的
人和不工作的人得到与付出并不相称。改革也有类似的情况，在改革过程中利益的
转移必定使一部分人先富一部分人生活水平没得到改善，前一部分人更有改革的积
极性。也就是说，改革往往由“大猪”推动，“大猪”越多，改革速度越快。这个
例子也可以反映斯密的“看不见手”教条，本来大猪是追求自身的利益，结果给小
猪也带来了利益。它也解释了“搭便车”行为，例子中的小猪是一个典型的“搭便
车”者，因为它坐享大猪的成果。在这里我们可以联系一下第二章提到的科斯定理
，如果我们严格界定产权，是可以改变这种状况的。比如，以法律的形式规定，大
猪按出的饲料归大猪支配，小猪按出的饲料归小猪支配，那么大猪小猪都存在去按
的动力和积极性。相反，产权不清晰，比如吃大锅饭的情况下，结果是不劳有获、
劳而少获，有点类似一幅漫画——卖力的驴子挨鞭子（一只驴子拉着一辆车，车上
是一个农夫和另外几头驴子，农夫的鞭子落在拉车的驴子身上催它快跑；这只驴子
并没有错，它遭罪只因为它比别的驴子强壮）。于是人们工作的积极性没有了。我
想，这也是为什么我国改革开放不久，就提出了废除“大锅饭”，砸碎“三铁”（
铁饭碗、铁交椅、铁工资）的原因所在了。

在智猪博弈中，无论大猪采取何种行动，小猪都是采取等待。我们把小猪的“等待
”称为“占优战略”（有点“以不变应万变”的意思）。生活中这样的博弈也不少
。比如，某一天你觉得应该是你太太的生日，但又不能肯定：如果是太太的生日的
话，①你可以送一束花，太太会特别高兴，你的效用增加5个单位，②你不送花，
但太太会埋怨你忘了她的生日，你的效用降低2个单位；如果不是太太的生日的话
，①你可以送太太一束花，太太感到意外的惊喜，你的效用增加3个单位，②你不
送花，结果生活同往常一样，可视为你的效用增加0单位。在这个博弈里，我们看
到，“自然”可以有两种策略：确定今天是太太的生日或确定今天不是太太的生日
，但不论“自然”采取何种策略，你的最好行动都是买花。买花是你的占优战略。
博弈距阵如下（自然的得益皆为0）：

　　　　　　　　自然

　　　是太太的生日　不是太太的生日

你买花 5，0　　　　　 3，0

不买花 -2，0 　　　　　　0，0

夫妻吵架也是一场博弈。夫妻双方都有两种策略，强硬或软弱（或称鹰派和鸽派）
。博弈的可能结果有四种组合：夫强硬妻强硬、夫强硬妻软弱、夫软弱妻强硬、夫
软弱妻软弱。至于哪一种是纳什均衡，必须列出其支付矩阵才可以确定。支付矩阵
不一定非要用量化确定的数字表示，也可以用支付函数表示。经济学家们常用支付
函数进行讨论。根据生活的实际观察，夫软弱妻软弱是婚姻最稳定的一种，因为互
相都不愿让对方受到伤害或感到难过，常常情愿自己让步。动物学的研究有相同的
结论，性格温顺的雄鸟和雌鸟更能和睦相处，寿命也更长。夫强硬妻强硬是婚姻最
不稳定的一种，大多数结局是负气离婚。夫强硬妻软弱和妻强硬夫软弱是最常见的
一种，许多夫妻吵架都是这样，最后终归是一方让步，不是丈夫撤退到院子里点根
烟，就是妻子避让到卧室里嚎啕大哭。

犯罪和防止犯罪是罪犯和警察之间进行博弈的一场游戏。警察可以加强巡逻，或者
休息。犯罪者可以采取作案、不作案两种策略。如果罪犯知道警察休息，他的最佳
选择就是作案；如果警察加强巡逻，他最好还是不作案。对于警察，如果他知道犯
罪者想作案，他的最佳选择是加强巡逻，如果犯罪者采取不作案，自己最好去休息
。当然，犯罪者和警察都不可能完全知晓对方将采取的行动，因此他们都将估计对
方采取某种行动的概率，从而决定自己要采取的行动。结果是，他们将以一定的概
率随机地采取行动，这叫“混合策略”。

我们可以简单地分析一下混合策略（对数字不感兴趣的读者可以不看下面一段）。
下面是犯罪者与警察的支付矩阵（假定犯罪者在警察休息时一定作案成功，在警察
巡逻时作案一定会被抓住）：

　　　　　　　　犯罪者

　　　　　不作案　作案

警察巡逻 0，0　　 2，-2

　　休息 2，0 　　　-1，1

这个矩阵的数字含义可以表示，警察巡逻，犯罪者不作案，双方都没有收益也没有
损失；警察巡逻，犯罪者作案，警察因抓到罪犯受到表彰，得到效用2单位，罪犯
被判刑丧失效用2单位；警察休息，犯罪者不作案，警察休息的很愉快得到效用2单
位，犯罪者没有收益也没有损失；警察休息，犯罪者作案，警察因失职被处分而丧
失效用1单位，罪犯犯罪成功获得效用1单位。这个博弈是没有纳什均衡的。

但是，如果警察知道犯罪者以p的概率选择作案(不作案概率就为1-p)，他该怎样采
取自己的行动？对警察而言，巡逻的预期效用为0×（1-p）+2p=2p，休息的预期效
用为2×（1-p）-1×p=2-3p。显然，当2p>2-3p即p>0.4的时候,警察最好选择巡逻
;反之2p<2-3p即p<0.4的时候,警察宁愿选择休息。假设警察应以q的概率巡逻（休
息的概率就为1-q），那么犯罪者最好的行动是什么？他作案的预期效用是-2×
q+1×（1-q）=1-3q，不作案的预期效用为0×q+0×（1-q）=0。显然，当1-3q>0即
q<0.33时，他的理性选择是作案，反之不作案。在这个博弈中，警察以0.33的概率
巡逻0.67的概率休息，犯罪者以0.4 的概率作案0.6的概率不作案构成一个混合纳
什均衡。

上述混合纳什均衡可以这样理解，如果警察以高于0.33的概率巡逻，犯罪者最好是
躲避起来。犯罪者一旦躲避，警察就没有收获，于是降低巡逻的概率，于是犯罪者
重新活跃，于是警察又提高巡逻概率……从一个长期来看，两者的均衡将维持在警
察以0.33的概率巡逻犯罪者以0.4的概率作案上面。现实中，我们看到，当严打的
时候（警察出击的概率较高），犯罪分子便收敛一阵（降低作案概率）；严打的时
期一过，犯罪分子又开始兴风作浪，在不能容忍罪犯过分猖狂的时候，警界不得不
再次开始严打。

在上述例子中，可能大家觉得警察和犯罪者都根据一定概率采取自己的行动不太好
理解，那么可以尝试这样理解他们：作案的犯罪者越多，那么出动的警察将会越多
，作案的犯罪者越少，出动的警察将越少；反过来，出动的警察越多，作案的犯罪
者就越少，出动的警察越少，作案的犯罪者就越多。极端地假设一个例子（它有助
于我们的理解），警局有100名警察，犯罪集团有100名犯罪者，那么上例博弈中，
警察以0.33的概率巡逻而犯罪者以0.4 的概率作案这一纳什均衡可以理解为：在巡
逻的警察少于33人时，犯罪集团最好派40名以上的犯罪者作案；在巡逻警察多于
33人时，犯罪集团最好派40名以下的犯罪者作案；反过来，犯罪集团派40名以下犯
罪者作案，警局最优选择出动33名以下的警察；犯罪集团派40名以上犯罪者作案，
警局最优选择出动33名以上的警察。当然，如果犯罪集团倾巢出动，那么警察的选
择也是全部出动，但警察一旦全部出动，犯罪者最好选择全部不作案，犯罪者一旦
选择全部不作案，警察最好全部选择休息……最后长期的均衡状态是，警局派33名
警察巡逻，犯罪集团派40个人作案。这可以解释现实中，为什么警界总安排有巡逻
力量，而犯罪者也总保持一定的作案数量。

你面临的具体生活事件又何尝不是一场博弈呢？我曾经在一次讲课中给某毕业班的
学生提到了博弈论的观点（就是运筹学里面非常简单的零和博弈那种）。下课后，
就有一名学生向我“求教”对付“赵老师”的办法。赵是分管毕业分配的教师。这
名学生可真有灵性，他已经把博弈论运用到他和决定他前途的赵老师之间了。当时
的情况是，赵希望该同学及早和用人单位签约（因为赵希望早一点把所有同学分配
出去以完成任务），而该同学希望等更好的单位。当然，这个博弈中局中人的收益
函数我们不能确切地知道，因此它是一个不完全信息的非合作博弈（但不可是零和
博弈），博弈的结果也许还和双方的讨价还价能力有关。我当时给这学生的建议是
：你要尽可能了解赵的“信息”（即赵的各种真实想法）；你要向赵传递强硬的信
息（态度坚决）；你要准备充分理由，增强讨价还价能力。

不但生活中许多事情可以看作是一场博弈，整个人生也是一场博弈。这个博弈中的
“局中人”一个是你自己，另一个叫做“命运”。你和命运之间在展开一场以一生
时间为限的游戏。谁输谁赢，取决于你的策略和行动。贝多芬说“我要扼住命运的
咽喉”，他成功了。人生是一场游戏——在这个游戏中，你以一生作注，和命运进
行着一场豪赌，要么赢得痛快淋漓，要么输得一败涂地。世事纷纭如棋局，你在红
尘中的每一步，都象落下一枚棋子，一招失误，并不意味着满盘结束，只要没有和
盘，就不能认输。可惜的是，不少的人，甘听命运摆布。可是也有一些人，奋起与
世事抗争。我比较欣赏持那种态度的人：世事我曾抗争，得失不必在我。

我觉得，不论最后的结果如何，人都应该争取。很多时候我们也需要一种胆识，敢
于面对命运的胆识。我们有理由相信，自己会成为游戏的胜利者。该赌一把的时候
，不要犹豫，坐失良机。有句歌词兼流行广告说的好：该出手时就出手。只不过，
在你所有的人生的博弈中，你必须重视“策略”。

--
我一直想要,和你一起,走上那条美丽的山路.            .oooO  Oooo.
有柔风,有白云,有你在我身旁,倾听我幸福和快乐的心.   (   )  (   )
我的要求其实很微小,                                 \ (    ) /
只要有过,那样的一日,                                 \_)  (_/
只要有过,那样的一次.

※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: sunny.hit.edu.cn]
--
※ 转载:．哈工大紫丁香 bbs.hit.edu.cn．[FROM: 172.16.2.212]