发信人: freely (* 风铃 *), 信区: Management
标 题: 生活中的游戏——博弈无处不在(转载)
发信站: 哈工大紫丁香 (2001年12月29日18:32:45 星期六), 站内信件
【 以下文字转载自 Economics 讨论区 】
【 原文由 rainy 所发表 】
content "日常生活中的一切,均可从博弈论得到解释,大到近段时间北约轰炸南
联盟,小到今天早上你突然咳嗽了几声。因为生活的本质,就是在进行一场游戏。
可能你觉得,北约轰炸南联盟用博弈论来分析是可以的,但对自己早上咳嗽也可以
用博弈论来理解觉得不可思议,因为自己就一个人,和谁进行游戏?非也,并非只
有你一人,还有一个叫做“自然(Nature)”的“人”,你在同它进行游戏。你可
以把“自然”理解为无所不能的上帝,上帝现在有两种策略,让你生病或不生病。
你咳嗽了,你就不得不根据自己咳嗽的信息判断上帝的策略,然后采取对应的策略
。上帝采取让你生病的策略,你就采取吃药的策略来对付;上帝采取不让你生病的
策略,你就采取不予理睬的策略。看,这不就是一场你和上帝进行博弈的游戏吗?
“自然”是研究单人博弈的重要假定。比如一个农夫种庄稼也是同自然进行博弈的
一个过程。自然的策略可以是:天旱、多雨、风调雨顺。农夫对应的策略分别是:
防旱、防涝、放心地休息。当然,自然究竟采用哪种策略并不确定,于是农夫只有
根据经验判断(或根据气象预报)来确定自己的行动。如果估计今年的旱情教重,
就可早做防旱准备;如果估计水情严重,就早做防涝准备;如果估计是风调雨顺,
农夫就可以悠闲地东转转西走走了。又比如,农夫该在土地上种小麦还是水稻?也
是一个同自然进行博弈的游戏。自然可以选择小麦买高价还是水稻卖高价,农夫则
根据对自然的可能行动的猜测来确定自己的行动。与一般的博弈不同的是,不管“
自然”采取何种策略,也不管你采取何种策略,“自然”的支付(或得益)都是为
0的。
生活中更多的游戏不是单人博弈,而是双人或多人的博弈。比如:商场谈判、政治
斗争、夫妻吵架、恋爱结婚……都是这类博弈。
再给大家介绍一个有趣的博弈例子。它出自张维迎教授的《博弈论与信息经济学》
,讲的是猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控
制饲料供应的按钮。按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个
单位的成本。若大猪先到,大猪吃到9个单位,小猪吃到一个单位;若同时到,大
猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃六个单位,小猪吃4个单位。
各种情况组合扣除成本后的支付矩阵可如下表示(没格第一个数字是大猪的得益,
第二个数字是小猪的得益):
小猪
按 等待
大猪 按 5,1 4,4
等待 9,-1 0,0
在这个例子中,我们可以发现,大猪选择按,小猪最好选择等待,大猪选择不按,
小猪还是最好选择等待。即不管大猪选择按还是不按,小猪的最佳策略都是等待。
也就是说,无论如何,小猪都只会选择等待。这样的情况下,大猪最好选择是按,
因为不按的话都饿肚子,按的话还可以有4个单位的收益。所以纳什均衡是(大猪
按,小猪等待)。
这个例子是一个多劳不多得的例子。现实中这种情况是很普遍的,一些努力工作的
人和不工作的人得到与付出并不相称。改革也有类似的情况,在改革过程中利益的
转移必定使一部分人先富一部分人生活水平没得到改善,前一部分人更有改革的积
极性。也就是说,改革往往由“大猪”推动,“大猪”越多,改革速度越快。这个
例子也可以反映斯密的“看不见手”教条,本来大猪是追求自身的利益,结果给小
猪也带来了利益。它也解释了“搭便车”行为,例子中的小猪是一个典型的“搭便
车”者,因为它坐享大猪的成果。在这里我们可以联系一下第二章提到的科斯定理
,如果我们严格界定产权,是可以改变这种状况的。比如,以法律的形式规定,大
猪按出的饲料归大猪支配,小猪按出的饲料归小猪支配,那么大猪小猪都存在去按
的动力和积极性。相反,产权不清晰,比如吃大锅饭的情况下,结果是不劳有获、
劳而少获,有点类似一幅漫画——卖力的驴子挨鞭子(一只驴子拉着一辆车,车上
是一个农夫和另外几头驴子,农夫的鞭子落在拉车的驴子身上催它快跑;这只驴子
并没有错,它遭罪只因为它比别的驴子强壮)。于是人们工作的积极性没有了。我
想,这也是为什么我国改革开放不久,就提出了废除“大锅饭”,砸碎“三铁”(
铁饭碗、铁交椅、铁工资)的原因所在了。
在智猪博弈中,无论大猪采取何种行动,小猪都是采取等待。我们把小猪的“等待
”称为“占优战略”(有点“以不变应万变”的意思)。生活中这样的博弈也不少
。比如,某一天你觉得应该是你太太的生日,但又不能肯定:如果是太太的生日的
话,①你可以送一束花,太太会特别高兴,你的效用增加5个单位,②你不送花,
但太太会埋怨你忘了她的生日,你的效用降低2个单位;如果不是太太的生日的话
,①你可以送太太一束花,太太感到意外的惊喜,你的效用增加3个单位,②你不
送花,结果生活同往常一样,可视为你的效用增加0单位。在这个博弈里,我们看
到,“自然”可以有两种策略:确定今天是太太的生日或确定今天不是太太的生日
,但不论“自然”采取何种策略,你的最好行动都是买花。买花是你的占优战略。
博弈距阵如下(自然的得益皆为0):
自然
是太太的生日 不是太太的生日
你 买花 5,0 3,0
不买花 -2,0 0,0
夫妻吵架也是一场博弈。夫妻双方都有两种策略,强硬或软弱(或称鹰派和鸽派)
。博弈的可能结果有四种组合:夫强硬妻强硬、夫强硬妻软弱、夫软弱妻强硬、夫
软弱妻软弱。至于哪一种是纳什均衡,必须列出其支付矩阵才可以确定。支付矩阵
不一定非要用量化确定的数字表示,也可以用支付函数表示。经济学家们常用支付
函数进行讨论。根据生活的实际观察,夫软弱妻软弱是婚姻最稳定的一种,因为互
相都不愿让对方受到伤害或感到难过,常常情愿自己让步。动物学的研究有相同的
结论,性格温顺的雄鸟和雌鸟更能和睦相处,寿命也更长。夫强硬妻强硬是婚姻最
不稳定的一种,大多数结局是负气离婚。夫强硬妻软弱和妻强硬夫软弱是最常见的
一种,许多夫妻吵架都是这样,最后终归是一方让步,不是丈夫撤退到院子里点根
烟,就是妻子避让到卧室里嚎啕大哭。
犯罪和防止犯罪是罪犯和警察之间进行博弈的一场游戏。警察可以加强巡逻,或者
休息。犯罪者可以采取作案、不作案两种策略。如果罪犯知道警察休息,他的最佳
选择就是作案;如果警察加强巡逻,他最好还是不作案。对于警察,如果他知道犯
罪者想作案,他的最佳选择是加强巡逻,如果犯罪者采取不作案,自己最好去休息
。当然,犯罪者和警察都不可能完全知晓对方将采取的行动,因此他们都将估计对
方采取某种行动的概率,从而决定自己要采取的行动。结果是,他们将以一定的概
率随机地采取行动,这叫“混合策略”。
我们可以简单地分析一下混合策略(对数字不感兴趣的读者可以不看下面一段)。
下面是犯罪者与警察的支付矩阵(假定犯罪者在警察休息时一定作案成功,在警察
巡逻时作案一定会被抓住):
犯罪者
不作案 作案
警察 巡逻 0,0 2,-2
休息 2,0 -1,1
这个矩阵的数字含义可以表示,警察巡逻,犯罪者不作案,双方都没有收益也没有
损失;警察巡逻,犯罪者作案,警察因抓到罪犯受到表彰,得到效用2单位,罪犯
被判刑丧失效用2单位;警察休息,犯罪者不作案,警察休息的很愉快得到效用2单
位,犯罪者没有收益也没有损失;警察休息,犯罪者作案,警察因失职被处分而丧
失效用1单位,罪犯犯罪成功获得效用1单位。这个博弈是没有纳什均衡的。
但是,如果警察知道犯罪者以p的概率选择作案(不作案概率就为1-p),他该怎样采
取自己的行动?对警察而言,巡逻的预期效用为0×(1-p)+2p=2p,休息的预期效
用为2×(1-p)-1×p=2-3p。显然,当2p>2-3p即p>0.4的时候,警察最好选择巡逻
;反之2p<2-3p即p<0.4的时候,警察宁愿选择休息。假设警察应以q的概率巡逻(休
息的概率就为1-q),那么犯罪者最好的行动是什么?他作案的预期效用是-2×
q+1×(1-q)=1-3q,不作案的预期效用为0×q+0×(1-q)=0。显然,当1-3q>0即
q<0.33时,他的理性选择是作案,反之不作案。在这个博弈中,警察以0.33的概率
巡逻0.67的概率休息,犯罪者以0.4 的概率作案0.6的概率不作案构成一个混合纳
什均衡。
上述混合纳什均衡可以这样理解,如果警察以高于0.33的概率巡逻,犯罪者最好是
躲避起来。犯罪者一旦躲避,警察就没有收获,于是降低巡逻的概率,于是犯罪者
重新活跃,于是警察又提高巡逻概率……从一个长期来看,两者的均衡将维持在警
察以0.33的概率巡逻犯罪者以0.4的概率作案上面。现实中,我们看到,当严打的
时候(警察出击的概率较高),犯罪分子便收敛一阵(降低作案概率);严打的时
期一过,犯罪分子又开始兴风作浪,在不能容忍罪犯过分猖狂的时候,警界不得不
再次开始严打。
在上述例子中,可能大家觉得警察和犯罪者都根据一定概率采取自己的行动不太好
理解,那么可以尝试这样理解他们:作案的犯罪者越多,那么出动的警察将会越多
,作案的犯罪者越少,出动的警察将越少;反过来,出动的警察越多,作案的犯罪
者就越少,出动的警察越少,作案的犯罪者就越多。极端地假设一个例子(它有助
于我们的理解),警局有100名警察,犯罪集团有100名犯罪者,那么上例博弈中,
警察以0.33的概率巡逻而犯罪者以0.4 的概率作案这一纳什均衡可以理解为:在巡
逻的警察少于33人时,犯罪集团最好派40名以上的犯罪者作案;在巡逻警察多于
33人时,犯罪集团最好派40名以下的犯罪者作案;反过来,犯罪集团派40名以下犯
罪者作案,警局最优选择出动33名以下的警察;犯罪集团派40名以上犯罪者作案,
警局最优选择出动33名以上的警察。当然,如果犯罪集团倾巢出动,那么警察的选
择也是全部出动,但警察一旦全部出动,犯罪者最好选择全部不作案,犯罪者一旦
选择全部不作案,警察最好全部选择休息……最后长期的均衡状态是,警局派33名
警察巡逻,犯罪集团派40个人作案。这可以解释现实中,为什么警界总安排有巡逻
力量,而犯罪者也总保持一定的作案数量。
你面临的具体生活事件又何尝不是一场博弈呢?我曾经在一次讲课中给某毕业班的
学生提到了博弈论的观点(就是运筹学里面非常简单的零和博弈那种)。下课后,
就有一名学生向我“求教”对付“赵老师”的办法。赵是分管毕业分配的教师。这
名学生可真有灵性,他已经把博弈论运用到他和决定他前途的赵老师之间了。当时
的情况是,赵希望该同学及早和用人单位签约(因为赵希望早一点把所有同学分配
出去以完成任务),而该同学希望等更好的单位。当然,这个博弈中局中人的收益
函数我们不能确切地知道,因此它是一个不完全信息的非合作博弈(但不可是零和
博弈),博弈的结果也许还和双方的讨价还价能力有关。我当时给这学生的建议是
:你要尽可能了解赵的“信息”(即赵的各种真实想法);你要向赵传递强硬的信
息(态度坚决);你要准备充分理由,增强讨价还价能力。
不但生活中许多事情可以看作是一场博弈,整个人生也是一场博弈。这个博弈中的
“局中人”一个是你自己,另一个叫做“命运”。你和命运之间在展开一场以一生
时间为限的游戏。谁输谁赢,取决于你的策略和行动。贝多芬说“我要扼住命运的
咽喉”,他成功了。人生是一场游戏——在这个游戏中,你以一生作注,和命运进
行着一场豪赌,要么赢得痛快淋漓,要么输得一败涂地。世事纷纭如棋局,你在红
尘中的每一步,都象落下一枚棋子,一招失误,并不意味着满盘结束,只要没有和
盘,就不能认输。可惜的是,不少的人,甘听命运摆布。可是也有一些人,奋起与
世事抗争。我比较欣赏持那种态度的人:世事我曾抗争,得失不必在我。
我觉得,不论最后的结果如何,人都应该争取。很多时候我们也需要一种胆识,敢
于面对命运的胆识。我们有理由相信,自己会成为游戏的胜利者。该赌一把的时候
,不要犹豫,坐失良机。有句歌词兼流行广告说的好:该出手时就出手。只不过,
在你所有的人生的博弈中,你必须重视“策略”。
--
我一直想要,和你一起,走上那条美丽的山路. .oooO Oooo.
有柔风,有白云,有你在我身旁,倾听我幸福和快乐的心. ( ) ( )
我的要求其实很微小, \ ( ) /
只要有过,那样的一日, \_) (_/
只要有过,那样的一次.
※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: sunny.hit.edu.cn]
--
※ 转载:.哈工大紫丁香 bbs.hit.edu.cn.[FROM: 172.16.2.212]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:3.429毫秒