Physics 版 (精华区)
发信人: zjliu (秋天的萝卜), 信区: Physics
标 题: (zz)LHuy论Quantum Game(4)
发信站: 哈工大紫丁香 (Thu Mar 11 13:36:16 2004), 站内信件
发信站: 瀚海星云 (2004年03月04日18:29:04 星期四), 站内信件
(四)量子博弈论——“囚徒困境”
“囚徒困境”是经典博弈论中的一个极富代表性的一个著名例子。这个例子的创造
本身就奠定了非合作博弈论的理论基础,并且它可以作为实际生活中许多现象的一
个抽象概括。
囚徒困境讲的是两个嫌疑犯(Alice和Bob)作案后被警察抓住,被分别关在不同的
屋子里审讯。他们每个人都有两种选择(策略):坦白(Defect,策略D)和抵赖
(Cooperate,策略C)。警察告诉他们:如果两人都坦白,各判刑4年(收益均为
);如果两个都抵赖,因证据不足,各判刑2年(收益均为 )。如果其中一人坦
白,另一人抵赖,坦白地放出去(收益为 ),抵赖的判刑5年(收益为 )。
两个人的目的都是尽可能的是自己的收益最大化。在这个博弈中,坦白(D)是占
优策略(dominant strategy),也就是说,不论对方的选择是什么,个人的最优
选择是坦白。比如说,如果Bob抵赖,Alice坦白的话被放出来,抵赖的话被判2年
;如果Bob坦白,Alice坦白的话被判4年,抵赖的话被判5年。所以,Alice的占优
策略是坦白,Bob的占优策略也是坦白。结果,理性的推理将迫使每个人选择坦白
,而显然此时两人的收益要比他们都选择抵赖时差。用博弈论的术语讲,策略组合
(坦白,坦白)是一个Nash均衡:任何单方面的偏离该策略组合都不能使得偏离者
的收益提高;当一个参与人选择坦白时,另一个参与人只有选择坦白才能使自己的
收益最大化。这也正是囚徒的“困惑”之所在。
在1999年的《Physical Review Letters》里的一篇文章中J. Eisert等人研究了“
囚徒困境”的量子化的模型 [Phys. Rev. Lett. 83, 3077 (1999)]。这个模型由
以下三部分组成:(1)一个两比特产生源,每一个参与人拥有一个比特;(2)参
与人的操作装置,允许参与人操作属于他自己的那一个比特,这些操作实际上就是
参与人的策略;(3)一套测量装置,通过测量两个比特的最终状态已决定每一位
参与人的收益值。每一个参与人都十分清楚这三部分(比特源、每个人的操作装置
、最终的测量装置)。
他们仔细研究了这个量子化的“囚徒困境”,发现如果这个博弈中量子纠缠为零,
那么整个量子博弈将回到经典博弈;而当博弈处于最大纠缠时,出现了一个新的
Nash均衡,在这个均衡下,Alice和Bob的收益都是3,这样一来,在经典博弈中困
扰着博弈者的“困境”便不复存在。此外,如果Bob只采用经典策略而Alice采用量
子策略,则Alice总是能获得比Bob更高的收益。
这个工作以后,量子博弈得到了更加广泛的重视,越来越多的工作涌现出来,并展
现出量子博弈在许多方面的奇特性质。
--
╔═══════════════════╗
║★★★★★友谊第一 比赛第二★★★★★║
╚═══════════════════╝
※ 来源:.哈工大紫丁香 bbs.hit.edu.cn [FROM: 202.118.229.162]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:4.821毫秒