精华区文章阅读

发信人: zjliu (秋天的萝卜), 信区: Physics
标题: (zz)LHuy论Quantum Game(4)
发信站: 哈工大紫丁香 (Thu Mar 11 13:36:16 2004), 站内信件

发信站: 瀚海星云 (2004年03月04日18:29:04 星期四), 站内信件

（四）量子博弈论——“囚徒困境”

“囚徒困境”是经典博弈论中的一个极富代表性的一个著名例子。这个例子的创造
本身就奠定了非合作博弈论的理论基础，并且它可以作为实际生活中许多现象的一
个抽象概括。
囚徒困境讲的是两个嫌疑犯（Alice和Bob）作案后被警察抓住，被分别关在不同的
屋子里审讯。他们每个人都有两种选择（策略）：坦白（Defect，策略D）和抵赖
（Cooperate，策略C）。警察告诉他们：如果两人都坦白，各判刑4年（收益均为
）；如果两个都抵赖，因证据不足，各判刑2年（收益均为）。如果其中一人坦
白，另一人抵赖，坦白地放出去（收益为），抵赖的判刑5年（收益为）。

两个人的目的都是尽可能的是自己的收益最大化。在这个博弈中，坦白（D）是占
优策略（dominant strategy），也就是说，不论对方的选择是什么，个人的最优
选择是坦白。比如说，如果Bob抵赖，Alice坦白的话被放出来，抵赖的话被判2年
；如果Bob坦白，Alice坦白的话被判4年，抵赖的话被判5年。所以，Alice的占优
策略是坦白，Bob的占优策略也是坦白。结果，理性的推理将迫使每个人选择坦白
，而显然此时两人的收益要比他们都选择抵赖时差。用博弈论的术语讲，策略组合
（坦白，坦白）是一个Nash均衡：任何单方面的偏离该策略组合都不能使得偏离者
的收益提高；当一个参与人选择坦白时，另一个参与人只有选择坦白才能使自己的
收益最大化。这也正是囚徒的“困惑”之所在。

在1999年的《Physical Review Letters》里的一篇文章中J. Eisert等人研究了“
囚徒困境”的量子化的模型 [Phys. Rev. Lett. 83, 3077 (1999)]。这个模型由
以下三部分组成：（1）一个两比特产生源，每一个参与人拥有一个比特；（2）参
与人的操作装置，允许参与人操作属于他自己的那一个比特，这些操作实际上就是
参与人的策略；（3）一套测量装置，通过测量两个比特的最终状态已决定每一位
参与人的收益值。每一个参与人都十分清楚这三部分（比特源、每个人的操作装置
、最终的测量装置）。

他们仔细研究了这个量子化的“囚徒困境”，发现如果这个博弈中量子纠缠为零，
那么整个量子博弈将回到经典博弈；而当博弈处于最大纠缠时，出现了一个新的
Nash均衡，在这个均衡下，Alice和Bob的收益都是3，这样一来，在经典博弈中困
扰着博弈者的“困境”便不复存在。此外，如果Bob只采用经典策略而Alice采用量
子策略，则Alice总是能获得比Bob更高的收益。

这个工作以后，量子博弈得到了更加广泛的重视，越来越多的工作涌现出来，并展
现出量子博弈在许多方面的奇特性质。

--
╔═══════════════════╗
║★★★★★友谊第一比赛第二★★★★★║
╚═══════════════════╝

※ 来源:．哈工大紫丁香 bbs.hit.edu.cn [FROM: 202.118.229.162]

Physics 版 (精华区)