日报标题:「我们这是经济系,同学你搞一堆物理公式做什么?」
我先讲一下我的糗事。我在读的上财经济学院有个规矩,博士三年级时要做个中期宣讲,类似于其他学校的开题报告吧。中期宣讲没有通过的要罚钱。正当我为此事焦头烂额之际,我院一个做运筹学的老师知道了我本科是学物理的,就找我做量子博弈。这简直就是一根救命稻草。我看了一个月,大致知道是怎么回事了,就去讲了。结果台下的老师都一头雾水,不断提问。最麻烦的是,一个做重复博弈的老师质疑这东西的经济学意义。他说我们不是工学院,是经济学院,经济学用博弈论是要解释现象的,不是说随便在博弈论里加什么东西都是经济学,随便加东西我任何结论都能推出来……不过还好我最后似乎通过了,没有罚钱。
好了,言归正传。从上面可以看出,要我说量子博弈有什么意义,我真答不上来,但是讲一下量子博弈是什么东西,我还是没问题的。
量子博弈就是要把经典博弈量子化,就是用量子力学的方法来描述博弈。这东西当然也不是凭空来的,我感觉应该是从量子信息来的,通讯可以看做是一种博弈。量子博弈也已经不是纯理论的设想,而是可以在量子计算机上实现的。但是如果你要问日常生活中有没有量子博弈或者怎么在日常生活中实现量子博弈,我真不知道。
之所以要对量子博弈做专门研究,是因为量子博弈往往会产生和经典博弈不一样的结果。原因有两条:
- 量子博弈的策略空间更大,经典博弈的策略空间只是一个子集。
- 量子博弈中状态可以纠缠。
下面会通过两个例子分别说明这两点。
Meyer(1999)是量子博弈的开山之作。这篇论文讲了这么一个故事。《星际迷航》的 Picard 船长被迫和 Q 玩一个游戏。(我从没看过《星际迷航》,所以不认识这两个人。)盒子里有一个硬币,初始状态是正面朝上,双方都可以把手伸进盒子,选择翻硬币或者不翻硬币。由于盒子是关着的,所以对方到底是翻了还是没翻你看不见。行动顺序是 Q 最先,然后 Picard,然后 Q。最后把盒子打开,如果硬币是正面朝上,Q 赢,否则 Picard 赢。
Picard 船长学过博弈论,知道这是一个二人零和博弈,纳什均衡是双方都采取混合策略,最后双方的取胜概率都是 50%。于是他决定赌一把,结果 Q 赢了。他要求再玩一次,可是,不管玩多少次,他总是输。于是 Picard 船长认为对方作弊了。事实是,Picard 只能用经典的混合策略,而 Q 能用量子策略。
按照狄拉克符号,硬币的状态空间的两个基是 和 ,分别表示正面朝上和反面朝上。行动翻硬币用 表示,不翻硬币用 表示。混合行动 表示以 的概率翻硬币。
在讲 Q 的量子策略之前,先给没有学过量子力学的同学介绍一下量子力学的基本知识。在经典世界里,我们说一个硬币要么正面朝上要么反面朝上,那就是只可能是这两种状态,如上面一段,经典行动也就只能是使硬币在这两个状态之间变化。不存在说使硬币立起来,50% 正面朝上,50% 反面朝上的可能性,但这在量子世界中是可能的。
量子世界中,正面朝上和反面朝上是测量时人们观测到的本征态,在没有测量时,是可以处于叠加态的。在测量时,叠加态坍缩到一个本征态,坍缩到哪个本征态是有概率的。比如,一个叠加态在测量时有 50% 可能测出正面朝上,50% 可能测出反面朝上,另一个叠加态测出正面朝上的可能只有 30%,这就是两个不同的叠加态。量子行动可以使硬币在不同的叠加态中切换,比起经典行动只能在本征态中切换,显然行动空间大了很多。
Q 的量子行动用酉矩阵 表示,其中 和 都是复数,上面加杠表示复共轭。Q 的行动把硬币的状态变为 ,这一状态在测量时,也就是打开盒子时,会有 的概率正面朝上, 的概率反面朝上,所以 。
然后 Picard 采取混合行动,使硬币以 的概率被翻一下,从而变为状态 ,以 的概率保持状态 。注意到,如果 ,就是 50%正面朝上,50%反面朝上,那么翻不翻都是一样的。经典策略没法达到这个效果。
所以,Q 要想以 100%的概率取胜,只要第一次用 ,从而使硬币处于一个对 Picard 的任何行动都保持不变的状态,等 Picard 行动后,再用一次 使硬币回到正面朝上的状态就可以了。
从这个例子可以看出,量子博弈扩展了策略空间,量子策略优于经典策略。不过量子博弈更复杂更有趣的还是纠缠。
Eisert,Wilkens 和 Lewenstein (1999)把量子博弈扩展到了二人非零和博弈。他们用了个囚徒困境的例子。Alice 和 Bob 可以选择合作( )或不合作( )。支付矩阵就不写了。学过博弈论的都知道,帕累托最优是两人都合作,但纳什均衡是两人都不合作。下面把这个博弈量子化。
由前面的例子我们知道,量子博弈有一个初始状态,然后再对初始状态做操作。和前面的例子不同的是,前面的例子中只有一个粒子,就是硬币,但这个例子中有两个粒子,或者说两个人,这两个人的状态就可以彼此纠缠在一起。每个人有两个本征态 或 ,加起来这个系统有四个本征态 , , , 。假设初始状态是 。
接下来大招来了!
我们给这个系统加上一个酉算子 ,这是一个纠缠算子,作用是使两个人的状态纠缠在一起。
纠缠到底是啥意思呢?比如说一个系统的两个粒子分别处于状态 和 ,要描述整个系统的状态是用张量积 。如果这个系统的状态是张量 ,而 不能分解成张量积,我们就说这两个粒子纠缠在了一起。我查到一个定义是这么说的:“如果一个复合物理系统的某个状态的密度矩阵不能表示成各个子系统的密度矩阵的张量积的线性和形式,则称这个复合系统处于纠缠态。”定义是这样,到底怎么理解呢?老实说,理解起来相当困难。建议大家去查一些量子力学的科普书。
我们回来,这个系统最后的状态是 。其中 和 分别是 Alice 和 Bob 的策略,都是酉算子,如果合作那就是保持 状态不变的算子,如上个例子中的 ,如果不合作就是把状态变为 的算子,如上个例子中的 。中间那个符号是张量积,
是 的共轭转置。最后测量到四个可能性的概率决定期望支付。
作者指出,当纠缠达到最大时,均衡就是帕累托最优。因为纠缠而得到了和经典情形完全不一样的结果。至于为什么会如此的深入原因,还是请有心深入钻研的同学自己算一下。
后面的研究还有继续扩展到多人博弈、连续策略(用的是古诺竞争的例子)等等的,但终归不离开酉算子策略和纠缠这两点。
总之,这个东西确实比较玄,对于非物理专业的人来说,第一是难懂,第二是不知道有什么用。我也是一样,不过在这里写的大概都是对的。感谢大家能坚持读到最后!
参考文献
Eisert, Wilkens and Lewenstein (1999): "Quantum Games and Quantum Strategies," Physical Review Letters.
Meyer (1999): "Quantum Strategies," Physical Review Letters.