日报标题:被对方看穿了,这棋还怎么下
来看一下题目:
对弈一般理解为围棋、象棋等策略类游戏,假设 B 是先手。
假设 A 的超能力可以不限时间、不限距离的读取对方的思想,A、B 智商都足够高,会做出对自己最有利的方案。
接下来分析一下题干:
讨论的博弈是棋类游戏,棋类游戏的特点是:完全信息,对称信息,序贯博弈。
关于棋类游戏中的信息对称的定义问题,参见:『博弈』是信息不对称造成的吗,如果信息完全对称,还会产生博弈吗?
完全信息,所有的棋子都摆在棋盘上,只要你足够聪明,所有的变化你理应都能想到。
对称信息,上述信息双方都能看见,以往信息(以往的行棋)双方都能看见。
序贯博弈,博弈是顺序进行的。
我们再来看超能力,超能力是读心。
对于博弈而言,读心能起到什么作用呢?
读心改变的事信息的获取,A 比 B 掌握了更多的信息,这体现在两个方面:
其一,如果 A 和 B 获取的信息不同,那么 A 能知道 B 获取的信息,而 B 不能知道 A 获取的信息;
其二,如果 A 和 B 本来同时进行决策,则 A 能在决策之前获知 B 的决策。
但是,在棋类游戏中,我们会发现,读心并没有什么用。
其一,棋类游戏是完全信息、对称信息博弈,A 和 B 获取的信息是一样的。
其二,棋类游戏是序贯博弈,在决策之前 A 本来就知道了 B 的决策。
实际上,如果 A、B 智商都充分高,根据策梅罗定理,这个游戏只会有三种结果:
1. 先手必胜,B 走一步,A 认输;
2. 后手必胜,B 直接认输;
3. 必和,B 直接提出和棋,A 接受。
我们会发现,这一结论并不随 A 是否知道 B 要走哪一步而改变,因为 A 和 B 都知道最佳策略是什么,A 不会通过读心获得更多信息。
读者应该已经开始骂娘了,你这不扯蛋吗,如果 A、B 智商都高到这个地步,那棋类游戏早就被人类放弃了,接下来大概就要“去轮盘赌上恢复一下碎裂的三观”了(语出《大空头》中的 Mark Baum)。
所以,我们不能假定 A 和 B 的智商有那么高,那么我们改变一下这个假定:A 和 B 智商水平相同,怎么样?
首先,棋类游戏是序贯游戏不会变,所以读心术的第二种作用一定是被废了。
然后看第一种作用,什么叫“智商水平相同”?
如果说“智商水平相同”意味着“根据棋盘获得的信息相同”,那么 A 不能通过读心获得更多的信息,所以结果不变:该怎么下还是怎么下。
如果说“智商水平相同”意味着“在单位时间内能够分析棋盘获得的信息相同”,这时候读心才能起作用:因为你能够获得对方思考棋盘所获得的信息,你就能在这个基础上获得更多的信息。
如果说“智商水平相同”意味着“能够同时进行处理的信息量相同”,这时候读心可能会起反效果:因为你获得的信息是对方的两倍,你不一定运转的过来。
注意,这里面的差别在于,第一种还是信息对称的,后两种是信息不对称的。
不过,以普通人进行的对弈的水平,个人认为第二种情况比较普遍,那么 A 一定是占优势的,B 能做的最佳应对就是,尽量不要下那些依靠对方失误而成功的棋。
那么,读心术在什么时候用最好呢?
回顾一下,读心术的作用:
其一,如果 A 和 B 获取的信息不同,那么 A 能知道 B 获取的信息,而 B 不能知道 A 获取的信息;
(利用信息的不对称)
其二,如果 A 和 B 本来同时进行决策,则 A 能在决策之前获知 B 的决策。
(改变决策的实际顺序)
所以,读心术发挥作用(注意,不一定是正面作用)的有两种情况:
如果信息是不对称的,A 能够通过读心获得 B 的信息,而 B 不能获得 A 的信息,此时 A 的信息越多,其决策带来的收益更大。典型例子是牌类游戏(暗牌)或者军棋,若 A 能获知 B 的手牌,足够聪明的 A 能够利用这一信息,获胜概率更高。
注:我本来想举一个反例说明,信息越多可能收益越低;然而我刚才努力搜索了一下,如果信息是不对称的但博弈是序贯的,并没有找到反例(即 A 信息更多反而更糟),也就是说信息不对称造成的“信息越多收益越低”基本上都来自于同时伴随的从同时博弈到序贯博弈造成的先手优势。当博弈本身是序贯时,读心术利用信息不对称都是有益的。
如果本来是同时决策,那么读心术的结果是将博弈变成 B 先进行决策,A 后进行决策。此时就要讨论原博弈是否存在先手优势或后手优势了:
如罚点球,存在后手优势,守门员如果能知道罚点球的球员的决策,那守门员能够以更高的概率扑到球。
如小鸡博弈,存在先手优势,如一方坚持不避让,那么后手方将会选择躲避;再比如 Stackelberg 博弈(Cournot 博弈的序贯 Version),先手方能从中受益。
不过,还存在一种可能,但这里的关键不在于“读心术发挥作用”,而在于,A 拥有读心术这个事实本身改变了博弈结构。比如说,如果 A 不会读心术,可能下围棋的时候持白有贴目 7.5 目,在 A 会读心术的情况下,尽管根据我们刚才的分析,A 未必能从读心术中获利,但是很有可能对方或者裁判认为 A 能获利,因此判定 A 持白不贴目。此时,博弈的结构发生了改变(最后的支付发生了变化),A 可能因此收益更低。
这就引出了 B 的另一种可能的做法,要求获得补偿以保证游戏的公平性。