日报标题:把三个和尚每次分为两人一组打水,那大家会有水喝吗?
这篇论文来自今年八月份的《美国经济评论》,题目叫做——宽恕和放逐。听这名字就很大气吧^_^
读完之后,这篇文章让我理解了为什么宋朝为什么“不杀士大夫”,为什么会出现“铁打的政事堂,流水的宰相”的情况,乃至于有些人经常两度甚至三度为宰相,而清朝那些“剥去顶戴花翎,永不叙用”的大臣,往往没有过几年就能够被重新启用。是因为宋朝和清朝的皇帝喜欢反悔么?如果皇帝金口玉言都可以随便收回,那么是不是会让大臣有一种肆无忌惮犯法的动机呢?反正只要不触及底线,过几年还是有很大概率起复的嘛!这是皇帝人性的缺陷,还是理性的必然?这篇文章中就有答案。
假设一个小团体有三个人,A,B 和 C。每次随机的抽取任意两个人合作进行生产,只有这两个人能互相观察到对方是不是在合作中偷奸耍滑了。比如说,假如 A 和 B 的合作中,B 偷懒了,那么 A 可以选择把 B 的行为公之于众,那么一个最高权威将“放逐”B,把 B 排除出这个群体之外。
在学习博弈论的时候,我们都知道在无限期重复博弈下,背离惩罚越重,合作程度越高。那么就上面这个简单的设定来说,一个直觉的结论就是,如果实行永久放逐,只要一次偷懒,就真的永不叙用,似乎是最优的选择。事实真的如此么?
我们来仔细分析这个貌似很简单的模型。那么分两种情况:
1. 如果所有的人都很诚实,只要合作伙伴偷懒了,就马上汇报给权威放逐对方,那么这种情况下,对 A 来说,偷懒一次的代价是永久的丢失了在未来和 B 和 C 合作的机会,所以 A 会有很大的激励不去偷懒——换句话说,在这种情况下,因为 A,B 和 C 的互相监视,他们都会相对很努力的工作。我们把这个均衡的努力水平定义为 E1. 均衡水平的定义为,在该努力水平下,偷懒一次所得到的收益(因为之后都为 0 了没有折现)正好等于不偷懒一直合作下去所得到的所有收益的折现,我们把这个收益定义为 R1.
2. 永久放逐了 B 之后,只剩下了 A 和 C,这个时候因为减少了一个人,所以未来合作的选择也少了,偷懒的动机也变大了,我们把只有两个人合作时候的均衡努力水平定义为 E2,而每个人收益的折现定义为 R2.
显然两个均衡的努力水平相比较,E1>E2,也意味着在三人局中偷懒一次获得的收益要大于两人局中一直合作的收益,也就是 R1>R2.
那么有趣的事情来了,当人们不是那么诚实,而是严格的按照自己的利益行事的时候,会发生什么情况呢?
在 A 和 B 的一次合作中,B 偷懒了,A 会怎么想呢?
如果 A 把这件事情公开了,那么 B 会被永久的放逐,那么只剩下 A 和 C,因为 B 永远的消失了,A 和 C 之间合作的均衡会从 E1 跳 E2。这个真的对 A 有利么?
A 这个时候就会心里有小九九了:”不如这样,反正 B 偷懒了这一次,下次他碰到 C 的时候肯定还会偷懒,因为他知道自己迟早要被放逐掉,到时候 C 就会知道 B 不是个好人,所以对我来说,最优的选择是隐瞒 B 和我合作时偷懒的事实,如果 C 不告诉我,我就不告诉 C。这样 C 还会认为我们三个人都在努力的工作,所以 C 会投入 E1 的努力,那么我在和 C 的这一次合作中让 C 当个冤大头,什么都不干攫取一个 R1 的收入,这要比放逐了 B 之后,和 C 一直双人合作能获得的 R2 好多了啊!“
于是 A 隐瞒了自己曾经被 B 耍过一次的事实,把魔爪伸向了懵懵懂懂什么都不知道的 C。
在永久放逐的机制下,B 在和 A 的合作中偷懒,这让 A 私下里知道,B 会很快的被放逐(因为他欺诈了 A,下次碰到 C 保持努力毫无意义,所以也会欺诈 C,等 A 和 C 都知道了 B 的欺诈,不管告不告诉权威,事实上都相当于放逐)再也无法监视 A 了,从而单方面的降低了 A 工作的动机,还给 A 提供了信息优势。而 A 的最优策略,就可以通过隐瞒自己的知道 B 偷懒这一事实,来欺骗 C 继续以一个较高的努力程度来合作,从而让自己得利。
上面这个分析说明,在永久放逐的机制下,高水平的努力程度 E1 是无法维持的,因为人们会策略性的隐瞒同伴对自己的欺诈,以便于自己去欺诈其他人。只有当均衡的努力水平下降到 E2 的时候,也就是无论几个人合作,努力程度都不高于双人合作的努力程度时,人们才没有这一隐瞒的动机,从而再次回归诚实。
这也就是说,如果皇帝的惩罚过重,只要有弹劾,查证实了就判死刑,或者永不叙用,结果就是官僚之间心照不宣,谁都不揭发谁,大家都磨洋工,不干事或者以一个很低的努力水平在干事。最明显的例子就是崇祯天子,殷鉴不远。
所以——在这种情况下,引入策略性的宽容就变的很重要。宽容有两个作用,一方面是不好的,因为惩罚轻了,降低了 E1,仅仅是一段时间不能够和其他人合作了,而不是永久,所以努力水平的上限降低了,但是我们通过上面的分析已经知道无论如何,这个上限不可能是均衡的状态。宽容的另外一个作用,则是实实在在的提高了努力水平的下限。因为当 A 知道迟早 B 还是可以回来和自己一起共事合作的时候,隐瞒 B 偷懒的事实仅仅是推迟了 B 被放逐这件事情的发生——而自己也会偷懒,自己也会被放逐,自己也要等一段时间才能再回来, 这段时间损失的并不仅仅是和 C 合作的收入,并且也无法和回来之后的 B 合作。所以宽容让惩罚的威慑变小的同时,也保持了三个或者更多人相互监视的可能性,不会出现:”我知道你偷懒了,你会被永久放逐,所以我再也不怕你告我的密了“这种情况。在最优的宽容度下,努力的均衡程度为 E3.显然 E1>E3>E2.
不同的是,这次 E3 是真正的能够维持下去的均衡。
雷霆雨露,莫非天恩。帝王用人的心术都可以在现代的文章中得到佐证,不够震撼么?^_^