日报标题:「随大流」买买买选选选,有时候还挺明智的
之前曾经考虑过随大流中的理性与非理性这个问题,所以去找文献看,一开始用 Herd Effect(羊群效应)搜索,结果找不到什么文献(主要集中在金融领域,有好几篇讨论基金经理的羊群效应),心说这不可能啊,找教授问,教授也不清楚这个领域,后来有一天上维基偶然发现,原来还有一个词叫 Bandwagon Effect(花车效应)也是指这种行为,再用这个关键词找,又发现一个新的词叫 Information Cascade(好像翻译叫“信息阶流”),才算是解决了问题……(实际上,这种现象也可以叫 Conformity,社会学中好像用这个词比较多)
啊扯远了,回到随大流的问题上。在 1992 年,关于 Herd Behaviour 或者说 Information Cascade,先后发了两篇顶刊论文,一篇是发表在 QJE 上的 Banerjee(1992). "A Simple Model of Herd Behavior",另一篇是发表在 JPE 上的 Bikhchandani, Hirshleifer & Welch(1992). "A Theory of Fads, Fashion, Custom, and Cultural Change as Informational Cascades",这两篇文章所使用的模型有着些许不同,但是其核心思想都是一致的:在多个可能性中,有一个是正确结果,但是我们现在不知道哪个是对的,这时候,一群人排好队去做选择,他们的目标就是尽可能选中那个正确结果;在每个人轮到要做选择的时候,首先他可以观察到前面所有人已经做出的选择,其次他会获得一个 Private Information,这个 PI 和正确结果是 Correlated 的,但是并不保证相同,他就要根据前人的选择和自己的 PI 来做出自己的选择。然而,当充分多的人做出选择之后,后面的人将不再需要知道自己的 PI 是什么,而是完全根据前人的选择做选择,这时他们的 Private Information 就 Cascade 了。
举个最典型的用来说明这一问题的例子:现在有一个口袋装着三只球,可能是两红一篮,也可能是两蓝一红,现在有一排人来做实验,猜测口袋里到底是哪种情况,在猜之前,他们允许从口袋里摸出一只球自己偷偷地看一下颜色,后面的人不知道前面的人看到的球是什么颜色,但是他们能够知道前面的人猜的结果。现在加入第一个人抽出来红色,他一定会猜两红一蓝(简单的条件概率),如果第二个人抽出来还是红色,那他仍然猜两红一蓝;第三个人如果这时候抽出蓝色,简单的推理可知,前面两个人一定都抽出了红色,这时候尽管他抽出来的是蓝色,但是根据已有信息,两红一蓝的可能性更高,所以他仍然会猜测是两红一蓝。然而,如果真实情况确实是两蓝一红,那就意味着有 1/9 的概率发生前两个人都抽出红色的情况,而这时所有人都会选择猜两红一蓝这一错误选项。当然,真实情况也有可能确实就是两红一蓝,只不过这说明了确实有可能猜错就是了。
上面这个例子更接近于 BHW(1992) 的模型,而 Banerjee(1992) 的模型更为复杂一些,基本流程如第二段所述,唯一需要具体说明的就是 Private Information,作者假定每个人以 α 的概率获得一个私人信息(1-α 的概率不获得),获得的信息中以 β 的概率是正确的(1-β 的概率得到一个随机数)。这时候,Information Cascade 还是会触发的,但是如果我们把 α 提高到 1,我们可以预见到,在长期中正确结果是一定可以达到的,因为对于两个不同的人,以 1-β 概率得到的那个随机数,其相同的概率是 0(连续型分布的情况),所以如果有人在后面做选择时发现自己的信号和前面某人的选择相同,那么他一定是获得了正确信号。
(不过 BHW 的想法更加深刻一点,实际上他们还研究了为什么潮流会改变而不是一旦有人选了两红一篮就永远纠正不回来了)
所以简单的总结一下,一般来说,即使随大流中每个人自己做出决策时是理性的(考虑了可能性最大的情况),加总起来整个人群的决定(或者说潮流)却未必是“明智”的。
长话短说,我认为这是 bias variance tradeoff 的一种体现。假如你信息量低,就该随大流。假如你的需求和别人 * 非常 * 不同,才有必要自己去得到更多信息。
“刻意随大流”是我人生哲学的重要部分,所以我觉得我可以写写我为什么特别喜欢随大流。
我曾经在申请大学时面临哈佛和普林斯顿二选一的选择。我个人更喜欢普林斯顿那种田园式的校园和更适合本科生的数学教育,但哈佛是更“随大流”的选择,因为同时被两个学校录取的人有 70% 去了哈佛。
我在考虑一番后,决定选择哈佛。这是因为“校园环境”和“数学系课程设置”只是大学生活的很小一部分。我当时还没上过大学,根本不了解最重要的选择因素是什么。但是,每年有几百个很聪明的人都面临这个选择。作为一个整体,他们肯定考虑到了比我多得多的因素。假如他们大多数做一个选择的话,说明对大学生活重要的因素中,哈佛占优的可能性更大。
从高层面来说,随大流还是不随大流这个问题,是统计学里 bias-variance trade-off 的一个子问题。随大流的基本假设是我自己在做一个选择时,要考虑的因素和社会上大部分人一样。这个假设很可能是错的,导致我的决定拟合不足,我忽视了对自己重要的因素。但是,假如我过分重视对自己重要的因素,就很可能遗漏一些我还不知道的因素。由于社会上所有人都做了类似的决定,他们总体考虑的因素肯定比我齐全。“随大流”则更不容易过拟。
这是考虑应不应该随大流这个问题的基本框架。在这个框架下,随大流更适合大部分人需要做的大部分的选择。
首先,大部分人在面临大部分选择时,拥有的信息量非常低。以买车为例,就算最懂车的人,也很难了解两辆车的自动刹车系统实现细节有什么区别,甚至不知道自动刹车系统的区别是汽车安全的重要部分。在信息量低时,过分强调已知的信息就会造成巨大的过拟。假如我恰好知道了几个品牌自动刹车系统的区别,就以这个为标准来选择车的话,很难选到真正最适合我驾驶需求的车。适当的随大流可以减少这种过拟。
其次,大部分人面临选择时,可以花时间提高信息量,但这个过程非常耗时间。以买衣服为例。假如我每天花一小时研究男装,我必然能选出更适合我的穿衣风格。但这花费我太多精力了。我宁愿选择更差的爆款。
最后,人都会不自主地过度强调自己的独特性,对“量身定制”的效应有不切实际的期望。在知乎上,我见过问主千字长文描述自己的收入身高年龄星座婚恋情况,然后求问哪款手提电脑 / 钢笔 / 枕头 / 牙签最适合自己。这些信息对选择影响非常小。最“随大流”的枕头几乎肯定是最适合你的枕头,无论你是个 20 岁的大学生还是 50 岁的中年妇女。
当然,这不是我们的错。在晚期资本主义社会里,只有过度细分市场,才能让那为新三板董事长量身定做的高端手机和为他在徐家汇上班的小三量身定做的轿车有生存空间。
虽然这个经验只针对消费商品,但“做适合自己的选择”这个观点已深入人心。这本身没错,但经验表明,以”做适合自己的选择”为标准做出的选择也许并不是最适合自己的选择。适当的随大流能改善选择的质量。