日报标题:谁说我们单身是因为不好看的?明明是因为美得太出众
追女生的人有几个是可以用公式估算出来的:0.4m1 - 0.5m2 - 0.1m4 + 0.9m5 + k( k 为常数)。这几个 m 变量什么意思请往下看:
美国交友网站 OKCupid 对 64,000 名女性用户的数据进行了分析(网站创始人毕业于哈佛数学系),他们发现如果男生们对某个女生长相的态度分歧越大,那这个女生就会有更多人追。换句话说,100 个男生中有 100 个都认为你“长得挺漂亮”,倒不如 100 个男生中有 60 个认为你“美若天仙”,剩下 40 认为你“奇丑无比”。
举个例子,男性对下图中两人的评价分布应该是左边比较集中(“挺好看”),右边比较分散(一部分人认为“美极了”,一部分人认为“很丑”)。(只是举个例子,大家明白意思就好,不必纠结两人究竟谁更美。)
(左图 Cynthia Nixon,右图 Sarah Jessica Parker。图片来自维基百科。)
根据 OKCupid 交友网站得出的结论,虽然平均来看可能左图中人更美,右图类型的女生反而追的人更多。
交友网站对他们用户的分析过程如下:
网站有一个让男生给女生各类指标评分的功能。“长相”是打分项之一( 1-5 分,5 为最美)。下图横轴为“长相得分”。纵轴是女生在一个月内收到的私信数量,做为量化“有多少人追”的指标。
每个点代表一个女性用户。该图已经控制过年龄、种族、个人资料完整度、用户活跃度等变量,所以图上标记的每个人只有长相区别。
如图所示,长相和收到的私信数量呈正相关,一个“漂亮”的人收到的私信数量是一个“长相普通”人的 4 倍,是一个“长得丑”的人的 25 倍。
但值得注意的是,横轴越往右,点的纵轴值分布就越分散。(如上图红圈所示)
为什么长相平均分相同的两个人,下图左这位收到的私信数量是下面右这位的三倍?
网站查阅了两个女生的详细数据,发现了一个很有意思的现象。
- 右图女生平均得分比左图高(3.4 分 > 3.3 分),即总体来说右比左“好看”
- 左图女生得到的 1 分评价(即“丑”)比右图多 142%
- 但是左图女生收到的私信数量是右图女生的 3 倍
分析了几个 5,000 人的样本以后,网站发现,男生对女生长相的意见分歧越大,女生收到的私信越多。下图中,蓝线上的方框都代表女性用户,她们的“长相”得分均排在网站第 80 百分位。但是越往右(即男生的分歧越大),女生收到的私信就越多。
黄色箭头指的两张图片“长相”得分均值相同,但右边(男生分歧大)的那位收到的私信比左边(男生意见统一)的那位要多不少。
回到答案最前面提到的公式:
你收到私信的数量 = 0.4 一分个数 - 0.5 两分个数 - 0.1 四分个数 + 0.9 五分个数 + k
( m1, m2, m4, m5 为你收到相应分数的数量,5 是最高分)
上面这个公式里,m1 和 m5 的系数为正,m2 和 m4 为负。于是得出:
“长相”悖论:从统计角度来说,如果一个人不认为你“美若天仙”(给你 5 分),那对你来说下一个最好的情况是他认为你“奇丑无比”(给你 1 分)。
OKCupid 认为这个悖论可以用简单博弈论来解释:
用大白话来说很简单,那些我们以为有很多人追的女生,所有男生都认为追她们的竞争会很激烈,所以放弃。反而那些引起男生巨大意见分歧的女生有最多人追,因为认为那些女生“美若天仙”的人知道自己的审美很特别,更有可能成功。(注:这个简单博弈论解释只是我们目前认为最有可能的理论,并不一定正确。)
最后,网站对所有正在寻找男友的女生有这样的建议:
突出一部分男生不喜欢你的那些特点吧。
如果你有纹身,长得有点胖,鼻子太大 / 太小 / 太高 / 太塌,不用隐藏它们。从统计角度来说,那些觉得你丑的人反而在帮你(m1 的系数是正的),而那些看到你的“缺陷”但仍然喜欢你的人反而会因为觉得其他人不太会追你而对你更积极。
这个答案可能只是通过真实数据证实了大家的很多直觉,不过我觉得还是很有价值的。当然了,交友网站不能完美反应线下男女的互动,“追求”也不等同于一次主动的私信,所以对这组数据的分析还是有其局限性的。
网站也分析过很多男性的数据,研究过种族、性取向等敏感的问题,所以大家不用担心这篇文章是在“物化、轻视女性”。关于网站搜集用户信息甚至有时在用户身上做实验的问题,并不在此答案讨论范畴。
其他数据话题下的回答:
如果「男女同工不同酬」是事实,为什么公司不全部招聘女性,以获得同等的生产力并节约成本?
回应大家的部分评论
• 问:均分同样的两人,肯定是得分分散的那个得到的 5 分多,那她收到的私信多也可以理解成“得到的 5 分越多,收到的私信越多”,和分数分布无关。而且这个“5 分个数”理论直觉上也说得通,即只有那些认为你美若天仙的人才会来追你。认为你美若天仙的人越多,追你的人越多。( @Molly 羊、 @长弓戊、 @陈逸伦、 @yingqizhang、 @法老、 @di liang、 @希格斯玻色妹汁、@BillWoo )
答:是的,OkCupid 网站的原文下面也有很多人提出这样的质疑。
原作者给的例子非常不好,那个收到私信多的、头上戴花的女生分数更分散,但收到的 5 分数量也比右边那位多。所以两种理论好像都解释的通。
可是,原文提供的那个公式意味着假如有两个女生 A 和 B,A 有 5 个 5 分,5 个 4 分,B 有 5 个 5 分,5 个 1 分,A 和 B 的 5 分数量相同,但 B 收到的私信(按照那个公式推算)比 A 多。原文作者应该是想用这个例子说明他的“分数分布”理论才是对私信数量的解释,而非“5 分个数”理论。最后给的那张“她美若天仙” + “她奇丑无比” > “她美若天仙”“她挺漂亮”也是想说这个道理。
当然了,原作者因为面向大众写的这篇文章,所以并没有提供任何 p 值或者任何原始数据,语言也不准确严谨。我们只能期待他以后会出一个“专业版”或“学术版”,否则他的理论现在看来确实有很多问题。
• 问:有可能是有第三个因素( Z )同时影响长相打分的分布( X )和收到私信的数量( Y )吧。比如眼神有性暗示、化浓妆等等。( @黄麟 、 @mover、 @XiangyuGuo、 @腰果呀)
答:如 @Xiangyu Guo 所说,相关不一定意味着因果。两人之间的互相吸引有很多因素无法量化,因而无法控制,所以我们不能肯定地说是男生对女生长相的意见分歧导致了女生收到的私信多
• 问:博弈论这个解释一定正确吗?
答:这个简单博弈论解释也只是目前看来最有可能的理论,并不一定正确。
• 问:请问原始数据在哪里,p 值是什么,r^2 值多少?( @afraidfuture、 @土豆很生气 )
答:很遗憾,原作者的文章面向大众,因此没有提供任何详细数据。加上他举的例子不好,整体来说他的“分数分布”理论看起来不那么有说服力。我们只能期待他以后出一个“学术版”。
• 问:这是 TED 演讲里提到的内容吧?( @Mox Wang、 @Carina )
答:这个 2014 年的 TED 演讲(Hannah Fry: The mathematics of love)只是引用了交友网站 OkCupid 2011 年在自己博客上发布的一篇文章。我在这里直接引用了原始文章。如果对更多“恋爱中的数学”有兴趣的话,可以去看这个 TED 演讲。