在几天前的一次演讲中,钟南山院士引用了中国环境保护协会有关统计资料,说 90% 白血病患儿家中曾进行过豪华装修,这引来大家一片惊呼:word 妈,难道我装房子装太豪华我小孩 90% 就要中白血病的枪?
关于这个 90% 的数字真实与否,由于没有参考文献,这里先暂时不讨论。但是,钟院士说 90% 白血病患儿家中都进行过豪华装修,这句话并不能推导出我们所认为的「家里豪华装修的小孩 90% 会患白血病」。而且,单独的这句话本身,甚至不能推导出「豪华装修会提升白血病患病危险」。这是大家在解读这种「病人中某因素的率」时常犯的两类错误,因此值得专门写一篇文章来讨论。
为什么单凭院士的这句话不能说明豪华装修的危害?
用一张图来辅助说明:
这张图里,整个方形代表所有 0-14 岁孩子。蓝色代表未患病,黄色代表患病;浅色代表进行了豪华装修,深色代表未进行豪华装修。
院士的话,就是说「浅黄色面积 / 所有黄色面积 = 90%」。这只规定了两个黄色条里面进行豪华装修和没有进行豪华装修的孩子的比例,也就是深黄和浅黄的比例。而上面两个大方形,也就是那些未患病的孩子们中进行豪华装修和没有进行豪华装修的比例,院士是没有提的。
由于我们其实不知道未患病的孩子们中有多大比例是家里进行了豪华装修的,所以其实浅蓝色占所有蓝色多少比例我们也是不知道的。因此,随着浅蓝色面积从占满蓝色到完全从蓝色中消失,理论上「浅黄色面积 /(浅蓝色面积 + 浅黄色面积)」可以等于(p,100%]这个左开右闭区间之间的任何一个值,p = 家中豪华装修的患病儿童数 / 所有未患病儿童数。
(▲当浅蓝色占满所有蓝色,也即全部未患病孩子家中都豪华装修的时候)
(▲当浅蓝色完全消失,也即全部未患病孩子家中都没有豪华装修的时候)
因此,这仍然允许家里进行了豪华装修和家里没有进行豪华装修的小孩患白血病的可能性相等这种情况的存在。用一张图来表示,就是这样:
由于我们只知道患病儿童暴露在「豪华装修」下的率,所以没得病的小孩子们的家里进行豪华装修的率可以取任意值。那么只要这个值也是 90%,结果就会是无论豪华装修与否,对整群小孩子们这个总体来说,患白血病的预期比例都一样。
因此,在不知道全人群暴露在「豪华装修」下的情况的时候,我们不能单凭患白血病者中暴露在「豪华装修」下的率,就下结论说它是否提高了白血病的发病率。
当然,我们之所以直觉上不认为院士是错的,就是因为我们生活常识认为全人群暴露在「豪华装修」的比例要远低于 90%。这相当于我们给他「脑补」了一个对照组。但是,这句话本身的逻辑缺陷我们不容忽视,因为下次这种类型的论述以介绍其他因素的方式来出现的时候,如果没有自身生活经验可以对照,我们就可能上当受骗。
为什么也不能得出孩子们发病的风险?
让我们再重新读一遍院士的话和我们大众的推论。
「90% 的白血病患儿,家中都进行过豪华装修。」这句话里,被研究的人群总体是「白血病患儿」,而被研究的属性是「是否进行过豪华装修」。也就是说,院士是在一群已经患白血病的患儿中,调查了有多少患儿家中进行过豪华装修,以推测可能导致他们患病的原因。这个 90%的等式,分子是「家中豪华装修的白血病患儿数」,分母是「全体白血病患儿」。
而我们的大众得出的结论,「家中进行过豪华装修,有 90% 可能性患白血病。」这句话,被研究的总体是「家中进行过豪华装修的小孩」(对于这个「小孩」我姑且规定为 0-14 岁吧),而被研究的属性是「是否会患白血病」。换句话说,我们在一群家里经历了豪华装修的 0-14 岁孩子中,预测他们患病的几率。在我们的结论里,「90%」的分子和院士的一样,还是「家中豪华装修的白血病患儿」,但分母就变成了「家中豪华装修的中国全体 0-14 岁孩子」。
看出来没?这两句话描述的人群是不一样的。我们推断的话里包含的孩子们,是中国全体 0-14 岁小孩;而院士说的话,只是包含了我们所指的那么多孩子们里面极少数极少数的患病的孩子。所以,除非「家中豪华装修的中国全体 0-14 岁孩子」的数量等于「全体白血病患儿」的数量(而事实是前者远远远大于后者),否则我们的结论是不成立的。
而且,由于不知道隐藏在每一个暴露于「豪华装修」而患病的孩子的背后有多少个同样暴露于「豪华装修」却没有得白血病的健康孩子,因此随着健康孩子们的数量的变化,理论上暴露于「豪华装修」后会患上白血病的几率可以取(0,100%]这个左开右闭区间中的任意值。当健康孩子们的数量无限大时,暴露于「豪华装修」的孩子们患白血病的风险可能比没有暴露的孩子们高,但绝对的「几率」仍然无限小。
如何正确推断豪华装修的危害和孩子患白血病的几率
要估计一个特定群体的发病率,目前必须靠队列研究或者疾病监测这类的长期连续观察,而且抽样要有代表性,能够使得分子和分母所代表的人群都是我们想要了解的人群。
因此,回答「家中豪华装修的孩子患白血病的风险有多大」这个问题,我们需要先对全部的健康孩子们进行一个有代表性的样本量足够的抽样,然后观察这些孩子们随着时间流逝各自出现的发病情况。等到观察期结束后,我们再根据孩子们是否暴露于「家中豪华装修」,把他们分成暴露组和对照组,然后暴露组的发病率,也就是「家中豪华装修的孩子们有多少得了白血病」,就是我们的答案。
此外,对于回答「豪华装修到底有没有危害」这个问题,队列研究同样适用。如果暴露组的发病率明显高于对照组(流行病学上有一个指标来衡量这种「高」的程度:相对危险度 RR,relative risk),也就是说,和家中没有豪华装修的孩子们相比,家中豪华装修的孩子们患白血病的几率大幅增加,那么家中豪华装修就很可能会显著提高小孩患白血病的风险。
院士的数据,如果加上与全人群中「豪华装修」的率的对比,也可以通过病例对照研究的设计来证明豪华装修的危害性;但是,基于病人的暴露数据,无论如何也是说明不了一个家中豪华装修的、目前健康的孩子在未来患白血病的几率有多高的,这是病例对照研究自身的局限性决定的。
通常来说,队列研究反映出的真实的情况,如果还是用前面的图来表示,那么大概就会像这样:
啥?你问我代表患病孩子们的黄色矩形去哪儿了?它还在原来的位置呢,只是高度太低,太难看见啦。因为现实中,白血病在儿童中的发病率特别低,哪怕在家里进行了豪华装修的小朋友们中,会进展到患白血病的,绝对也是少数。因此,家长们不必担心「豪华装修」这种行为一定会给小朋友带来什么不测。
但是,这并不代表我们应该平白无故承受这样的风险。这只是意味着,豪华装修本身不一定 90% 导致孩子患白血病,但它会增大孩子们患白血病的风险是肯定的。由于豪华装修带来患白血病的风险是可以通过使用合格的、散出挥发性有机物少的装修材料和家具来避免的,因此这个结果仍然提示我们,应该注意装修材料造成的室内空气污染可能带来的白血病发病风险。
总结
医学发展到现在,之所以能够逐渐掌握各种疾病的治疗方法,很大程度上基于对这些疾病的病因的正确了解。对病因的正确了解,则有赖于对各种实验和人群调查数据的正确解读。而且,针对一个病因要采取多大程度的措施,也有赖于我们对病因危害效应大小幅度的正确认识。如果认识到了一个病因的危害形式,却盲目夸大它危害的幅度,那么这也是不利于疾病预防控制的,还会影响到群众对自身生活的正确计划安排。
利用谎言的恐吓效应来做健康教育,可能一时可以快速提起公众对一个公共卫生问题的认知,但一旦谎言破灭,公众便可能放弃对这个公共卫生问题应有的关注。所以,谎言恐吓教育法无异于饮鸩止渴。希望各位在使用和解读人群调查数据时,尤其要谨慎。