(长文预警:全文约 4700 字,大概需要 15-20 分钟来阅读)
最近在整理旧文档时,偶然发现一份以前读博时制作的 PPT,内容有关于科研的方法论。其中的知识要点,其实来源于不少人都很讨厌很头痛的研究生“政治课”。然而我们学校的政策是,只要不离题太远,各位任课老师可以任选领域或角度授课(然而选课分班时学生完全看不到,所以都是胡乱选的)。恰好当时我选到的班,是由一位新上任的年轻教师代课。由于她完全不懂“套路”,于是干脆拿她的研究领域来上课,即科学哲学。然而就是这样一门胡乱选上的课,让我受益匪浅。学期结束后,我还主动联系了很快被调走的任课老师,在她的推荐下,开始阅读逻辑学和科学哲学的书籍。
科研是一种理性思维的活动。科学家通过观察与实验,描述客观世界,获得科学事实。常见的科研逻辑有分析与综合,归纳与演绎,比较与类比。然而,并非每一种逻辑思维方法,都能保证获得的结论为真。为了避免落入陷阱,我们需要认识一下,科研中常见的逻辑谬误都有哪些。
一、诉诸权威
从字面上,诉诸权威非常容易理解,即以专家或权威所说的话作论据的根基。通常情况下,当某个领域的权威,在严密的逻辑、实验的基础上,对他所擅长的领域做出主张,我们是可以其援引为论据。然而,当权威所做出的主张超越了其研究领域,或者其论证过程并没有基于理性论证,那么将该权威做出的主张作为论据是无效的。
在实际科研中,往往可以看到有些人将发表在高影响因子杂志的文章拜为金标准。虽然科学论文基于同行评议,但往往仅有三位审稿人把关(而审稿人和作者之间可能还存在利益关系)。假如不仔细阅读原文并推敲其中的逻辑,而只是生硬地照搬其中的数据和结论,那么就存在犯错误的风险。进一步说,科学研究中往往是存在争议的,假如仅听信其中一派的声音,依然是不理性的做法。
此外,和诉诸权威相关联的逻辑谬误还有:诉诸传统(认为传统的即是正确的,典型形式如“自古以来……因此……”,“大家都这么做……因此……”),以及诉诸时代(新的即是好的,旧的即是坏的)等。
二、肯定后件与否定前件
在理解这种逻辑谬误前,我们先来简单理解一下什么叫演绎推理。
演绎法,是一种由一般到特殊、前提和结论之间蕴含着充分性或充分必要性关系的推理。它在结构上由前件 p 和后件 q 两个部分组成。常见的演绎法有肯定前件及否定后件两种。(注意,小标题的谬误和这里是相反的)
肯定前件:若 p,则 q。因为 p,所以 q。举个例子,写成经典三段论式:
强酸(p)可以腐蚀皮肤(q);
因浓硫酸是强酸;(肯定前件 p)
所以浓硫酸可以腐蚀皮肤。
否定后件:若 p,则 q。非 q,所以非 p。举例如下:
强酸(p)可以腐蚀皮肤(q);
这份液体不能腐蚀皮肤;(否定后件 q)
所以它不是强酸。
而反过来,肯定后件和否定前件是经典的演绎推理谬误。比如这个命题:抗癌药(p)能够促使癌细胞死亡(q)。(注:无论机制是直接的还是间接的,无论以何种形式死亡)
我们可以说,如果一个化合物没有办法使癌细胞死亡,那么它就没有可能成为抗癌药(否定后件)。但如果肯定后件,那么就会得到“凡能够促使癌细胞死亡的化合物都能成为抗癌药”的结论。然而,你在培养基中撒入大量食盐,或倒一杯可乐,也能把癌细胞弄死,然而,食盐和可乐却不是抗癌药。而如果写成否定前件,则会变成“不是抗癌药的化合物就无法弄死癌细胞”。然而,就像刚才所说的食盐和可乐,或者直接开一枪,照样能把癌细胞弄死。
题外话:演绎推理除了上述提到的方法之外,还有诸如真值传递、真值合并、双重否定等很多种展开的逻辑形式。有兴趣的可以自行搜索阅读。
三、以偏概全
和演绎法相对应的逻辑方法是归纳法。它是一种由特殊到一般的推理过程。比如说,这只乌鸦是黑的,那只乌鸦也是黑的,观察了一百只乌鸦还是黑的,所以得到结论:乌鸦都是黑的。归纳法虽然是一种有力的逻辑推理方法,但与演绎法(一般到特殊)相比起来,它并不能保证结论总是为真。
以偏概全是使用归纳法中常见的谬误,即使用过小的样本量,或者不具代表性的样本,归纳得到一个错误的结论。比如说,用一张什么偏方,治好了某个人的某种疾病,如果就据此得出“这张偏方具有治疗该疾病的作用”,那就错了。现代临床医学研究,总是强调大样本、多中心、随机、双盲和对照试验,目的就是避免在运用归纳法时陷入以偏概全的谬误。
在基础研究中,我们也应当注意使用多种模型,多种方法来获得多角度的证据,以支持我们的结论。比如为了得到某化合物对 EGFR 扩增的肿瘤均有抑制作用的结论,在 in vitro 实验中,我们应当寻找多种 EGFR 扩增的细胞系进行测试,同时还应该在无 EGFR 扩增的细胞系中过表达这个基因,以及在 EGFR 扩增的细胞系中干扰或敲除这个基因,观察是否出现相应地影响药效的作用。而如果为了得到某化合物对肿瘤细胞的杀伤作用不依赖于某特定的遗传背景,同理,我们应当选取多种不同遗传背景的细胞系进行测试。
四、事后归因
字面上,我们很难去理解事后归因的意思。个人认为是中文翻译过程中的问题。它的拉丁文原文是“Post hoc ergo propter hoc”,英文翻译为“After this, therefore because of this”,简称“Post hoc fallacy”。它的真实意思是,B 事件发生在 A 之后(即 A 在 B 前),因此 A 是 B 的原因。这种谬误还能表达成“A 发生在 B 之前,因此避免 A 则能阻止 B”的形式。
说白了,非常简单。两件事情先后发生,先发生的未必就是后发生的原因。举个例子,十年前你不小心踩了我的右脚,今天我发现右脚骨折,难道可以说今天的骨折是当初你踩我一脚所致?
这看起来相当荒谬,然而套在科研中,这种例子在低档次的文献中却屡见不鲜。比方说,有人用化合物处理肿瘤细胞,数小时后发现某信号通路受到抑制,两天后细胞死亡。然而在得到其他证据之前,我们不能说,这个化合物就是通过抑制这个信号通路使肿瘤细胞死亡的。这种情况下,我们至少应该通过其他数种方法来证明,比如用 RNAi 抑制这条信号通路,观察是否出现同样的表型,以及过表达这条信号通路的蛋白,观察能否逆转表型等。
五、相关即因果
相关不蕴含因果,是统计学中经常强调的概念。无论两个变量之间存在如何紧密的相关性,在获得其他证据支持之前,我们绝对不可以轻率地下结论,认为这两个变量之间具有因果关系。
举个例子,隔壁老王生了个孩子,同时种了一棵树。孩子和树都随着时间的推移而长高,在一定时间内,如果使用相关性分析,可以得出这两个变量具有相关性。然而我们都很清楚,孩子长高和树长高之间,并不具有因果关系。
尽管道理如此浅显,但依然有无数人往这个陷进里面跳。这种谬误常见于对大范围调查数据的误解。维基百科上举了一个非常著名的例子:曾有流行病学调查数据显示,接受激素替代疗法的女性,同时具有较低的冠心病发病率。这一度让人们认为,可以使用激素替代疗法来预防冠心病。然而在随后的临床试验中却发现了相反的结果。后来仔细审查数据发现,有条件接受激素替代疗法的女性,通常来自于社会、经济地位较高的群体,而这类人往往较为注意饮食和锻炼,这个因素可能使冠心病发病率降低。
六、证实性偏见
这种谬误是指,倾向性地选择对自己有利的论据,而无视不利的证据。这种逻辑谬误在日常生活中相当常见。比如觉得星座运势说得好准,觉得暗恋对象的一举一动都是为了吸引自己而做,诸如此类。
新手做文献综述时,容易犯证实性偏见的错误。许多研究领域,往往存在多种假说多方争论。比如抗氧化剂对预防肿瘤是否有正面作用,又或者反而促进了肿瘤的进展,目前依然存在争议。因此我们在做文献研究时,必须遵循兼听的准则,而非仅挑选出对自己立场有利的文献来支持自己的观点。尤其是在最终论文写作时,必须合理地引用及解读另一面的研究证据,如此才能保证理性客观。
七、稻草人谬误
与证实性偏见具有关联性的,是稻草人谬误。它是一种曲解所要否定的论点,重新树立一个毫不相关的靶子(稻草人)并加以攻击,以声称推翻了对方观点的逻辑谬误。
比如以下逻辑:产前诊断是反人类的,因其意图是扼杀有缺陷的胎儿。很显然,这个逻辑故意歪曲了产前诊断的本意。又比如这样的说法:肿瘤耐药的机制太多太强了,如肿瘤血管生成除了依赖 VEGF 之外还有其他许多机制,因此 VEGF 的单克隆抗体药物是没有作用的,没有任何研究价值。这个逻辑,在前半段是正确的,肿瘤之所以难治,确实是因其存在多种耐药途径、多条代偿通路。然而,VEGF 依然是诱导血管生成的重要因子之一,片面地以一句“代偿通路多因而没有研究价值”将该疗法全盘否定,显然是不理智的。
新手在写作论文时,尤其要注意不要陷入打击稻草人的谬误之中。比如当我们发现了一个新的治疗靶点时,千万不要通过否定、甚至扭曲前人的研究来抬高自己的价值。
八、滥用统计
有句名言:“世上有三种谎言,谎言、该死的谎言和统计数据。”从理性的角度来讲,将统计数据归为谎言,其实也是犯了所谓的稻草人谬误。数字本身并不会说谎,而这个说法之所以会出现,其实是对统计数据的误读导致的。
正如前文第五点所说的,在统计中,无论两个变量存在如何紧密的相关性,在获得更进一步的证据之前,我们绝不可以说这两个变量之间存在因果关系。
然而,滥用统计还有许多形式。
比如说,某个药物能使血压平均值降低 1 mm 汞柱,因为 P < 0.000001,所以药效卓绝。然而,统计学假设检验中的 P 值,无论有多么小,永远不能用以回答任何生物学意义的问题。
又比如,用平均数来描述偏峰分布的数据,Y 轴不从零开始从视觉上夸大组间的差异,故意截取一小段 X 轴从视觉上营造相关性,等等。
九、滑坡谬误
简单说来,滑坡谬误就是一种认为“可能之可能依然可能”的错误认识,即不合理地使用连串因果关系,夸大了每个环节的因果强度,以达到某种意欲之结论。
举个例子:不读书的人没文化,没文化的人不讲理,不讲理的人激化社会矛盾,社会矛盾激化会引发战争;为了避免战争,应该把不读书的人判死刑。我们可以看到,这个推理过程,每走一步,都存在着犯错误的风险,越往后推,错误的几率就会越来越大,最终得到荒谬的结论。
又比方说,发现了某个化合物能够诱导 EGFR 的磷酸化。因为 EGFR 的磷酸化能够激活 PI3K,从而激活 AKT;AKT 能够通过抑制 GSK-3β,上调 Cyclin D1,最终促进肿瘤的增殖,因此该化合物是个促癌物质。
倘若科研可以通过这样的推理来做,那该有多方便。然而事实上,并不是所有的癌症均能由 EGFR 驱动,EGFR 的磷酸化也未必能激活 PI3K/AKT 信号(如 PTEN 在正常情况下可以阻断意外或者过度激活的信号)……
十、循环论证
这种逻辑谬误是指,用来证明论题的论据本身之真实性,要依靠论题来证明。也就是说,把一个尚待解决的问题当成了前提,当承认了前提,就相当于承认了结论。典型的例子如:长得胖是因为吃得多,而吃得多的原因是长得胖。形式上和循环论证相似的有循环定义、循环解释和循环因果等形式。比如说,“什么是苹果 - 是苹果树结的果实;什么是苹果树 - 是能结苹果的树”这样的逻辑,便是循环定义。
这种逻辑谬误非常低级,通常可以一眼看穿。然而就连大名鼎鼎的牛顿,也曾犯这种逻辑谬误。他曾用密度来定义质量,然而密度本身却依然需要质量来定义。(不过,质量定义这个话题迄今尚未完全终结,这里也并非苛求前人。)
科学发展到现在,不少概念都是有严格定义的,即使存在未成型的术语或者措辞,在既定的范式中,也有一套约定俗成的界定范围。这也为交流和研究带来便利。但是,当发现一个新现象、产生一个新的概念时,就需要注意避免落入循环论证的圈套。比如,在多年以前,在尚未明确线粒体膜电位的丢失与细胞凋亡之间的因果关系之时,我们不可以说:细胞凋亡是因为线粒体膜电位丢失,而线粒体膜电位之所以会丢失,是因为细胞发生了凋亡。又比如:这个细胞发生了分化,是因为表达了这个蛋白标记,而表达了这个蛋白标记,是因为细胞发生了分化。这同样也是显而易见的循环论证谬误。