日报标题:7 是如何成为一个神奇数字的?
宇宙的终极答案是什么?
42.
这怎么会是宇宙的终极答案呢?42 连个质数都不是!倒是它的一个质因子,看起来更有可能是人类所追寻的宇宙的答案:
你看世界上那么多事物都在 7 的掌控之下:
一周七天,彩虹七色,七宗罪,七仙女
七龙珠,七武海,七卷本《哈利波特》
七对主仆争夺圣杯,世界最强的七个婴儿
等等等等。
如果再以这个数字为中心划定一个范围,我希望是 +/- 2,这样加把力我们还能加进来
五行,八卦,九尾,等等等等。
使劲挤一挤还能把『四色苜蓿,十诫、十个指头』之类的都加进来。所以啊,7 这个伟大的数字才是涵盖宇宙的最终答案!这个答案超越文化,跨越地域,贯穿古今。
迷之缘起
讲到这里,你应该知道我是在扯淡了。然而,当我说起另外一件事情,你可能就不这么觉得了。
1950 年代,George Miller 受邀给东部心理学会 (Eastern Psychological Association) 发表一次长达两小时的演讲,来说说他的研究成果。再三推脱之后,Miller 仍未成功脱身,于是开始思考如何将他的不同的研究方向整合起来形成一个完整的故事。最终,George Miller 在 1956 年的 Psychological Review 上发表了著名的《神奇的数字 7,加减 2:人类信息加工容量的某些局限》(The Magical Number Seven, Plus or Minus Two: Some Limits on Our Capacity for Processing Information)
对 90% 的人来说,故事到这里就结束了。是的,始于标题,终于标题,俗称:标题党。对于 99% 的人来说,或许因为他们读过心理学相关的书籍,故事一般会多一句话:
人类短期记忆的容量大概在 7 个左右,范围是 5 到 9 个,这是著名的心理学家(可能一半以上的人可能说不出这个心理学家的名字)的研究结果。
这篇被引用了超过 2 万次的认知心理学文献,给人类社会带来的影响主要来自于它的标题,以及后一半不到的段落。有趣的是,在此之后的将近 50 年里,人们就生活在这个数字 7 上了。神奇的数字 7 不但在心理学界被广为流传,它的足迹几乎遍布人类生活相关的各个方面,比如,做广告不要超过 7 条信息,做 PPT 不要超过 7 个点。
Miller 自己也没有想到这篇文章会引起如此大的反响。他对于世人如此生搬硬套自己 1956 年的文章标题内容也是感到尴尬,甚至震惊。他曾经在书信中提到,『7 个信息』这个概念如此深得人心,以至于人们认为在高速公路上的广告牌上超过 7 条信息会引发交通事故。而广告牌业界不得已找一个人穿越城镇,告诉一个一个镇子里面的人:不,广告牌上的七条信息不是车祸的罪魁祸首。这个不断出差的男人回到家里之后疲倦又烦恼,而当妻子问起来他为什么这么做的时候,他说:『一个该死的哈佛教授写了篇文献说人类只能处理 7 比特信息!』作为心理学家的妻子感到疑惑:『我想他并不是写的这个意思。』Miller 得知这件事情之后,惊讶之极,以至于他在 70 年代专门就此事给广告版业界写了一篇文章,告诉他们自己从来没有说过人类理解信息的能力只有 7 比特。
迷之真相
前面的文字中,我已经给 Miller 这篇文章的标题提供了链接——这个链接导向的是一个中文翻译版本,对于不想看原文的人来说,这可以算个折中的选择。当然,原文也不过 17 页,1994 年的版本更是只有 10 页。差别仅在于排版,还是熟悉的内容,还是熟悉的味道。
这里,我也就带着大家速读一下这篇文章,希望大家有时间还是自己好好阅读全文。话说在前面:Miller 在文章中对于『组块(Chunking)』这一概念的思考和创造应该是这篇文章最有意思的点。
文章的开头,Miller 便引用了信息论的思路。如果把人作为一个通信系统,那么我们就可以通过计算呈现刺激的信息量(输入端)和人类行为反应的信息量(输出端)之间的关系来推测人类心智这个通信系统的容量——很不错的信息论模型,思路就是把人类心智当做 Noise Channel,然后来估算 Channel Capacity。
文章的前一半重心放在测量人对于单一维度的刺激的判断。实验基本上是这么做的,实验人员从 N 个可能的刺激选择一个呈现,然后观察者报告呈现的是哪一个。结果发现当 N<=4 的时候,正确率基本 100%,所以容量肯定是大于 2(=log 4)比特的。但是到了 N>=5 的时候,观察者就开始犯错了。当实验者把 N 从 2 到 14 变化的时候,结果发现一开始人类心智这个 Noise Channel 可以线性地递增传输的信息,但是逐渐这个传输量就在 2.5 比特附近不动了。输入的信息再多,人类心智也没法传输。
不同的感觉信息会有不同的传输容量,比如味觉大概在 1.9 比特,单点位置大概在 3.25 比特, 大小尺度大概是 2.8 比特, 颜色(Hue)大概是 3.1 比特,亮度(brightness)大概是 2.3 比特。
总之呢,对于各种各样的单一维度的刺激研究发现,Channel Capacity 大概是 1.6 比特到 3.9 比特之间,均值是 2.6 比特,标准差是 0.6 比特。于是,第一波结论就来了:
In terms of distinguishable alternatives, this mean corresponds to about 6.5 categories, one standard deviation includes from 4 to 10 categories, and the total range is from 3 to 15 categories.
就(不同刺激)可分辨的多种选项而言,均值大概是 6.5 个类别,一个标准差涵盖了 4-10 个类别,而总范围涵盖了 3-15 个类别。
接下来一个重要而有趣的发现是,一个高维刺激,比如具有大小和亮度两个不同纬度的刺激,人们在传输信息的过程中,容量上限并不是两个维度的容量之和,而是比单独的两个维度的容量之和要小一些:
比如判断一个点在一条线上的位置,人类可传输的信息容量大概是 3.25 比特。也就是说,我在这根线上的 10 个不同的点中选一个呈现给你,然后让你判断是 10 个中的哪一个,你没什么问题。但是,如果判断一个点在一个平面上的位置——横坐标和纵坐标都要考虑,人类可传输的容量只有 4.6 比特,小于 3.25+3.25 = 6.5 比特。所以,要传输一个高维度的信息,我们没有办法做到每一个信息都独立地传输。于是 Miller 给了这样一个结论:
看起来,当我们呈现更多的变量的时候,我们传输的信息的总容量虽然增加了,但是对于每一个特定的变量而言,我们的准确率降低了。
其后,Miller 简单提到了 Subitizing(不知道怎么翻译)之后,进入到了他对于短期记忆广度的讨论——终于到了大家都知道的部分了。
Miller 总结短期记忆研究发现,不管记忆的材料怎么变化,不管是数字,字母,数字 + 字母,还是从 1000 个单音节单词中随机选,人们在记忆这些材料的时候,大概只能记住 5-9 个。啊哈,我们终于看到了 7+/-2。
但是作为一个完整的故事,短期记忆广度跟之前的单一维度刺激判断的结果之间有一点问题。后者可以用比特作为单位,但是前者不行。比如记忆材料是 1000 个单音节单词中抽取,假设这 1000 个单音节词是均匀分布的,那么每一个刺激承载着大概 10 比特的信息,这个时候,对于能够记住 5 个单词的人来说,他实际上传递了 50 比特的信息。如果统一单位,这两个实验在数值上就不能吻合了。
于是,Miller 创造了组块(chunk)这个概念——人类传输的不是以比特为单位的信息,而是以组块为单位的信息。当然,组块是如何形成的,我们不知道。但是理论上是可以有算法的,比如说重新编码的算法。Miller 就在这个思路上继续讨论了一下,实际上是把更实际的锅甩给了后人。正所谓前人挖坑后人填,也正是 Miller 挖了个坑,后续才有一系列关于什么是组块,如何组块,组块相关的计算过程是什么等等这类的研究。
Miller 就这样用一个数字 7,把两个研究通过平均值联系到了一起:在单一维度的判断中,人类平均可以传输 7 个类别(6.5 嘛,那就是 7 咯),而在短期记忆中,人类平均可以记住 7 个组块。
一个时代
这篇文章是每一个学心理学的人都应该好好读一读原文的文章,为的是知道 Miller 当年到底说过什么。如果你对我的诠释不信任(我也建议你不要太信任),请直接回去看原文。
那是一个对于记忆的认识只有『短期记忆』和『长期记忆』的年代。George Sperling 离他发表部分报告法(Partial Report)还有 4 年的路要走,而『感觉记忆』更是需要再等 10 年才被 Ulric Neisser 正式命名。记忆的信息加工模型也还在酝酿之中。至于『工作记忆』这个概念,更是要等到 70 年代才呱呱坠地,与世人见面。
另一方面,香农(Claude Shannon)在 1948 年发表了《通信的数学原理》(A Mathematical Theory of Communication),一时间引发了各个领域套用信息论的狂潮。首当其冲的当然有研究人类心智的心理学家。当年心理学家对于信息论照本宣科却又充满激情的套用,连香农的同事 John Pierce 都有点看不下去了,并在他的《信息论导论》中专门开辟一章讨论信息论与心理学研究。装备上信息论的武器,又出现了乔姆斯基这样的人才,心理学也在 50 年代开始走出行为学派的桎梏,在新的『认知科学』的框架下进行尝试。
然而,Miller 的这一次尝试——一次把自己两条不同研究方向略带幽默地整理起来的尝试——却意外地成了认知心理学中一条金科玉律。不但在接下来的近 40 年里没有人突破和革新,倒是在 90 年代认知神经科学的兴起,在人们对于大脑如何实现认知功能的探索中,竟然有人通过合理的数学模型找到了这个数字 7 的神经基础。
在 Miller 之后的漫长岁月里,的确没有多少人再细究短期记忆容量的大小。每逢有人提起,估计就有人直接把 Miller 的文献甩他脸上。但是心理学对于短期记忆的研究并没有停滞,前面说到『工作记忆』概念的发明,信息加工模型的发明都在推动短期记忆的研究。神经科学的发展,与此同时,也逐渐确定了大脑的额叶是与工作记忆相关的重要脑区。只是人们仍然没有找到到底是什么样的大脑机制来实现短时记忆的局限性。这个时候,人们又一次想到了,他们认为的或者他们理解的,短期记忆的容量——Miller 的数字 7。
Lisman 和 Idiart 在 1995 年似乎找到了答案。他们认为短期记忆的内容是通过大脑不同频段的共振进行储存的。高频的 gamma 波搭载到低频的 theta 波上,高频信号承载单一信息,低频信号承载一次任务(Lisman & Idiart, 1995; Ward, 2003)。每一次 theta 波的起伏能搭载上多少 gamma 波的信息,人们就能在短期记忆中保持多少信息。其中,高频 gamma 波段大概是 30 到 70Hz 之间,低频的 theta 波段大概是 3.5~7Hz。区间不好计算,咱就用一个数据点来代表一下认为高频 gamma 是 40hz,而低频 theta 是 6,然后做个简单的除法 40/6,哎!还真就是 7 左右。
If memories are refreshed at the gamma rate once per theta cycle, then the number of items that can be held in short-term memory is approximately the gamma frequency divided by the theta frequency, or about 40/6, or, 7 memories without loss. This is just the number, 7 +/- 2, suggested by Miller as the average short-term memory capacity (Ward, 2003)
这个不同频段搭载信息的工作记忆模型到底是不是对的,我不评价,倒也不想否定。不过现在回头来看,这倒是让我想到了中学时候做数学作业的经历。那个时候有些题目很难,但是参考答案又不提供解答过程。于是我做不出来,就直接翻看答案,然后根据答案推导过程,以及想方设法凑答案。结果,倒也显得有理有据。这个数学模型本身倒是挺有意思,但是硬要向数字 7 靠拢,就显出一种刻意凑答案的行为。
是的,科学的进步总是站在巨人的肩膀上的。新的研究通常建立在假设某些结论一定成立的基础上。
只是,巨人也是会摔跟头的。
迷信的更替
Lisman 和 Idiart 在 1995 年将他们的文章发表在《Science》上两年后,1997 年 11 月,Luck 和 Vogel 在《Nature》上发表《对特征和特征联合的视觉工作记忆的容量》(The capacity of visual working memory for features and conjunctions),发现他们测量的视觉工作记忆容量只有 4 左右。这篇文章,在我看来,简直是啪啪地打脸 Lisman 和 Idiart 对于 7 的迷信——虽然并不见得打脸了他们的整个模型。Ward(2003)在综述中仍在挣扎说:最近有人认为容量不是 7 而是 3-5 左右。这个数值会导致(Lisman&Idiart)的模型站不住脚,但是这个 3-5 的容量并没有被广泛地接受,所以我们暂时不用担心(Ward, 2003)。
与此同时,Nelson Cowan 等待了多年,配合 Luck 和 Vogel 的这篇文章以及整理了自己的大量研究之后,终于在 2001 年的《行为与脑科学》(Behavioral and Brain Science)上振臂一呼《短期记忆中神奇的数字 4:对心智储存容量的重新思考》(The magical number 4 in short-term memory: A reconsideration of mental storage capacity) ,向占领认知心理学 40 多年的魔数 7 发起攻击。Cowan(2000)这篇文章是一篇富有争议的文章——能发表在《行为与脑科学》上的目标文章都是具有争议的文章,文章之后同行的评论也是非常犀利。文章从 Cowan 在 2000 年提交,到收集所有评论,到收集 Cowan 的回复,直到 2001 年才发表出来。
Cowan 显然认为魔数 4 才是更准确的估计。
Cowan 有足够的理由相信 Miller 的魔数 7 不是一个严肃的估计。对于 Miller(1956)这篇文章的来龙去脉,除了 Miller 自己,大概要数 Cowen 了解的最清楚了。他每每引用 Miller 在 1989 年回忆录中的陈述来说明当年 Miller 不过是想找一个理由把两个研究并在一起凑一个 2 小时的演讲(Cowan, 2010; 2015)。我们在之前的文章跳读中也确实可以感受到这种影子。当然,Miller 本人的话更有说服力。Cowan 本人在 Miller 生前多次与 Miller 有信件来往,而他更愿意让 Miller 自己来为自己加油打气,以至于他在 2015 年的文章中直接搬上了 Miller 的原话
Miller: I have now had a chance to read your BBS article. I think it is great! There were some ideas I thought you might have missed, but you didn’t. A good job... (Cowan, 2015)
更重要的是,Cowan 对于工作记忆的容量的思考已经超过了工作记忆本身,他 2005/2015 年的书《视觉记忆》中就从头到尾细细地梳理了一下关于工作记忆容量为 4 的理由。除了工作记忆的研究,他还讨论了注意、数数等其他认知功能的局限性,最终就是为了说明『容量 4』是人类『心智储存容量』——虽然 Mental Storage Capacity 这三个词没有一个是有精确定义的。
话转回来,Luck 和 Vogel(1997)这篇文章后来成了一篇重要的目标文章(Target Paper),并拉开了长达十年的激荡的视觉记忆的研究和争论。虽然当下对于这套争论已经不如前几年那么火热,但业界仍然没有达成共识。这场激战增进了我们对于视觉、记忆、注意、乃至意识的理解,也养活了不少科学家。
当然,在讲述这场争论之前,我们需要先来领会一下当代迷之魔数:神奇的数字 4。
参考文献
Miller, G. A. (1956). The magical number seven, plus or minus two: Some limits on our capacity for processing information. Psychological review, 63(2), 81.
Cowan, N. (2000) "The magical number 4 in short-term memory: A reconsideration of mental storage capacity." Behavioral and brain sciences 24, no. 01: 154-176.
Cowan, N. (2010). The magical mystery four how is working memory capacity limited, and why?. Current directions in psychological science, 19(1), 51-57.
Cowan, N. (2015). George Miller’s magical number of immediate memory in retrospect: Observations on the faltering progression of science. Psychological review, 122(3), 536.
Lisman, J. E., & Idiart, M. A. (1995). Storage of 7 plus/minus 2 short-term memories in oscillatory subcycles. Science, 267(5203), 1512.
Luck, S. J., & Vogel, E. K. (1997). The capacity of visual working memory for features and conjunctions. Nature, 390(6657), 279-281.
Ward, L. M. (2003). Synchronous neural oscillations and cognitive processes. Trends in cognitive sciences, 7(12), 553-559.