Quantcast
Channel: 知乎日报
Viewing all articles
Browse latest Browse all 20608

在神经科学领域,有哪些反直觉的研究成果?

$
0
0

日报标题:大脑里有个「偶像细胞」,看到爱豆就开始疯狂

漆松,Neuroscience of Fear and Anxiety

反直觉,这个提法有点大。我最先想到的是一个叫"Concept Cell"(概念细胞,旧称 Grandmother Cell, Jennifer Neuron 等)的东西。

从直觉上讲,人脑对复杂物件的认知 / 表征应该是一个极端复杂的过程,一定需要不同脑区以某种方式进行协作。举个例子,要表征自己最喜欢的美少女爱抖露(注:偶像),至少需要不同脑区的几坨不同神经细胞群的某种复杂的 firing pattern (激活模式?)才行吧。至少我曾经是这么觉得的。计算机科学领域做 AI 的人中,也有学派认为任何物体都可以用一组复杂向量来表征,再复杂都没关系,反正可以降到低维求解嘛。这样一来,人脑的真实运作模式也与 AI 的努力方向一致,和谐统一啊,科学!斯巴拉西!

然而现实挺反直觉的。大量的研究告诉我们,medial temporal lobe (中颞叶?) 中的神经细胞可以轻松地表征高度特异性,高度抽象的概念。这样的细胞被称作 concept cell - 概念细胞。特异,抽象到什么程度呢?会有特定的细胞群,对且只对你最喜欢的那个美少女爱抖露反应。

一个扯淡的例子:偶像细胞

举一个粗糙的例子:运用一种叫做 Intracranial recording 的技术,我们插一根电极到你的脑子里,记录某些对你的本命爱抖露进行表征的细胞的电活动。接下来,我们展示不同的图片,有的图片是战车,有的图片是别的路人爱抖露,有的图片则画着你的本命爱抖露。这个神经细胞的电活动在大部分时间里都是安静的 - 它不 fire,然而只要看到了爱抖露的照片,它就会开始疯狂地 fire。

(以下为大雾的图一)

Fig.1 A) Kashiwagi cell fired upon subjects' viewing a recent commercial of the idol. B) Kashiwagi cell did not fire upon viewing Panzer IV. C) D) Remarkably, despite substantial similarity between the two pictures, Kashiwagi cell only fired towards the picture of the idol in question, but not towards the one of Watanabe Mayu.

仔细体会一下这个现象厉害的地方:这个特异性不仅仅是单一维度的特征而已,如果你告诉我,有的细胞对圆形敏感,有的细胞对方形敏感,那没什么问题。然而这个特异性准确到特征相似(一定程度内相似)的路人都可以被区分出来,同一个人不同造型的照片也可以被识别出来:就像上图所示,这个柏木细胞面对不同的柏木由纪照片都有反应,然而面对(一般人看来)极为相似的马玉玉则不会有反应。

[Note.1: 这里需要强调一点 - 并不是所有人都会有这个“柏木细胞”。概念细胞对不同个体有特异性,它往往限于 familiar, prefential objects (熟悉,并且喜爱的物体)。比如柏木由纪的粉丝会拥有柏木细胞,而渡边麻友的粉丝会拥有马玉细胞,道理是这样]
[Note.2: 请不要纠结图片是否彩色,发型 / 脸型是否相似的问题…参考文献里面的一堆研究应该把能够想到的 confound 都控制得差不多了]
[Note. 3]: 之所以同一个人不同的照片能得到相同的识别,是因为 MTL 中的细胞有高度的 Visual Invariance (视觉特异性?) - 对同一个物件,无论观看的角度,大小,或是细节区别,这些细胞的 firing pattern 都是类似的。

研究概念细胞的方法:颅内记录

为了科学起见,我下面引用[4]中的插图对这个技术与实验过程做一个严谨的解释。

Fig. 2 a) 经@Yuanning 指正,正确的技术细节如下:前面那些蓝色的才是 contacts。正是因为每个 contact 可能测到来自多个神经元的信号所以才需要 spike sorting。而后面的 microwire 是用来传输来自不同 contacts 的信号的导线。b) 展示的是来自某一个病人 amygdala(杏仁核)的数据。它经过了高通滤波,注意这是很多细胞信号的叠加. c) 展示的是经过 spike sorting(一种源定位技术)之后,我们成功区分出来的来自不同细胞的成分. d) 展示了细胞群 1 和细胞群 3 面对某些图片分别的 firing 情况,可以看到,细胞群 1 对于所有的动物细胞都有反应,展现出比较低的特异性,这被研究者们称为"interneuron"。细胞群 3 则有较高的特异性(也就是本文讨论的重点),被称为"pyramidal cells"。

有同学可能会觉得,这只是拿图片,视觉信息说事而已,并没有触及概念的本质,有漏洞。这个质疑非常好!我也一样……我根本不愿意相信如此玄学的东西……然而有实验已经初步从概念的本质上回答了这个问题。

最开始了解到这类研究的时候,我是不信的,毕竟过于玄学,我觉得这肯定是现代颅相学(雾)的又一忽悠性杰作,然而相当多的实验不但证明这个现象非常的 robust,而且还把对于“概念”的表征上升到了更深的层次。

很久很久以前(1960s), 一个叫 Jerry Lettvin 的神经科学研究者曾经 YY 过,人脑中会有一些细胞,对应着单一的复杂概念,比如 grandmother. 这个大家都看来十分可笑的概念被无情地抛弃了,之后,人们对于这个现象最初的灵感来源于一些灵长类的研究。猴子颞叶中的神经细胞会对脸,手之类的东西有特异性反应(没人会再看的上古文献:[1][2])这个东西真正成为大新闻是在 2005 年:迦太基和 UCLA 对一组癫痫病人的研究[3]发现(只能用癫痫病人,因为他们正好有侵入性治疗的需求,健康被试是不会随便让你往他们脑子里插管子的……),人脑颞叶中的某些细胞会特异性地对诸如 Bill Clinton, Jennifer Aniston 之类的名人反应,具体水平因被试而异。

接下来,研究者们为了证明这些 concept cells 表征的是真正的“概念”(而非某一类特征),做了更加细致的实验,下图引用自[4].

Fig. 3 可以看到,研究者们挑选了天行者 luke,尤达大师等“概念”进行验证,为了验证对应这些概念的细胞确实存在,他们动用了:1)天行者 Luke 的图片 2)天行者 Luke 演员的图片 3)天行者 luke 的文字 4)天行者 Luke 的音频(男 / 女) 然后,他们发现存在特异性的细胞对这些东西统统有反应,然而对别的玩意儿统统没有反应,好想反驳他们 :)

这证明了,概念细胞真的是对于一个完整的抽象概念进行反应的,而不仅仅是视觉特征,这也解释了前面举的例子:为什么对于柏木由纪粉丝而言,他们的“柏木细胞”可以分辨出长相相似的路人偶像的原因,因为概念细胞 encode 的是“柏木由纪”的概念,而并非仅仅是相关的视觉信息。实验做到这一步,确实可以初步说明,人类脑中确实存在着表征高度特异性,高度抽象性概念的细胞群,不需要乱七八糟的许多脑区一起上阵,也不需要奇葩的交替 firing 规则什么的,就是一个细胞群足矣。

那么,概念细胞究竟是如何工作的?

结合目前已有的研究成果,Quiroga 在[4]中分析了概念细胞的工作方式。为什么单个细胞就可以表征复杂的概念?不同概念的表征之间是否有相互关联?接下来我将顺着[4]的行文帮助读者将思路梳理一遍,并且尝试对这些问题作出解答。

首先需要树立一个观念:MTL(Medial Temporal Lobe)不是铁板一块的独立结构,它包含了包括 Hippocampus(海马)在内的一系列重要区域。而我们谈到的概念细胞在这些不同区域中,面对刺激之后反应的 selectivity(特异性)与 latency(速度)都是不同的,如[4]中的下图所示:

Fig.4 左图列出了隶属于 MTL 的各个区域,根据基于猿猴解剖的结构联结研究[5][6][7],黑色箭头代表与视觉区域的联结,灰色箭头代表与听觉区域的联结(其实不用管……总之大家串在一起就对了 wink)。右图则展示了各个区域内细胞反应速度(response latency), 视觉特异性(visual invariance)等属性。可以发现,这张结构图中的区域由下至上,神经细胞的反应特异性和反应时长逐渐增加

虽然我们没办法把人脑搞得这么清楚,来自猿猴的证据还是很能说明问题,这就是说,概念细胞并不是突然凭空冒出来的 - 在信息传达到能够直接辨识“柏木由纪”这个概念的诡异细胞之前,还经过了一些特异性更弱的,反应更加 general 的细胞。

我们也许可以大胆地做出一个假设:这张图中自下而上的区域,就是概念信息流动的方向,或者说,我们在处理概念信息时意识(狭义)的流动方向。而这个信息流动的终点就是著名的记忆信息处理中心海马区,感觉闻到了一丝疑似真理的气息。

私货 Note. 虽然这只是一种理论假设,但我个人是很愿意相信的 - 比如 Adolphs 组在做病人的人脸识别范式的时候,总是集中记录海马区和杏仁核的活动(图 4 顶层),不仅仅因为这两个区域传统上认为与 face processing 相关,也因为这两个区域的细胞在实际操作中证明是对复杂人脸信息反应最灵敏的。[8]

这个理论可以从直觉上解决我们的问题:单个细胞群就可以表征单一的复杂概念,是因为它们处于一个复杂信息流的末端。

然而事情到了这里还不能结束,对于这个玄学的概念细胞,我们还有很多东西要问,比如,概念细胞群与所有的概念真的是一一对应的吗

我们也许永远无法证明一点,因为在操作上是不可能给被试呈现所有可能的概念,然后观察某个细胞群是否 fire 的。invariance 也伴随着一定程度的 selectivity - 从原工科生的视角来看,我相信大脑的表征不会是无限精确的,当柏木由纪与渡边麻友画上相同的浓妆时,我的柏木细胞大概会对着她们同时 fire 吧 :)

Food for Thought

@Mon1st 在本文初稿的评论区中一针见血地指出,concept cell 很可能就是"place cell in task space"。事实上,这也是[4]中提出的猜测。

Place cell, 就是那个小鼠在迷宫中到达某种特定环境就会 fire 的细胞(位于海马)。本文讨论的 concept cell 与它有许多相似之处:

  • Place cell 与 concept cell 一样,都具有高度的特异性
  • Place cell 与 concept cell 一样,都对环境 / 概念有着强力的 explicit representation - 只需要观测细胞的 firing,就可以准确地预测小鼠所在的环境 / 人所接收到的概念信息。
  • Place cell 的 firing 呈现出 attractor dynamics吸引子特性)这是一个物理学概念,不专业地解释,就是说:不动点周围的状态都会被“吸”向不动点,在小鼠的 place cell 中反应为,哪怕环境是线性变化的,place cell 的 firing 会剧烈变化 - 这对应了 concept cell 的 all-or-none firing pattern: 只要概念对上了就疯狂启动,没有对上就什么事也不做。
  • Place cell 和 concept cell 一样,都可以很快地通过学习生成
  • ......

人脑有时候真的很魔幻 :)

References (浅尝辄止的话,只要看[3][4]就好啦!)

[1] Perrett, DI; Rolls, ET; Caan, W (1982). "Visual neurons responsive to faces in the monkey temporal cortex.". Exp Brain Res. 47: 329–42.

[2] Rolls ET. 1984. Neurons in the cortex of the temporal lobe and in the amygdala of the monkey with responses selective for faces. Hum Neurobiol 3:209–22.

[3] Quiroga, R. Q., Reddy, L., Kreiman, G., Koch, C., & Fried, I. (2005). Invariant visual representation by single neurons in the human brain. Nature,435(7045), 1102-1107.

[4] Quiroga, R. Q. (2012). Concept cells: the building blocks of declarative memory functions. Nature Reviews Neuroscience, 13(8), 587-597.

[5] Lavenex, P., & Amaral, D. G. (2000). Hippocampal-neocortical interaction: a hierarchy of associativity. Hippocampus, 10(4), 420-430.

[6] Suzuki, W. A. (1996, February). Neuroanatomy of the monkey entorhinal, perirhinal and parahippocampal cortices: organization of cortical inputs and interconnections with amygdala and striatum. In Seminars in Neuroscience(Vol. 8, No. 1, pp. 3-12). Academic Press.

[7] Saleem, K. S., & Tanaka, K. (1996). Divergent projections from the anterior inferotemporal area TE to the perirhinal and entorhinal cortices in the macaque monkey. The Journal of Neuroscience, 16(15), 4757-4775.

[8] Tsuchiya, N., Kawasaki, H., Oya, H., Howard III, M. A., & Adolphs, R. (2008). Decoding face information in time, frequency and space from direct intracranial recordings of the human brain. PLoS One, 3(12), e3892.


Viewing all articles
Browse latest Browse all 20608

Trending Articles