日报标题:什么都没看见只是听个响,脑袋里负责视觉的部分就激动了
在传统的观念中,视觉皮层只是层级化的加工 LGN (外膝体) 输入的视觉信号。这个加工的过程在神经科学中被称为 Bottom-Up (自下而上的)。计算机视觉中卷积神经网络等的架构也正是收到了一些视觉皮层加工信息的的启发。
然而进一步的研究告诉我们,除了 Bottom-Up 之外,视觉皮层中还存在 Top-Down (自上而下),也或许还存在皮层内部的一些环路。因而我们可以看到,视觉皮层的作用不仅仅是加工自下而上传来的视觉信息:在特定的情况下,即使没有视觉刺激的情况下,视觉皮层也可以编码特定的视觉刺激。
首先介绍一点小知识:这个实验的绝大部分数据都是靠一种“读心术”的方法:多体素活动模式分析(MVPA)(具体 MVPA 的介绍可以看这里哦),体素就可以理解为立体的像素,我们利用功能核磁共振(fmri)可以扫出来这些一些大脑立体的像素里面的血流信号( 专业的说是血氧依赖水平,BOLD),从而间接的反应大脑里神经元的活动。我们通过综合考虑很多“体素”的活动,来判断一个具体的认知状态。比如这个人看到的是鞋子还是篮球?
在下面的研究中,大部分的研究都是用的这种方法来解码、分析皮层的这个区域有没有在“编码”这个信息。
在没有视觉刺激输入的情况下,视觉皮层仍然会编码不少有意义的信息。比如仅仅听到了声音,仅仅看到图片的一部分,或者在试图记住这个刺激的样子(视觉工作记忆中的延迟时间),在想象。也可能是在做梦……
仅仅听到或想象声音造成的视觉皮层活动
Vetter 等人发现,听觉的信号(自然声音刺激,如森林声、人群的声音与交通工具的声音)可也以在早期视觉皮层(比如 V1,V2,V3)显著地被解码出来。同时,让被试想象以上三种声音,也是可以解码出来相关信息的。通过交叉验证结果显示:想象声音与真实的声音在视觉皮层有比较显著的相关性。
仅仅看到图片的一部分
Smith 等人的实验通过像被试呈现如下图这样一部分遮挡的图片
利用早起视觉皮层中与视野右下象限区域拓扑对应体素进行 mvpa 解码,也可以发现非常显著的结果,这种活动的模式是与真正呈现视觉刺激相关联的。表明即使“缺少”一部分刺激,在大脑中也可以“自动地”帮我们“补全”这一部分丢掉的信息。
有意识地“记住”视觉刺激(即进行一个视觉工作记忆的任务)
Harrison 等人发现,通过让被试暂时记住某一个指示的条纹的方向,在中间延迟的 11 秒钟时间。
在中间这个延迟的 11 秒中,在视觉皮层(V1-V4)中也可以比较明显的解码出来跟这个任务相关的信息。
同时,Christophel 等人也发现,当被试对复杂的运动模式做视觉工作记忆的任务的同时,在 MT,PPC 甚至 M1 中也可以解码出来这些信息。
视觉皮层内神经元的预测编码
在九月份刚刚发表在 Nature Neuroscience 的文章里,老鼠通过一个有各种路标的“虚拟隧道”。
我们可以观察到在 v1 有不少神经元像黑线这里,在刺激出现之前就已经开始活跃,有“预测”将要出现的刺激的性质
也就是说 v1 皮层内也有大量的编码期望与预测的神经活动。
如果预测的刺激与实际发生的不同,预测性神经元后续的反应也会分道扬镳。
与此同时,如果一个本该发生的刺激没有出现,也会有 v1 的神经元活跃起来。如下图:
也就是说,在没有刺激出现的情况下 (Omission),这些细胞也发放了,文章中作者认为这些 v1 的神经元编码了另一个重要的性质,即 predict error,即错误信号,即如果某个刺激并不想“期望”的那样发生。他们便会出奇的活跃。但是我认为,在更宏观的层面上,这一定与上面一些在人上做的 fmri 结果有关联。即这样的 predict error 与 predict coding 与试听整合、视野的情景内视觉皮层的活动模式有关。
为什么视觉皮层要体现这样的性质呢?这是一种预测性编码 (Predictive Coding),现在我们逐渐认为这个规律是大脑非常有普适性的规律。
这种预测编码在感觉皮层的存在可以帮助我们通过多感觉、视野其他部分或跨时间的的“全文情景” (contextual influence) 来锐化、增强表征 (sharpen、enhance representation),从而帮助我们更快地建立一个稳定清晰的感知;也可以通过在视觉皮层更精确的表征一个视觉刺激这样更具体的信息(而不是在更高级的皮层表征高级抽象的信息),从而帮助我们更好的进行一个视觉工作记忆的任务,完成对前后场景的比较。
这样的预测编码在生活中或者大自然里也有很多应用,比如在超市寻找东西的时候,你可以根据某个商品的一个大概印象去搜寻、比如你在看着歌词的时候会感觉听得更清楚、比如我们可以在两次回头时察觉到场景的变化。或者动物可以通过一些声音的线索更早更快地发现天敌……
References
Christophel, T. B., & Haynes, J. D. (2014). Decoding complex flow-field patterns in visual working memory. NeuroImage, 91, 43-51. doi:10.1016/j.neuroimage.2014.01.025
Fiser, A., Mahringer, D., Oyibo, H. K., Petersen, A. V., Leinweber, M., & Keller, G. B. (2016). Experience-dependent spatial expectations in mouse visual cortex. Nat Neurosci. doi:10.1038/nn.4385
Harrison, S. A., & Tong, F. (2009). Decoding reveals the contents of visual working memory in early visual areas. Nature, 458(7238), 632-635. doi:10.1038/nature07832
Kok, P., Jehee, J. F., & de Lange, F. P. (2012). Less is more: expectation sharpens representations in the primary visual cortex. Neuron, 75(2), 265-270. doi:10.1016/j.neuron.2012.04.034
Lee, S. H., Kravitz, D. J., & Baker, C. I. (2013). Goal-dependent dissociation of visual and prefrontal cortices during working memory. Nat Neurosci, 16(8), 997-999. doi:10.1038/nn.3452
Smith, F. W., & Muckli, L. (2010). Nonstimulated early visual areas carry information about surrounding context. Proc Natl Acad Sci U S A, 107(46), 20099-20103. doi:10.1073/pnas.1000233107
Vetter, P., Smith, F. W., & Muckli, L. (2014). Decoding sound and imagery content in early visual cortex. Curr Biol, 24(11), 1256-1262. doi:10.1016/j.cub.2014.04.020