Multidimensional dynamics of object representations in the human visual system

本研究利用大规模脑电图和脑磁图数据揭示,人脑中自然物体的表征会经历一个快速且短暂的维度扩展过程,其峰值出现在100毫秒内,这一动态过程与解码准确性相关,但其解释力超越了当前的行为学和深度神经网络模型。

原作者: Chen, Z., Isik, L., Bonner, M. F.

发布于 2026-04-30
📖 1 分钟阅读☕ 轻松阅读

原作者: Chen, Z., Isik, L., Bonner, M. F.

原始论文采用 CC BY 4.0 许可(https://creativecommons.org/licenses/by/4.0/)。 ⚕️ 这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

想象一下,你的大脑是一支庞大、高速的管弦乐队,试图在你看到某个物体(比如一只猫或一辆车)的瞬间演奏一首乐曲。长期以来,科学家们认为他们掌握了这首乐曲的乐谱,并借助两位主要的“指挥”来预测乐队将如何演奏:一位基于人类对事物相似性的描述(行为模型),另一位基于先进计算机视觉程序(深度神经网络)。

这篇论文提出了一个简单却棘手的问题:在你看到物体后的最初几分之一秒内,这场音乐表演的复杂性是如何变化的?

以下是研究人员发现的要点,已转化为日常概念:

1. 复杂性的“闪光”
当你注视一个物体时,你的大脑并非仅仅点亮一盏灯泡。相反,它会瞬间在多个不同维度(不妨将其想象为管弦乐队中不同的乐器或声部)爆发出一阵活动。

  • 隐喻:想象一下烟花绽放。在最初的100 毫秒内(眨眼都不到),大脑信号的“维度”或复杂性达到峰值。这就像烟花绽放成最绚丽、最繁复的形状。
  • 消退:达到峰值后,复杂性在接下来的几百毫秒内逐渐平息,如同火花在夜空中渐渐消散。

2. 与理解力的关联
研究人员发现,这种“复杂性爆发”并非随机噪声。它就像衡量大脑理解所见之物程度的仪表。

  • 隐喻:将维度想象成相机的分辨率。当分辨率最高(即复杂性峰值)时,大脑最擅长将物体与周围一切区分开来。这一高分辨率时刻与人类描述和计算机程序识别物体的能力完美契合。大脑使用的“维度”越多,画面就越具表现力、越清晰。

3. 缺失的拼图
这里的转折在于:尽管人类模型和计算机模型在预测大脑活动方面表现良好,但它们并非完美无缺。

  • 隐喻:想象你拥有一张由人类绘制的城市地图,还有一张由超级计算机绘制的地图。两张地图都很出色,但当将它们与实际城市(大脑的真实活动)进行对比时,两张地图上仍有一些街道和小巷是缺失的。
  • 发现:大脑中那些“剩余”的活动——即模型无法解释的部分——并非仅仅是随机杂讯。它们包含了关于我们如何感知物体的全新且有价值的信息,这是人类调查和计算机程序尚未捕捉到的。

总结
这项研究表明,当我们注视自然物体时,大脑并非仅仅按直线处理它们。它们会经历一次迅速而复杂的活跃爆发,几乎瞬间达到峰值,随后逐渐平息。虽然我们要目前最好的模型(人类描述和人工智能)解释了这一过程的很大一部分,但我们的脑海中仍存在一层尚未被破解的隐藏复杂性,这表明我们对人类视觉系统运作方式的理解,比我们此前认为的要更为精妙复杂。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →