Bottom-up and generative computations uniquely explain neural responses across the social brain

这项研究通过结合图神经网络与生成式逆规划模型,首次发现社会感知区(pSTS)与心理理论区(TPJ)均同时执行自下而上的关系感知与自上而下的推断计算,从而挑战了社会脑区域严格分工的传统观点,并揭示了其可能基于时间尺度而非空间位置的功能层级。

Malik, M., Kim, M., Shu, T., Liu, S., Isik, L.

发布于 2026-02-22
📖 1 分钟阅读☕ 轻松阅读
⚕️

这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这篇论文就像是在给大脑里的“社交侦探”做了一次CT 扫描,试图搞清楚当我们看到别人互动时,大脑里到底发生了什么。

为了让你更容易理解,我们可以把大脑想象成一个繁忙的侦探事务所,而这篇论文就是关于这个事务所里两个主要部门是如何工作的。

1. 核心问题:我们是怎么看懂“戏”的?

想象你在看一部只有两个小方块在屏幕上跑来跑去的动画。虽然它们没有脸,但你一眼就能看出:

  • 它们是在打架(敌对)?
  • 它们是在玩耍(友好)?
  • 还是它们互不理睬(中立)?

这种能力是人类的天赋。以前,科学家认为大脑里有两个不同的部门分工合作:

  • 部门 A(后颞上沟,pSTS): 像是一个**“快速摄像机”**。它只负责看动作:谁碰了谁?谁追谁?它只处理眼前的画面,不做深层思考。
  • 部门 B(颞顶联合区,TPJ): 像是一个**“心理分析师”**。它负责猜心思:那个方块为什么要追另一个?它是不是想恶作剧?它在做“逆向规划”,试图推断背后的动机。

以前的假设是: 这两个部门是流水线关系。先由“摄像机”拍下来,再传给“心理分析师”去分析。

2. 这次研究做了什么?

研究者 Manasi Malik 和她的团队决定用两个超级计算机模型来测试这个假设,看看大脑到底是不是这样工作的。

  • 模型 1(SocialGNN): 这是一个**“视觉关系网”。它不看心理,只看物体之间的位置、速度和接触。就像你只看两个方块怎么动,就能猜出它们在干嘛。这代表了“自下而上”**的感知。
  • 模型 2(SIMPLE): 这是一个**“心理模拟机”。它会像侦探一样,在脑子里模拟:“如果那个方块想拿那个红色的球,它应该走哪条路?”然后拿模拟结果和实际看到的画面做对比。这代表了“生成式逆向规划”**(也就是猜心思)。

他们让 25 个人在 MRI 机器里看这些动画,同时记录大脑活动,然后看看大脑的反应更像哪个模型。

3. 惊人的发现:大脑不是“流水线”,而是“双核处理器”

研究者原本以为会看到:

  • “摄像机”部门(pSTS)只跟模型 1(视觉)匹配。
  • “心理分析师”部门(TPJ)只跟模型 2(猜心思)匹配。

但结果完全出乎意料!

  • 两个部门都在“双管齐下”: 无论是负责看动作的 pSTS,还是负责猜心思的 TPJ,它们同时对“视觉关系网”和“心理模拟机”都有反应。
  • 比喻: 这就像你走进一家餐厅,原本以为前台只负责点菜,后厨只负责做饭。结果发现,前台和后厨都在同时做点菜和做饭的事! 两个部门都在同时处理“看到了什么”和“为什么这么做”。

4. 真正的区别:不是“谁做”,而是“何时做”

既然两个部门都在做同样的事,那它们有什么区别呢?

研究发现,区别在于时间节奏

  • 早期(前几秒): 大脑主要被“视觉关系网”(模型 1)主导。就像你刚看到两个方块冲撞,你的第一反应是“它们在打架”。
  • 后期(几秒后): 大脑逐渐转向“心理模拟机”(模型 2)。就像你开始思考:“等等,那个方块是不是故意撞的?它是不是在玩游戏?”

比喻: 这就像看一场足球赛。

  • 刚开始,你看到的是球员在跑动、传球(视觉/自下而上)。
  • 过了一会儿,你开始理解战术意图:“哦,那个前锋故意假摔是为了骗裁判”(心理/自上而下)。
  • 这篇论文告诉我们,你的大脑里负责“看球”和“懂球”的两个区域,其实都在同时工作,只是懂球的那个信号来得稍微晚一点点。

5. 总结:这对我们意味着什么?

  • 打破旧观念: 我们不需要把大脑切成“只看表面”和“只看内心”的两块。大脑的社交区域是混合体,它们既看动作,也猜心思。
  • 时间差是关键: 社交理解是一个动态过程。我们先快速捕捉动作,然后慢慢构建出对方的意图。
  • 未来的方向: 既然知道了大脑是这样工作的,未来的 AI 和机器人如果想真正理解人类,就不能只学“看”,也不能只学“猜”,而需要像人类大脑一样,把视觉感知心理推理结合起来,并且要有时间上的先后顺序

一句话总结:
我们的大脑在理解社交时,不像是一个简单的“先看图、再猜心”的流水线,而更像是一个双核处理器:两个核心都在同时处理视觉和心理信息,只是“猜心思”的信号比“看动作”的信号稍微慢半拍,从而让我们能迅速从“看到什么”进化到“理解为什么”。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →