From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

该论文提出了一种利用预训练视觉 - 语言模型(VLM)从少量演示中学习抽象符号世界模型的方法,通过自动构建和筛选谓词,使机器人能够在未见过的复杂场景中实现零样本泛化,从而解决长视野的决策规划问题。

Ashay Athalye, Nishanth Kumar, Tom Silver, Yichao Liang, Jiuguang Wang, Tomás Lozano-Pérez, Leslie Pack Kaelbling2026-03-10🤖 cs.LG

Quantifying Information Loss under Coarse-Grained Partitions: A Discrete Framework for Explainable Artificial Intelligence

本文提出了一种基于粗粒度划分(CGPs)的离散框架,通过引入范畴统一(CU)和基于 KL 散度的信息损失度量 DKL-CUD_{\mathrm{KL\text{-}CU}},为可解释人工智能中准确性与可解释性之间的权衡提供了数学形式化分析,并揭示了零信息损失在常规评估实践中是极罕见的极限情况。

Takashi Izumo2026-03-10🤖 cs.AI

Language in the Flow of Time: Time-Series-Paired Texts Weaved into a Unified Temporal Narrative

该论文提出了名为“文本即时间序列”(TaTS)的新框架,通过将具有周期性特征的配对文本视为时间序列的辅助变量,使现有纯数值时间序列模型无需修改架构即可有效处理多模态数据,从而显著提升预测和插补任务的性能。

Zihao Li, Xiao Lin, Zhining Liu, Jiaru Zou, Ziwei Wu, Lecheng Zheng, Dongqi Fu, Yada Zhu, Hendrik Hamann, Hanghang Tong, Jingrui He2026-03-10🤖 cs.LG

Deep Learning-Based Approach for Automatic 2D and 3D MRI Segmentation of Gliomas

该研究提出了一种基于 U-Net、Inception 和 ResNet 架构的深度学习混合模型,旨在平衡 2D 与 3D 卷积在计算效率与空间精度间的权衡,通过在 BraTS 数据集上的实验验证,该模型在 3D 和 2D 胶质瘤分割任务中分别实现了 98.91% 和 99.77% 的高准确率,为临床脑肿瘤自动诊断提供了有效解决方案。

Kiranmayee Janardhan, Christy Bobby T2026-03-10💻 cs

Parallelized Planning-Acting for Efficient LLM-based Multi-Agent Systems in Minecraft

本文针对现有基于大语言模型的多智能体系统在动态环境(如 Minecraft)中因串行执行导致的响应延迟问题,提出了一种具备可中断执行能力的双线程并行规划 - 行动框架,通过中央记忆系统同步规划线程与技能库驱动的递归执行线程,显著提升了系统的实时响应与适应能力。

Yaoru Li, Shunyu Liu, Tongya Zheng, Li Sun, Mingli Song2026-03-10💻 cs