Deep Expert Injection for Anchoring Retinal VLMs with Domain-Specific Knowledge

本文提出了 EyExIn 框架,通过专家感知双流编码、语义自适应门控融合及自适应深度专家注入机制,有效解决了视网膜视觉语言模型在细粒度病理感知和推理过程中因语言先验主导而产生的幻觉问题,显著提升了眼科视觉问答的精度与可信度。

Shuai Lu, Meng Wang, Jia Guo, Jiawei Du, Bo Liu, Shengzhu Yang, Weihang Zhang, Huazhu Fu, Huiqi Li2026-03-10💻 cs

CanoVerse: 3D Object Scalable Canonicalization and Dataset for Generation and Pose

该论文提出了名为 CanoVerse 的包含 32 万个 3D 对象的超大规模标准化数据集及高效对齐框架,通过解决 3D 资产的方向歧义问题,显著提升了 3D 生成稳定性、跨模态检索精度及零样本点云姿态估计能力。

Li Jin, Yuchen Yang, Weikai Chen, Yujie Wang, Dehao Hao, Tanghui Jia, Yingda Yin, Zeyu Hu, Runze Zhang, Keyang Luo, Li Yuan, Long Quan, Xin Wang, Xueying Qin2026-03-10💻 cs

LiveWorld: Simulating Out-of-Sight Dynamics in Generative Video World Models

该论文针对现有生成式视频世界模型无法模拟“视线外”动态演化的问题,提出了名为 LiveWorld 的新框架,通过引入持久化全局状态和基于监控的机制,实现了物体在未被观测时仍能持续演化并在重访时保持时空一致性的 4D 动态世界模拟。

Zicheng Duan, Jiatong Xia, Zeyu Zhang, Wenbo Zhang, Gengze Zhou, Chenhui Gou, Yefei He, Feng Chen, Xinyu Zhang, Lingqiao Liu2026-03-10💻 cs

NarrativeLoom: Enhancing Creative Storytelling through Multi-Persona Collaborative Improvisation

本文提出了基于坎贝尔“盲变与选择性保留”理论的多角色协作系统 NarrativeLoom,通过让 AI 生成多样化叙事选项并由用户筛选,显著提升了合作创作故事在专家评估中的流畅性、灵活性、原创性和精致度等创造力维度,且该系统对写作新手尤为有益。

Yuxi Ma, Yongqian Peng, Fengyuan Yang, Siyu Zha, Chi Zhang, Zixia Jia, Zilong Zheng, Yixin Zhu2026-03-10💻 cs

Improving reasoning at inference time via uncertainty minimisation

该论文提出了一种在推理阶段通过最大化模型内部“自我确定性”来最小化不确定性的新方法,该方法在思维层面而非词元层面进行选择,以少量采样显著提升了大语言模型在数学推理任务中的表现,并揭示了早期推理步骤的确定性对最终准确性的关键预测作用。

Nicolas Legrand, Kenneth Enevoldsen, Márton Kardos, Kristoffer Nielbo2026-03-10💻 cs

ACD-U: Asymmetric co-teaching with machine unlearning for robust learning with noisy labels

该论文提出了一种名为 ACD-U 的框架,通过结合非对称协同教学(利用预训练 CLIP Vision Transformer 与 CNN 的互补特性)和基于损失轨迹及 CLIP 一致性检查的机器遗忘机制,实现了从被动避免错误到主动修正错误的范式转变,从而在含噪标签数据上取得了最先进的鲁棒性表现。

Reo Fukunaga, Soh Yoshida, Mitsuji Muneyasu2026-03-10💻 cs

Class Visualizations and Activation Atlases for Enhancing Interpretability in Deep Learning-Based Computational Pathology

该研究提出了一种可视化框架,系统评估了基于 Transformer 的计算病理学模型中的类别可视化与激活图谱,揭示了模型在不同标签粒度下对组织形态学概念的学习结构,并证实了这些可视化方法在反映专家共识与内在病理复杂性方面的有效性。

Marco Gustav, Fabian Wolf, Christina Glasner, Nic G. Reitsam, Stefan Schulz, Kira Aschenbroich, Bruno Märkl, Sebastian Foersch, Jakob Nikolas Kather2026-03-10💻 cs

Learning to Rank the Initial Branching Order of SAT Solvers

该论文提出了一种利用图神经网络预测 SAT 求解器初始分支顺序的预处理方法,在随机 3-CNF 和伪工业基准测试中显著提升了求解速度并展现出良好的泛化能力,但在更复杂的工业实例上因求解器动态启发式策略的覆盖及实例复杂性而效果有限。

Arvid Eriksson (KTH Royal Institute of Technology), Gabriel Poesia (Kempner Institute at Harvard University), Roman Bresson (Mohamed Bin Zayed University of Artificial Intelligence), Karl Henrik Johansson (KTH Royal Institute of Technology), David Broman (KTH Royal Institute of Technology)2026-03-10💻 cs

Retrieving Minimal and Sufficient Reasoning Subgraphs with Graph Foundation Models for Path-aware GraphRAG

该论文提出了 GFM-Retriever,一种利用预训练图基础模型进行跨域检索并结合信息瓶颈原理筛选最小充分子图的框架,旨在解决 GraphRAG 在冷启动场景下的检索冗余与不完整问题,从而实现高效且可解释的多跳推理。

Haonan Yuan, Qingyun Sun, Junhua Shi, Mingjun Liu, Jiaqi Yuan, Ziwei Zhang, Xingcheng Fu, Jianxin Li2026-03-10💻 cs