cs 篇论文 | Gist.Science

Efficient Trajectory Optimization for Autonomous Racing via Formula-1 Data-Driven Initialization

该论文提出了一种基于真实一级方程式遥测数据的学习型初始化策略，通过利用神经网络根据局部赛道几何特征预测专家级赛车线，显著提升了自动驾驶赛车轨迹优化求解器的收敛速度与运行效率，同时保持了最优单圈成绩。

Samir Shehadeh, Lukas Kutsch, Nils Dengler, Sicong Pan, Maren Bennewitz2026-03-10💻 cs

Toward Multimodal Industrial Fault Analysis: A Single-Speed Chain Conveyor Dataset with Audio and Vibration Signals

本文介绍了一个包含音频和振动多模态信号的单速链式输送机工业故障数据集，旨在通过标准化评估协议和基线模型，支持复杂工况下的系统级故障检测与多模态融合研究。

Zhang Chen, Yucong Zhang, Xiaoxiao Miao, Ming Li2026-03-10💻 cs

Deep Expert Injection for Anchoring Retinal VLMs with Domain-Specific Knowledge

本文提出了 EyExIn 框架，通过专家感知双流编码、语义自适应门控融合及自适应深度专家注入机制，有效解决了视网膜视觉语言模型在细粒度病理感知和推理过程中因语言先验主导而产生的幻觉问题，显著提升了眼科视觉问答的精度与可信度。

Shuai Lu, Meng Wang, Jia Guo, Jiawei Du, Bo Liu, Shengzhu Yang, Weihang Zhang, Huazhu Fu, Huiqi Li2026-03-10💻 cs

More Than 1v1: Human-AI Alignment in Early Developmental Communities with Multimodal LLMs

该论文通过一项涉及家庭与言语治疗师的三项研究，探讨了多模态大语言模型在儿童早期发展社区中的应用，提出应将人机对齐视为一个由专家结构、专业中介和家庭适应性共同构成的社区治理过程，而非单纯的个人优化问题。

Weiyan Shi, Kenny Tsu Wei Choo2026-03-10💻 cs

The Model Knows Which Tokens Matter: Automatic Token Selection via Noise Gating

该论文提出了 AutoSelect 方法，通过将视觉 Token 剪枝重构为容量受限的通信问题，利用噪声门控机制在无需辅助目标的情况下自动筛选关键 Token，从而在显著降低推理成本的同时保持了视觉语言模型的高精度。

Landi He, Xiaoyu Yang, Lijian Xu2026-03-10💻 cs

DexKnot: Generalizable Visuomotor Policy Learning for Dexterous Bag-Knotting Manipulation

本文提出了名为 DexKnot 的框架，通过结合关键点仿射性与扩散策略，利用从真实世界手动变形数据中学习到的形状无关表征，实现了机器人对未见过的塑料袋实例及形变进行泛化且可靠的打结操作。

Jiayuan Zhang, Ruihai Wu, Haojun Chen, Yuran Wang, Yifan Zhong, Ceyao Zhang, Yaodong Yang, Yuanpei Chen2026-03-10💻 cs

Model-based thermal drift compensation for high-precision hexapod robot actuators

本文提出了一种基于理论建模与实验校准的模型驱动方法，通过关联特定点温度与致动器膨胀状态，成功将六足机器人精密机电致动器的热漂移减少了 80% 以上。

Clément Robert, Alain Vissiere, Olivier Company, Pierre Noire, Thierry Roux, Sébastien Krut2026-03-10💻 cs

PDD: Manifold-Prior Diverse Distillation for Medical Anomaly Detection

本文提出了 PDD 框架，通过结合 VMamba 与 Wide-ResNet 的双教师先验、流形匹配统一模块及多样化蒸馏策略，有效解决了医学图像中细微异质异常检测的难题，并在多个数据集上取得了显著优于现有最先进方法的性能。

Xijun Lu, Hongying Liu, Fanhua Shang, Yanming Hui, Liang Wan2026-03-10💻 cs

Tutorial on Aided Inertial Navigation Systems: A Modern Treatment Using Lie-Group Theoretical Methods

这篇教程以扩展特殊欧几里得群 SE₂(3) 的李群理论为基础，系统介绍了面向控制的辅助惯性导航系统，通过明确不变性与对称性的作用，构建了融合惯性测量与辅助信息的几何框架，并探讨了高阶状态表示、同步观测器设计及等变滤波等现代扩展方法。

Soulaimane Berkane2026-03-10💻 cs

CanoVerse: 3D Object Scalable Canonicalization and Dataset for Generation and Pose

该论文提出了名为 CanoVerse 的包含 32 万个 3D 对象的超大规模标准化数据集及高效对齐框架，通过解决 3D 资产的方向歧义问题，显著提升了 3D 生成稳定性、跨模态检索精度及零样本点云姿态估计能力。

Li Jin, Yuchen Yang, Weikai Chen, Yujie Wang, Dehao Hao, Tanghui Jia, Yingda Yin, Zeyu Hu, Runze Zhang, Keyang Luo, Li Yuan, Long Quan, Xin Wang, Xueying Qin2026-03-10💻 cs

LiveWorld: Simulating Out-of-Sight Dynamics in Generative Video World Models

该论文针对现有生成式视频世界模型无法模拟“视线外”动态演化的问题，提出了名为 LiveWorld 的新框架，通过引入持久化全局状态和基于监控的机制，实现了物体在未被观测时仍能持续演化并在重访时保持时空一致性的 4D 动态世界模拟。

Zicheng Duan, Jiatong Xia, Zeyu Zhang, Wenbo Zhang, Gengze Zhou, Chenhui Gou, Yefei He, Feng Chen, Xinyu Zhang, Lingqiao Liu2026-03-10💻 cs

Transition State Theory for Network Dynamics

该论文提出了一种结合结构变迁路径与动态网络建模的过渡态理论框架，旨在刻画并预测网络结构变化，并证明在有限假设下可利用横截面模型近似预测小群体派系重组等过程。

Carter T. Butts2026-03-10💻 cs

NarrativeLoom: Enhancing Creative Storytelling through Multi-Persona Collaborative Improvisation

本文提出了基于坎贝尔“盲变与选择性保留”理论的多角色协作系统 NarrativeLoom，通过让 AI 生成多样化叙事选项并由用户筛选，显著提升了合作创作故事在专家评估中的流畅性、灵活性、原创性和精致度等创造力维度，且该系统对写作新手尤为有益。

Yuxi Ma, Yongqian Peng, Fengyuan Yang, Siyu Zha, Chi Zhang, Zixia Jia, Zilong Zheng, Yixin Zhu2026-03-10💻 cs

Improving reasoning at inference time via uncertainty minimisation

该论文提出了一种在推理阶段通过最大化模型内部“自我确定性”来最小化不确定性的新方法，该方法在思维层面而非词元层面进行选择，以少量采样显著提升了大语言模型在数学推理任务中的表现，并揭示了早期推理步骤的确定性对最终准确性的关键预测作用。

Nicolas Legrand, Kenneth Enevoldsen, Márton Kardos, Kristoffer Nielbo2026-03-10💻 cs

PromptGate Client Adaptive Vision Language Gating for Open Set Federated Active Learning

本文提出了 PromptGate，一种针对开放集联邦主动学习的动态视觉语言模型门控框架，通过联邦类特定上下文优化在保护隐私的同时自适应本地临床领域，有效过滤分布外噪声并显著提升标注数据纯度。

Adea Nesturi, David Dueñas Gaviria, Jiajun Zeng, Shadi Albarqouni2026-03-10💻 cs

RoTri-Diff: A Spatial Robot-Object Triadic Interaction-Guided Diffusion Model for Bimanual Manipulation

本文提出了 RoTri-Diff，一种通过显式建模机器人 - 物体三角交互（RoTri）几何约束并结合分层扩散过程，以解决双臂协作中碰撞与不稳定问题、显著提升双臂操作性能的模仿学习框架。

Zixuan Chen, Nga Teng Chan, Yiwen Hou, Chenrui Tie, Zixuan Liu, Haonan Chen, Junting Chen, Jieqi Shi, Yang Gao, Jing Huo, Lin Shao2026-03-10💻 cs

ACD-U: Asymmetric co-teaching with machine unlearning for robust learning with noisy labels

该论文提出了一种名为 ACD-U 的框架，通过结合非对称协同教学（利用预训练 CLIP Vision Transformer 与 CNN 的互补特性）和基于损失轨迹及 CLIP 一致性检查的机器遗忘机制，实现了从被动避免错误到主动修正错误的范式转变，从而在含噪标签数据上取得了最先进的鲁棒性表现。

Reo Fukunaga, Soh Yoshida, Mitsuji Muneyasu2026-03-10💻 cs

Class Visualizations and Activation Atlases for Enhancing Interpretability in Deep Learning-Based Computational Pathology

该研究提出了一种可视化框架，系统评估了基于 Transformer 的计算病理学模型中的类别可视化与激活图谱，揭示了模型在不同标签粒度下对组织形态学概念的学习结构，并证实了这些可视化方法在反映专家共识与内在病理复杂性方面的有效性。

Marco Gustav, Fabian Wolf, Christina Glasner, Nic G. Reitsam, Stefan Schulz, Kira Aschenbroich, Bruno Märkl, Sebastian Foersch, Jakob Nikolas Kather2026-03-10💻 cs

Learning to Rank the Initial Branching Order of SAT Solvers

该论文提出了一种利用图神经网络预测 SAT 求解器初始分支顺序的预处理方法，在随机 3-CNF 和伪工业基准测试中显著提升了求解速度并展现出良好的泛化能力，但在更复杂的工业实例上因求解器动态启发式策略的覆盖及实例复杂性而效果有限。

Arvid Eriksson (KTH Royal Institute of Technology), Gabriel Poesia (Kempner Institute at Harvard University), Roman Bresson (Mohamed Bin Zayed University of Artificial Intelligence), Karl Henrik Johansson (KTH Royal Institute of Technology), David Broman (KTH Royal Institute of Technology)2026-03-10💻 cs

Retrieving Minimal and Sufficient Reasoning Subgraphs with Graph Foundation Models for Path-aware GraphRAG

该论文提出了 GFM-Retriever，一种利用预训练图基础模型进行跨域检索并结合信息瓶颈原理筛选最小充分子图的框架，旨在解决 GraphRAG 在冷启动场景下的检索冗余与不完整问题，从而实现高效且可解释的多跳推理。

Haonan Yuan, Qingyun Sun, Junhua Shi, Mingjun Liu, Jiaqi Yuan, Ziwei Zhang, Xingcheng Fu, Jianxin Li2026-03-10💻 cs