cs 篇论文 | Gist.Science

PDD: Manifold-Prior Diverse Distillation for Medical Anomaly Detection

本文提出了 PDD 框架，通过结合 VMamba 与 Wide-ResNet 的双教师先验、流形匹配统一模块及多样化蒸馏策略，有效解决了医学图像中细微异质异常检测的难题，并在多个数据集上取得了显著优于现有最先进方法的性能。

Xijun Lu, Hongying Liu, Fanhua Shang, Yanming Hui, Liang Wan2026-03-10💻 cs

Tutorial on Aided Inertial Navigation Systems: A Modern Treatment Using Lie-Group Theoretical Methods

这篇教程以扩展特殊欧几里得群 SE₂(3) 的李群理论为基础，系统介绍了面向控制的辅助惯性导航系统，通过明确不变性与对称性的作用，构建了融合惯性测量与辅助信息的几何框架，并探讨了高阶状态表示、同步观测器设计及等变滤波等现代扩展方法。

Soulaimane Berkane2026-03-10💻 cs

CanoVerse: 3D Object Scalable Canonicalization and Dataset for Generation and Pose

该论文提出了名为 CanoVerse 的包含 32 万个 3D 对象的超大规模标准化数据集及高效对齐框架，通过解决 3D 资产的方向歧义问题，显著提升了 3D 生成稳定性、跨模态检索精度及零样本点云姿态估计能力。

Li Jin, Yuchen Yang, Weikai Chen, Yujie Wang, Dehao Hao, Tanghui Jia, Yingda Yin, Zeyu Hu, Runze Zhang, Keyang Luo, Li Yuan, Long Quan, Xin Wang, Xueying Qin2026-03-10💻 cs

LiveWorld: Simulating Out-of-Sight Dynamics in Generative Video World Models

该论文针对现有生成式视频世界模型无法模拟“视线外”动态演化的问题，提出了名为 LiveWorld 的新框架，通过引入持久化全局状态和基于监控的机制，实现了物体在未被观测时仍能持续演化并在重访时保持时空一致性的 4D 动态世界模拟。

Zicheng Duan, Jiatong Xia, Zeyu Zhang, Wenbo Zhang, Gengze Zhou, Chenhui Gou, Yefei He, Feng Chen, Xinyu Zhang, Lingqiao Liu2026-03-10💻 cs

Transition State Theory for Network Dynamics

该论文提出了一种结合结构变迁路径与动态网络建模的过渡态理论框架，旨在刻画并预测网络结构变化，并证明在有限假设下可利用横截面模型近似预测小群体派系重组等过程。

Carter T. Butts2026-03-10💻 cs

NarrativeLoom: Enhancing Creative Storytelling through Multi-Persona Collaborative Improvisation

本文提出了基于坎贝尔“盲变与选择性保留”理论的多角色协作系统 NarrativeLoom，通过让 AI 生成多样化叙事选项并由用户筛选，显著提升了合作创作故事在专家评估中的流畅性、灵活性、原创性和精致度等创造力维度，且该系统对写作新手尤为有益。

Yuxi Ma, Yongqian Peng, Fengyuan Yang, Siyu Zha, Chi Zhang, Zixia Jia, Zilong Zheng, Yixin Zhu2026-03-10💻 cs

Improving reasoning at inference time via uncertainty minimisation

该论文提出了一种在推理阶段通过最大化模型内部“自我确定性”来最小化不确定性的新方法，该方法在思维层面而非词元层面进行选择，以少量采样显著提升了大语言模型在数学推理任务中的表现，并揭示了早期推理步骤的确定性对最终准确性的关键预测作用。

Nicolas Legrand, Kenneth Enevoldsen, Márton Kardos, Kristoffer Nielbo2026-03-10💻 cs

PromptGate Client Adaptive Vision Language Gating for Open Set Federated Active Learning

本文提出了 PromptGate，一种针对开放集联邦主动学习的动态视觉语言模型门控框架，通过联邦类特定上下文优化在保护隐私的同时自适应本地临床领域，有效过滤分布外噪声并显著提升标注数据纯度。

Adea Nesturi, David Dueñas Gaviria, Jiajun Zeng, Shadi Albarqouni2026-03-10💻 cs

RoTri-Diff: A Spatial Robot-Object Triadic Interaction-Guided Diffusion Model for Bimanual Manipulation

本文提出了 RoTri-Diff，一种通过显式建模机器人 - 物体三角交互（RoTri）几何约束并结合分层扩散过程，以解决双臂协作中碰撞与不稳定问题、显著提升双臂操作性能的模仿学习框架。

Zixuan Chen, Nga Teng Chan, Yiwen Hou, Chenrui Tie, Zixuan Liu, Haonan Chen, Junting Chen, Jieqi Shi, Yang Gao, Jing Huo, Lin Shao2026-03-10💻 cs

ACD-U: Asymmetric co-teaching with machine unlearning for robust learning with noisy labels

该论文提出了一种名为 ACD-U 的框架，通过结合非对称协同教学（利用预训练 CLIP Vision Transformer 与 CNN 的互补特性）和基于损失轨迹及 CLIP 一致性检查的机器遗忘机制，实现了从被动避免错误到主动修正错误的范式转变，从而在含噪标签数据上取得了最先进的鲁棒性表现。

Reo Fukunaga, Soh Yoshida, Mitsuji Muneyasu2026-03-10💻 cs

Class Visualizations and Activation Atlases for Enhancing Interpretability in Deep Learning-Based Computational Pathology

该研究提出了一种可视化框架，系统评估了基于 Transformer 的计算病理学模型中的类别可视化与激活图谱，揭示了模型在不同标签粒度下对组织形态学概念的学习结构，并证实了这些可视化方法在反映专家共识与内在病理复杂性方面的有效性。

Marco Gustav, Fabian Wolf, Christina Glasner, Nic G. Reitsam, Stefan Schulz, Kira Aschenbroich, Bruno Märkl, Sebastian Foersch, Jakob Nikolas Kather2026-03-10💻 cs

Learning to Rank the Initial Branching Order of SAT Solvers

该论文提出了一种利用图神经网络预测 SAT 求解器初始分支顺序的预处理方法，在随机 3-CNF 和伪工业基准测试中显著提升了求解速度并展现出良好的泛化能力，但在更复杂的工业实例上因求解器动态启发式策略的覆盖及实例复杂性而效果有限。

Arvid Eriksson (KTH Royal Institute of Technology), Gabriel Poesia (Kempner Institute at Harvard University), Roman Bresson (Mohamed Bin Zayed University of Artificial Intelligence), Karl Henrik Johansson (KTH Royal Institute of Technology), David Broman (KTH Royal Institute of Technology)2026-03-10💻 cs

cs

PDD: Manifold-Prior Diverse Distillation for Medical Anomaly Detection

Tutorial on Aided Inertial Navigation Systems: A Modern Treatment Using Lie-Group Theoretical Methods

CanoVerse: 3D Object Scalable Canonicalization and Dataset for Generation and Pose

LiveWorld: Simulating Out-of-Sight Dynamics in Generative Video World Models

Transition State Theory for Network Dynamics

NarrativeLoom: Enhancing Creative Storytelling through Multi-Persona Collaborative Improvisation

Improving reasoning at inference time via uncertainty minimisation

PromptGate Client Adaptive Vision Language Gating for Open Set Federated Active Learning

RoTri-Diff: A Spatial Robot-Object Triadic Interaction-Guided Diffusion Model for Bimanual Manipulation

ACD-U: Asymmetric co-teaching with machine unlearning for robust learning with noisy labels

Class Visualizations and Activation Atlases for Enhancing Interpretability in Deep Learning-Based Computational Pathology

Learning to Rank the Initial Branching Order of SAT Solvers

Retrieving Minimal and Sufficient Reasoning Subgraphs with Graph Foundation Models for Path-aware GraphRAG

FreeFly-Thinking : Aligning Chain-of-Thought Reasoning with Continuous UAV Navigation

From State Changes to Creative Decisions: Documenting and Interpreting Traces Across Creative Domains

Student Preferences for Online Interaction Platforms in Blended Learning: A Mixed-Methods Study

Governance Architecture for Autonomous Agent Systems: Threats, Framework, and Engineering Practice

FastSTAR: Spatiotemporal Token Pruning for Efficient Autoregressive Video Synthesis

$\textbf{Re}^{2}$ : Unlocking LLM Reasoning via Reinforcement Learning with Re-solving

Vision-Guided MPPI for Agile Drone Racing: Navigating Arbitrary Gate Poses via Neural Signed Distance Fields

cs

PDD: Manifold-Prior Diverse Distillation for Medical Anomaly Detection

Tutorial on Aided Inertial Navigation Systems: A Modern Treatment Using Lie-Group Theoretical Methods

CanoVerse: 3D Object Scalable Canonicalization and Dataset for Generation and Pose

LiveWorld: Simulating Out-of-Sight Dynamics in Generative Video World Models

Transition State Theory for Network Dynamics

NarrativeLoom: Enhancing Creative Storytelling through Multi-Persona Collaborative Improvisation

Improving reasoning at inference time via uncertainty minimisation

PromptGate Client Adaptive Vision Language Gating for Open Set Federated Active Learning

RoTri-Diff: A Spatial Robot-Object Triadic Interaction-Guided Diffusion Model for Bimanual Manipulation

ACD-U: Asymmetric co-teaching with machine unlearning for robust learning with noisy labels

Class Visualizations and Activation Atlases for Enhancing Interpretability in Deep Learning-Based Computational Pathology

Learning to Rank the Initial Branching Order of SAT Solvers

Retrieving Minimal and Sufficient Reasoning Subgraphs with Graph Foundation Models for Path-aware GraphRAG

FreeFly-Thinking : Aligning Chain-of-Thought Reasoning with Continuous UAV Navigation

From State Changes to Creative Decisions: Documenting and Interpreting Traces Across Creative Domains

Student Preferences for Online Interaction Platforms in Blended Learning: A Mixed-Methods Study

Governance Architecture for Autonomous Agent Systems: Threats, Framework, and Engineering Practice

FastSTAR: Spatiotemporal Token Pruning for Efficient Autoregressive Video Synthesis

Re2\textbf{Re}^{2}Re2: Unlocking LLM Reasoning via Reinforcement Learning with Re-solving

Vision-Guided MPPI for Agile Drone Racing: Navigating Arbitrary Gate Poses via Neural Signed Distance Fields

$\textbf{Re}^{2}$ : Unlocking LLM Reasoning via Reinforcement Learning with Re-solving