cs.LG 篇论文 | Gist.Science

Emergence of Distortions in High-Dimensional Guided Diffusion Models

该论文通过统计物理和动力学平均场分析，揭示了高维条件下无分类器引导（CFG）导致生成多样性的丧失源于一种相变，并据此提出了一种引入负引导窗口的理论驱动调度方案，以在保持类别可分性的同时缓解方差收缩问题。

Enrico Ventura, Beatrice Achilli, Luca Ambrogioni, Carlo Lucibello2026-03-12📊 stat

Hallucination is a Consequence of Space-Optimality: A Rate-Distortion Theorem for Membership Testing

该论文通过建立将事实记忆形式化为成员测试问题的率失真定理，从信息论角度证明在容量受限下，即使拥有完美数据，大语言模型为了追求最优记忆效率而不得不将高置信度赋予非事实，从而揭示了幻觉是空间最优性导致的必然结果。

Anxin Guo, Jingwei Li2026-03-12💬 cs.CL

Grounding Generated Videos in Feasible Plans via World Models

该论文提出了 GVP-WM 方法，通过利用学习到的动作条件世界模型，将违反物理约束的视频生成计划投影至动态可行的潜在轨迹流形上，从而在导航和操纵任务中生成可执行的长程规划。

Christos Ziakas, Amir Bar, Alessandra Russo2026-03-12🤖 cs.LG

Expert-Data Alignment Governs Generation Quality in Decentralized Diffusion Models

该论文通过系统研究首次揭示，在去中心化扩散模型中，生成质量并非由去噪轨迹的数值稳定性决定，而是取决于路由机制能否将当前去噪状态精准匹配至训练分布覆盖该状态的专家，从而打破了“稳定性即高质量”的固有认知。

Marcos Villagra, Bidhan Roy, Raihan Seraj, Zhiying Jiang2026-03-12🤖 cs.LG

A Bandit-Based Approach to Educational Recommender Systems: Contextual Thompson Sampling for Learner Skill Gain Optimization

该论文提出了一种基于上下文汤普森采样的个性化练习推荐方法，利用学习者数据动态选择最能提升技能水平的题目，从而在大规模在线教育环境中实现高效的学习增益优化。

Lukas De Kerpel, Arthur Thuy, Dries F. Benoit2026-03-12📊 stat

Universality of General Spiked Tensor Models

该论文证明了在噪声仅具有有限四阶矩而非高斯分布的假设下，非对称秩一张量模型的最大似然估计量在渐近谱分布、奇异值及模式对齐等方面仍表现出与高斯情形一致的普适性。

Yanjin Xiang, Zhihua Zhang2026-03-12📊 stat

BLITZRANK: Principled Zero-shot Ranking Agents with Tournament Graphs

本文提出了一种基于锦标赛图的零样本排序代理框架，通过利用 $k$ 元比较隐含的成对偏好信息并计算传递闭包，在显著减少 Token 消耗的同时实现了比现有方法更优的 LLM 重排序精度与效率。

Sheshansh Agrawal, Thien Hang Nguyen, Douwe Kiela2026-03-12🤖 cs.LG

Long Chain-of-Thought Compression via Fine-Grained Group Policy Optimization

本文提出了细粒度组策略优化（FGO）算法，通过细分组响应并基于长度和熵分配权重，在有效压缩大语言模型冗长思维链的同时解决了 GRPO 算法数据利用率低和熵崩溃的问题，实现了在不降低性能的前提下提升推理效率。

Xinchen Han, Hossam Afifi, Michel Marot, Xilu Wang, Lu Yin2026-03-12🤖 cs.LG

GOT-JEPA: Generic Object Tracking with Model Adaptation and Occlusion Handling using Joint-Embedding Predictive Architecture

本文提出了 GOT-JEPA 框架，通过联合嵌入预测架构将模型预测预训练从图像特征扩展至跟踪模型本身，并辅以 OccuSolver 模块进行细粒度的遮挡感知与状态优化，从而显著提升了通用目标跟踪器在动态复杂场景下的泛化能力与鲁棒性。

Shih-Fang Chen, Jun-Cheng Chen, I-Hong Jhuo, Yen-Yu Lin2026-03-12🤖 cs.AI

LexiSafe: Offline Safe Reinforcement Learning with Lexicographic Safety-Reward Hierarchy

本文提出了名为 LexiSafe 的离线安全强化学习框架，通过引入词典式安全 - 奖励层级结构及单/多成本变体，在理论上保证了样本复杂度与安全性界限，并在实践中有效降低了安全违规风险并提升了任务性能。

Hsin-Jung Yang, Zhanhong Jiang, Prajwal Koirala, Qisai Liu, Cody Fleming, Soumik Sarkar2026-03-12⚡ eess

ZACH-ViT: Regime-Dependent Inductive Bias in Compact Vision Transformers for Medical Imaging

该论文提出了 ZACH-ViT，一种移除位置编码和 [CLS] 标记的紧凑 Vision Transformer 架构，通过全局平均池化实现置换不变性，在医学影像的小样本场景下证明了根据数据空间结构特性调整归纳偏置（即在不同数据分布下表现出差异化的性能优势）比追求通用基准主导更为重要。

Athanasios Angelakis2026-03-12⚡ eess

Benchmarking Graph Neural Networks in Solving Hard Constraint Satisfaction Problems

该论文从统计物理角度提出了基于随机问题的硬约束满足问题新基准，并通过公平对比证明在解决此类难题时，经典启发式算法的表现仍优于图神经网络。

Geri Skenderi, Lorenzo Buffoni, Francesco D'Amico, David Machado, Raffaele Marino, Matteo Negri, Federico Ricci-Tersenghi, Carlo Lucibello, Maria Chiara Angelini2026-03-12🔬 cond-mat

Many AI Analysts, One Dataset: Navigating the Agentic Data Science Multiverse

该研究提出利用基于大语言模型的全自动 AI 分析师在大规模、低成本地复现人类多分析师研究中的分析多样性，揭示了不同 AI 代理对同一数据集的分析结果存在显著差异且可被引导，从而论证了 AI 自动化实证科学中证据易受选择性报告影响的挑战，并呼吁建立包含“多元宇宙”式报告及提示词完全披露的新透明度规范。

Martin Bertran, Riccardo Fogliato, Zhiwei Steven Wu2026-03-12🤖 cs.AI

Active Value Querying to Minimize Additive Error in Subadditive Set Function Learning

该论文针对次加性集合函数学习中因缺失值导致的歧义问题，通过研究最小与最大补全的距离分析，提出了一种主动查询策略以在离线和在线模式下最小化加性误差，从而高效逼近未知的次加性函数。

Martin Černý, David Sychrovský, Filip Úradník, Jakub Černý2026-03-12🤖 cs.LG

How Large Language Models Get Stuck: Early structure with persistent errors

该论文通过训练 OPT 模型并评估其在 BLiMP 基准上的表现，发现模型在部分语法类别中会因早期训练阶段形成的错误统计偏差而陷入难以纠正的“错误固化”状态，并据此提出了旨在解释这一现象的“双词假设”（Bigram Hypothesis）。

Alokesh Manna, William Snyder, Whitney Tabor2026-03-12💬 cs.CL

CARE: Towards Clinical Accountability in Multi-Modal Medical Reasoning with an Evidence-Grounded Agentic Framework

该论文提出了 CARE 框架，通过解耦视觉定位与推理模块、引入专家级证据生成及强化学习优化，构建了一个模拟临床工作流的智能体系统，从而显著提升了多模态医疗推理的准确性与临床可问责性。

Yuexi Du, Jinglu Wang, Shujie Liu, Nicha C. Dvornek, Yan Lu2026-03-12🤖 cs.AI

CFG-Ctrl: Control-Based Classifier-Free Diffusion Guidance

该论文提出了名为 CFG-Ctrl 的统一框架，将 Classifier-Free Guidance 重新诠释为生成流中的控制机制，并进一步设计了基于滑模控制（SMC-CFG）的非线性反馈方法，通过引入切换控制项和 Lyapunov 稳定性分析，有效解决了传统线性控制在大引导尺度下的不稳定与过冲问题，显著提升了文本到图像生成模型的语义对齐能力与鲁棒性。

Hanyang Wang, Yiyang Liu, Jiawei Chi, Fangfu Liu, Ran Xue, Yueqi Duan2026-03-12🤖 cs.LG

One Model, Many Skills: Parameter-Efficient Fine-Tuning for Multitask Code Analysis

该论文首次系统评估了代码分析领域的多任务参数高效微调（PEFT），发现共享 PEFT 模块不仅能以极低的计算和存储成本实现媲美单任务微调的精度，且显著优于通用大模型的直接提示，同时揭示了任务稳定性、互补性及数据质量等关键因素对多任务协同微调效果的决定性影响。

Amal Akli, Maxime Cordy, Mike Papadakis, Yves Le Traon2026-03-12💻 cs

Explainable LLM Unlearning Through Reasoning

该论文提出了一种名为“目标推理遗忘”（TRU）的新方法，通过引入基于推理的遗忘目标并结合监督损失与梯度上升损失，在实现大语言模型精准、可解释的知识移除的同时，有效保留了模型的通用能力并增强了其鲁棒性。

Junfeng Liao, Qizhou Wang, Shanshan Ye, Xin Yu, Ling Chen, Zhen Fang2026-03-12🤖 cs.LG

MoE-SpAc: Efficient MoE Inference Based on Speculative Activation Utility in Heterogeneous Edge Scenarios

本文提出了 MoE-SpAc 框架，通过将推测解码重构为内存管理的“信息前瞻传感器”，结合专家需求估计、异构负载均衡及异步执行引擎，有效解决了边缘设备上的 MoE 模型推理内存瓶颈，显著提升了吞吐量与推理速度。

Shuhuai Li, Jianghao Lin, Dongdong Ge, Yinyu Ye2026-03-12🤖 cs.LG