cs.AI 篇论文 | Gist.Science

SASG-DA: Sparse-Aware Semantic-Guided Diffusion Augmentation For Myoelectric Gesture Recognition

本文提出了一种名为 SASG-DA 的新型扩散数据增强方法，通过语义表征引导机制和稀疏感知语义采样策略，在确保肌电信号生成样本忠实性的同时提升其多样性，从而显著改善了表面肌电手势识别模型在数据稀缺场景下的过拟合问题与泛化性能。

Chen Liu, Can Han, Weishi Xu + 2 more2026-03-06💻 cs

DAP: A Discrete-token Autoregressive Planner for Autonomous Driving

本文提出了 DAP，一种基于离散 Token 的自回归自动驾驶规划器，通过联合预测鸟瞰图语义与自车轨迹并结合强化学习微调，在仅 1.6 亿参数量的紧凑预算下实现了开放环与封闭环测试中的领先性能。

Bowen Ye, Bin Zhang, Hang Zhao2026-03-06💻 cs

CCSD: Cross-Modal Compositional Self-Distillation for Robust Brain Tumor Segmentation with Missing Modalities

本文提出了一种名为 CCSD 的跨模态组合自蒸馏框架，通过共享 - 特定编码器 - 解码器架构及分层与渐进式自蒸馏策略，有效解决了多模态 MRI 脑肿瘤分割中因模态缺失导致的性能下降问题，并在各种缺失场景下实现了最先进的分割效果与泛化能力。

Dongqing Xie, Yonghuang Wu, Zisheng Ai + 4 more2026-03-06💻 cs

Revisiting Multimodal KV Cache Compression: A Frequency-Domain-Guided Outlier-KV-Aware Approach

本文提出了 FlashCache，一种通过频域分析识别并保留关键异常键值对（Outlier KVs）的多模态 KV 缓存压缩框架，在显著降低显存占用并加速推理的同时保持了模型性能。

Yaoxin Yang, Peng Ye, Xudong Tan + 4 more2026-03-06💻 cs

MambaTAD: When State-Space Models Meet Long-Range Temporal Action Detection

本文提出了 MambaTAD，一种基于状态空间模型的新型端到端单阶段时序动作检测框架，通过引入对角掩码双向状态空间模块和全局特征融合头，有效解决了长跨度动作检测中的上下文衰减与全局感知不足问题，并在多个基准测试中实现了优越性能。

Hui Lu, Yi Yu, Shijian Lu + 4 more2026-03-06💻 cs

CycleChemist: A Dual-Pronged Machine Learning Framework for Organic Photovoltaic Discovery

本文提出了名为 CycleChemist 的双管齐下机器学习框架，通过构建包含 2000 对实验数据的新数据集（OPV2D），结合预测模型（OPVC、MOE2、P3）与基于强化学习的生成模型（MatGPT），实现了有机光伏材料从性能预测到可合成分子设计的端到端发现。

Hou Hei Lam, Jiangjie Qiu, Xiuyuan Hu + 5 more2026-03-06🔬 cond-mat.mtrl-sci

Towards Trustworthy Legal AI through LLM Agents and Formal Reasoning

本文提出了 L4L 框架，通过结合角色差异化大语言模型代理与 SMT 形式化验证，将法律推理与成文法进行形式化对齐，从而在提升法律 AI 判决准确性的同时提供可审计的可靠依据。

Linze Chen, Yufan Cai, Zhe Hou + 1 more2026-03-06💻 cs

Steering Awareness: Models Can Be Trained to Detect Activation Steering

该论文通过训练模型识别激活向量注入及其具体概念，证明了激活 steering 并非不可察觉，且具备检测能力的模型反而在真实场景中更易受 steering 影响，从而揭示了当前基于 steering 的安全评估与可解释性技术存在根本性局限。

Joshua Fonseca Rivera, David Demitri Africa2026-03-06💻 cs

DPAC: Distribution-Preserving Adversarial Control for Diffusion Sampling

本文提出了分布保持对抗控制（DPAC）方法，通过将对抗梯度投影到由生成分数定义的切空间以最小化路径 KL 散度，从而在保持扩散采样攻击成功率的同时显著提升样本质量并降低 FID。

Han-Jin Lee, Han-Ju Lee, Jin-Seong Kim + 1 more2026-03-06💻 cs

Deep FlexQP: Accelerated Nonlinear Programming via Deep Unfolding

本文提出了 Deep FlexQP，这是一种基于深度展开的加速非线性规划求解器，它通过引入 $\ell_1$ 弹性松弛确保在可行与不可行约束下均能收敛，并利用结合拉格朗日乘子的归一化损失函数及 PAC-Bayes 泛化界，在轨迹优化和安全过滤等任务中显著提升了求解速度与成功率。

Alex Oshin, Rahul Vodeb Ghosh, Augustinos D. Saravanos + 1 more2026-03-06🔢 math

Guided Flow Policy: Learning from High-Value Actions in Offline Reinforcement Learning

本文提出了引导流策略（GFP），通过耦合多步流匹配策略与蒸馏单步演员，利用加权行为克隆聚焦于数据集的高价值动作，从而在多个离线强化学习基准测试中实现了最先进的性能。

Franki Nguimatsia Tiofack, Théotime Le Hellard, Fabian Schramm + 2 more2026-03-06💻 cs

Bootstrapped Mixed Rewards for RL Post-Training: Injecting Canonical Action Order

该论文提出了一种在强化学习后训练中引入混合奖励的机制，通过结合稀疏任务奖励与引导模型遵循规范求解顺序的排序奖励，在无需修改监督数据或模型架构的情况下，显著提升了 Transformer 在随机化解决方案序列上的 Zebra 谜题求解性能。

Prakhar Gupta, Vaibhav Gupta2026-03-06💻 cs

Multi-Loss Learning for Speech Emotion Recognition with Energy-Adaptive Mixup and Frame-Level Attention

该论文提出了一种融合能量自适应混合增强与帧级注意力机制的多损失学习框架，通过优化特征提取与损失函数组合，在四个主流数据集上实现了语音情感识别的先进性能。

Cong Wang, Yizhong Geng, Yuhua Wen + 7 more2026-03-06💻 cs

Sparse Attention Post-Training for Mechanistic Interpretability

该论文提出了一种简单的后训练方法，通过约束损失目标下的灵活稀疏正则化，在保持模型性能不变的前提下将注意力连接稀疏至极低水平（约 0.4%），从而显著简化了任务电路结构并提升了模型的可解释性。

Florent Draye, Anson Lei, Hsiao-Ru Pan + 2 more2026-03-06💻 cs

ClinNoteAgents: An LLM Multi-Agent System for Predicting and Interpreting Heart Failure 30-Day Readmission from Clinical Notes

本文提出了名为 ClinNoteAgents 的大语言模型多智能体框架，该框架能够将非结构化临床文本转化为结构化风险因素和医生风格的摘要，从而在无需大量人工标注和复杂训练的情况下，实现高保真度、可解释且可扩展的心力衰竭 30 天再入院风险预测。

Rongjia Zhou, Chengzhuo Li, Carl Yang + 1 more2026-03-06💻 cs

Achieving Olympia-Level Geometry Large Language Model Agent via Complexity Boosting Reinforcement Learning

本文提出了基于“复杂度提升强化学习”（CBRL）和动态记忆机制的 InternGeometry 智能体，该模型仅需极少量训练数据即可在 IMO 几何问题上超越人类金牌选手平均水平，并展现出提出新颖辅助构造的创新能力。

Haiteng Zhao, Junhao Shen, Yiming Zhang + 7 more2026-03-06💻 cs

ReFusion: A Diffusion Large Language Model with Parallel Autoregressive Decoding

本文提出了 ReFusion，一种将序列重组融入因果注意力框架的新型掩码扩散模型，通过引入槽级并行解码与自回归填充相结合的策略，在实现 KV 缓存复用和降低学习复杂度的同时，显著提升了推理速度并超越了传统自回归模型的性能。

Jia-Nan Li, Jian Guan, Wei Wu + 1 more2026-03-06💻 cs

HydroGEM: A Self Supervised Zero Shot Hybrid TCN Transformer Foundation Model for Continental Scale Streamflow Quality Control

本文提出了 HydroGEM，一种基于混合 TCN-Transformer 架构的自监督零样本基础模型，通过利用数百万条美国地质调查局（USGS）数据预训练，实现了在北美大陆尺度上对河流流量数据的高效质量控制、异常检测与重构，并展现出卓越的跨国家泛化能力。

Ijaz Ul Haq, Byung Suk Lee, Julia N. Perdrial + 1 more2026-03-06💻 cs

RePo: Language Models with Context Re-Positioning

本文提出了基于认知负荷理论的 RePo 机制，通过可微模块动态重定位上下文位置以替代固定线性索引，从而在 OLMo-2 模型上显著提升了处理噪声上下文、结构化数据及长文本任务的性能，同时保持了通用短文本任务的竞争力。

Huayang Li, Tianyu Zhao, Deng Cai + 1 more2026-03-06💻 cs

MCP-SafetyBench: A Benchmark for Safety Evaluation of Large Language Models with Real-World MCP Servers

本文提出了基于真实 MCP 服务器的 MCP-SafetyBench 基准，通过涵盖五大领域和 20 种攻击类型的统一分类法，系统评估了主流大语言模型在复杂多步推理与跨服务器协作场景下的安全风险，揭示了现有模型普遍存在漏洞且面临安全与效用权衡的严峻挑战。

Xuanjun Zong, Zhiqi Shen, Lei Wang + 2 more2026-03-06💻 cs