cs.LG 篇论文 | Gist.Science

Taking Shortcuts for Categorical VQA Using Super Neurons

该论文提出了一种名为“超级神经元”（Super Neurons）的免训练方法，通过直接探测视觉语言模型浅层中生成的标量激活值来构建分类器，从而在显著提升分类性能的同时实现高达 5.10 倍的推理加速。

Pierre Musacchio, Jaeyi Jeong, Dahun Kim, Jaesik Park2026-03-12🤖 cs.AI

AI-Enhanced Spatial Cellular Traffic Demand Prediction with Contextual Clustering and Error Correction for 5G/6G Planning

本文提出了一种结合上下文感知两阶段划分策略与残差空间误差校正的 AI 框架，通过解决空间自相关导致的泄漏问题，显著提升了 5G/6G 网络规划中细粒度蜂窝流量需求预测的准确性与泛化能力。

Mohamad Alkadamani, Colin Brown, Halim Yanikomeroglu2026-03-12⚡ eess

Towards Intelligent Spectrum Management: Spectrum Demand Estimation Using Graph Neural Networks

该论文提出了一种基于图注意力网络（HR-GAT）的层级多分辨率模型，利用公开部署数据在细粒度空间尺度上准确估算频谱需求，从而有效降低空间自相关并提升泛化能力，为频谱共享与分配决策提供了可靠支持。

Mohamad Alkadamani, Amir Ghasemi, Halim Yanikomeroglu2026-03-12⚡ eess

Protein Counterfactuals via Diffusion-Guided Latent Optimization

该论文提出了名为 MCCOP 的框架，通过在预训练扩散模型引导的连续潜在空间中进行流形约束优化，生成兼具生物合理性、最小突变数且能实现目标属性（如稳定性或活性）的蛋白质序列反事实，从而为蛋白质工程提供可解释的机制洞察和具体的设计指导。

Weronika Kłos, Sidney Bender, Lukas Kades2026-03-12🤖 cs.LG

Evaluating randomized smoothing as a defense against adversarial attacks in trajectory prediction

该论文提出并评估了一种基于随机平滑的防御机制，证明其能在不牺牲正常场景下预测精度的前提下，有效且低成本地提升多种轨迹预测模型在自动驾驶场景中对对抗攻击的鲁棒性。

Julian F. Schumann, Eduardo Figueiredo, Frederik Baymler Mathiesen, Luca Laurenti, Jens Kober, Arkady Zgonnikov2026-03-12🤖 cs.LG

ReTabSyn: Realistic Tabular Data Synthesis via Reinforcement Learning

ReTabSyn 是一种基于强化学习的表格数据合成框架，它通过优化条件分布 $P(y\mid \bm{X})$ 而非全联合分布，在小样本、类别不平衡及分布偏移等场景下显著提升了合成数据的下游任务效用。

Xiaofeng Lin, Seungbae Kim, Zhuoya Li, Zachary DeSoto, Charles Fleming, Guang Cheng2026-03-12📊 stat

Towards Cold-Start Drafting and Continual Refining: A Value-Driven Memory Approach with Application to NPU Kernel Synthesis

针对数据稀缺的 NPU 内核合成领域，本文提出了名为 EvoKernel 的自进化智能体框架，通过基于价值的记忆检索机制实现从冷启动草稿到持续优化的自动化流程，显著提升了大模型在特定硬件生态中的代码正确率与执行效率。

Yujie Zheng, Zhuo Li, Shengtao Zhang, Hanjing Wang, Junjie Sheng, Jiaqian Wang, Junchi Yan, Weinan Zhang, Ying Wen, Bo Tang, Muning Wen2026-03-12🤖 cs.LG

$V_{0.5}$ : Generalist Value Model as a Prior for Sparse RL Rollouts

本文提出了 $V_{0.5}$ 模型，通过实时统计检验动态融合通用价值模型先验与稀疏采样经验均值，在极低方差下构建鲁棒优势基线，从而在数学推理任务中显著超越 GRPO 和 DAPO 并实现更快的收敛。

Yi-Kai Zhang, Yueqing Sun, Hongyan Hao, Qi Gu, Xunliang Cai, De-Chuan Zhan, Han-Jia Ye2026-03-12🤖 cs.LG

6ABOS: An Open-Source Atmospheric Correction Framework for the EnMAP Hyperspectral Mission Based on 6S

本文介绍了一个名为 6ABOS 的开源 Python 框架，该框架基于 6S 辐射传输模型并结合 Google Earth Engine 动态大气参数检索，实现了 EnMAP 高光谱影像的自动化大气校正，并在不同营养状态的地表水体中验证了其高精度反演水体离水反射率的能力。

Gabriel Caballero Cañas, Bárbara Alvado Arranz, Xavier Sòria-Perpinyà, Antonio Ruiz-Verdú, Jesús Delegido, José Moreno2026-03-12🤖 cs.LG

SNPgen: Phenotype-Supervised Genotype Representation and Synthetic Data Generation via Latent Diffusion

该论文提出了 SNPgen，一种基于潜在扩散模型的两阶段条件生成框架，能够生成与表型对齐的合成基因型数据，在保护隐私的同时实现了与真实数据相当的疾病预测性能，并有效保留了遗传结构特征。

Andrea Lampis, Michela Carlotta Massi, Nicola Pirastu, Francesca Ieva, Matteo Matteucci, Emanuele Di Angelantonio2026-03-12🧬 q-bio

LAtte: Hyperbolic Lorentz Attention for Cross-Subject EEG Classification

本文提出了名为 LAtte 的新框架，通过结合洛伦兹注意力模块与 InceptionTime 编码器，利用预训练共享基线信号和洛伦兹低秩适配器学习特定主体嵌入，有效解决了脑电图（EEG）分类中信号信噪比低及主体间差异大的挑战，显著提升了跨主体分类的性能与泛化能力。

Johannes Burchert, Ahmad Bdeir, Tom Hanika, Lars Schmidt-Thieme, Niels Landwehr2026-03-12🤖 cs.LG

Continuous Diffusion Transformers for Designing Synthetic Regulatory Elements

该论文提出了一种参数高效的连续扩散 Transformer 模型，通过引入 2D CNN 输入编码器替代传统 U-Net 骨干网络，在显著降低训练成本、收敛损失及序列记忆化风险的同时，结合 DDPO 微调与 Enformer 奖励模型，成功生成了具有高预测活性的细胞类型特异性合成调控 DNA 序列。

Jonathan Liu, Kia Ghods2026-03-12🧬 q-bio

Kernel Tests of Equivalence

本文提出了一种基于核函数（包括核 Stein 差异和最大均值差异）的新颖等价性检验方法，旨在克服传统拟合优度检验无法有效证明分布间无显著差异的局限，通过设定预定义差异边界并采用渐近正态近似或自举法计算临界值，从而在控制误差率的前提下评估候选分布与名义分布的等价性。

Xing Liu, Axel Gandy2026-03-12📊 stat

Dynamics-Predictive Sampling for Active RL Finetuning of Large Reasoning Models

本文提出了一种名为“动力学预测采样”（DPS）的新方法，通过将提示词在强化学习微调中的解决进度建模为动态系统并利用贝叶斯推断进行在线预测，从而在无需昂贵的大量推理滚动的情况下高效筛选出高价值训练样本，显著降低了计算开销并提升了大型推理模型的微调效率与性能。

Yixiu Mao, Yun Qu, Qi Wang, Heming Zou, Xiangyang Ji2026-03-12🤖 cs.LG

Ergodicity in reinforcement learning

本文通过示例探讨了非遍历奖励过程对强化学习智能体的影响，阐明了遍历性奖励过程与遍历马尔可夫链的联系，并介绍了在遍历性奖励动态下优化个体轨迹长期性能的现有解决方案。

Dominik Baumann, Erfaun Noorani, Arsenii Mustafin, Xinyi Sheng, Bert Verbruggen, Arne Vanhoyweghen, Vincent Ginis, Thomas B. Schön2026-03-12🤖 cs.LG

LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation

LookaheadKV 提出了一种轻量级的 KV 缓存淘汰框架，通过引入参数高效模块直接预测未来重要性评分，在无需耗时的草稿生成前提下，实现了比现有方法更精准的淘汰效果并显著降低了推理开销。

Jinwoo Ahn, Ingyu Seong, Akhil Kedia, Junhan Kim, Hyemi Jang, Kangwook Lee, Yongkweon Jeon2026-03-12🤖 cs.LG

NCAA Bracket Prediction Using Machine Learning and Combinatorial Fusion Analysis

该论文提出了一种基于组合融合分析（CFA）的新方法，通过秩 - 分特征函数和认知多样性整合多种评分系统来生成球队排名，在 2024 年 NCAA 锦标赛预测中取得了 74.60% 的准确率，优于现有的十大主流排名系统。

Yuanhong Wu, Isaiah Smith, Tushar Marwah, Michael Schroeter, Mohamed Rahouti, D. Frank Hsu2026-03-12🤖 cs.LG

ECoLAD: Deployment-Oriented Evaluation for Automotive Time-Series Anomaly Detection

本文提出了面向部署的 ECoLAD 评估协议，通过在受限计算资源下对多种异常检测器进行实证研究，揭示了仅关注准确率的现有基准测试可能误导部署决策，并证明轻量级经典检测器在车载遥测场景的吞吐量约束下比深度学习方法更具可行性。

Kadir-Kaan Özer, René Ebeling, Markus Enzweiler2026-03-12🤖 cs.LG

Historical Consensus: Preventing Posterior Collapse via Iterative Selection of Gaussian Mixture Priors

该论文提出了一种名为“历史共识训练”的迭代方法，通过利用高斯混合模型聚类的多样性来构建参数空间中的稳定屏障，从而在无需特定架构约束或超参数调优的情况下，彻底消除了变分自编码器中的后验坍塌问题。

Zegu Zhang, Jian Zhang2026-03-12🤖 cs.LG

Quantifying Membership Disclosure Risk for Tabular Synthetic Data Using Kernel Density Estimators

该论文提出了一种基于核密度估计（KDE）的实用方法，通过建模合成数据与训练记录间的最近邻距离分布，在不依赖计算密集型影子模型的情况下，有效量化了表格合成数据中的成员披露风险，并实现了比现有基线更优的风险评估效果。

Rajdeep Pathak, Sayantee Jana2026-03-12📊 stat

cs.LG