cs.LG 篇论文 | Gist.Science

Contract And Conquer: How to Provably Compute Adversarial Examples for a Black-Box Model?

本文提出了名为“收缩与征服”（CAC）的黑盒对抗攻击方法，该方法通过知识蒸馏和搜索空间精确收缩，在理论上证明了能在固定迭代次数内生成对抗样本，并在 ImageNet 数据集上超越了现有最先进方法。

Anna Chistyakova, Mikhail Pautov2026-03-12🤖 cs.LG

EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution

本文提出了 EvoSchema 基准，通过引入涵盖十种列级和表级扰动的新颖模式演化分类法，系统评估并提升了文本转 SQL 模型在真实世界数据库模式动态变化下的鲁棒性。

Tianshu Zhang, Kun Qian, Siddhartha Sahai, Yuan Tian, Shaddy Garg, Huan Sun, Yunyao Li2026-03-12💬 cs.CL

Riemannian MeanFlow for One-Step Generation on Manifolds

本文提出了流形上的黎曼平均流（RMF）方法，通过利用平行输运构建平均速度场并采用对数映射表示，实现了无需数值积分的流形生成模型单步采样，在球面、环面和 SO(3) 等数据集上显著降低了采样成本并提升了生成质量。

Zichen Zhong, Haoliang Sun, Yukun Zhao, Yongshun Gong, Yilong Yin2026-03-12🤖 cs.LG

Sample-and-Search: An Effective Algorithm for Learning-Augmented k-Median Clustering in High dimensions

本文提出了一种名为“采样与搜索”的高效算法，通过引入预测器预处理和高维采样策略，显著降低了学习增强型 $k$ -均值聚类问题的计算复杂度并改善了聚类成本。

Kangke Cheng, Shihong Song, Guanlin Mo, Hu Ding2026-03-12🤖 cs.LG

CacheSolidarity: Preventing Prefix Caching Side Channels in Multi-tenant LLM Serving Systems

本文提出了 CacheSolidarity 系统，通过动态监控并选择性隔离可疑的跨租户前缀缓存共享，在有效防御大语言模型多租户服务中自动前缀缓存（APC）引发的时序侧信道攻击的同时，避免了现有防御方案因完全隔离用户而导致的性能损失，实现了高达 70% 的缓存复用率提升和 30% 的推理延迟降低。

Panagiotis Georgios Pennas, Konstantinos Papaioannou, Marco Guarnieri, Thaleia Dimitra Doudali2026-03-12🤖 cs.LG

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

该论文通过对比蒙特卡洛 Dropout 与共形预测两种方法在 Fashion-MNIST 数据集上的表现，指出尽管 H-CNN VGG16 精度更高但存在过度自信问题，而 GoogLeNet 校准性更优且共形预测能提供统计保证的预测集，从而强调了在深度学习系统中超越准确率、重视可靠性与不确定性评估的重要性。

Sanne Ruijs, Alina Kosiakova, Farrukh Javed2026-03-12📊 stat

A Grammar of Machine Learning Workflows

该论文针对数据泄露问题，提出了一种将监督学习生命周期分解为 7 个核心原语并施加运行时硬约束的结构化语法方案，通过强制性的评估边界在调用时自动拒绝选择泄露和记忆泄露，从而有效防止了文档指南无法解决的常见失败。

Simon Roth2026-03-12🤖 cs.LG

CUPID: A Plug-in Framework for Joint Aleatoric and Epistemic Uncertainty Estimation with a Single Model

本文提出了 CUPID 框架，这是一种无需修改或重新训练基础模型即可灵活插入任意层、同时估计偶然性和认知性不确定性的通用插件模块，旨在提升高风险领域 AI 决策的透明度与可信度。

Xinran Xu, Xiuyi Fan2026-03-12🤖 cs.LG

Deep Randomized Distributed Function Computation (DeepRDFC): Neural Distributed Channel Simulation

该论文提出了一种基于自编码器的深度随机化分布式函数计算（DeepRDFC）框架，旨在利用数据样本最小化模拟分布与未知目标分布之间的总变差距离，从而在公共随机性受限的场景下，实现相比传统数据压缩方法更显著的通信负载增益和函数计算性能。

Didrik Bergström, Onur Günlü2026-03-12🔢 math

A PUF-Based Approach for Copy Protection of Intellectual Property in Neural Network Models

该论文提出了一种利用物理不可克隆函数（PUF）将神经网络模型权重与特定硬件唯一属性绑定的方法，从而确保模型仅在原始硬件上能保持高精度运行，有效防止了知识产权在克隆硬件上的非法复制。

Daniel Dorfmeister, Flavio Ferrarotti, Bernhard Fischer, Martin Schwandtner, Hannes Sochor2026-03-12🤖 cs.LG

Prioritizing Gradient Sign Over Modulus: An Importance-Aware Framework for Wireless Federated Learning

该论文提出了一种名为 Sign-Prioritized FL (SP-FL) 的新型无线联邦学习框架，通过优先传输梯度符号并基于数据包与设备层面的重要性差异进行分层资源分配，有效解决了无线资源受限下的通信不可靠问题，显著提升了模型训练精度。

Yiyang Yue, Jiacheng Yao, Wei Xu, Zhaohui Yang, George K. Karagiannidis, Dusit Niyato2026-03-12⚡ eess

Dynamics-Informed Deep Learning for Predicting Extreme Events

该论文提出了一种融合动力学机制的深度学习框架，通过自适应低维子空间高效计算瞬态不稳定性特征作为可解释前兆，并利用 Transformer 模型显著提升了高维混沌系统中极端事件的长时预测能力。

Eirini Katsidoniotaki, Themistoklis P. Sapsis2026-03-12🌀 nlin

Taking Shortcuts for Categorical VQA Using Super Neurons

该论文提出了一种名为“超级神经元”（Super Neurons）的免训练方法，通过直接探测视觉语言模型浅层中生成的标量激活值来构建分类器，从而在显著提升分类性能的同时实现高达 5.10 倍的推理加速。

Pierre Musacchio, Jaeyi Jeong, Dahun Kim, Jaesik Park2026-03-12🤖 cs.AI

AI-Enhanced Spatial Cellular Traffic Demand Prediction with Contextual Clustering and Error Correction for 5G/6G Planning

本文提出了一种结合上下文感知两阶段划分策略与残差空间误差校正的 AI 框架，通过解决空间自相关导致的泄漏问题，显著提升了 5G/6G 网络规划中细粒度蜂窝流量需求预测的准确性与泛化能力。

Mohamad Alkadamani, Colin Brown, Halim Yanikomeroglu2026-03-12⚡ eess

Towards Intelligent Spectrum Management: Spectrum Demand Estimation Using Graph Neural Networks

该论文提出了一种基于图注意力网络（HR-GAT）的层级多分辨率模型，利用公开部署数据在细粒度空间尺度上准确估算频谱需求，从而有效降低空间自相关并提升泛化能力，为频谱共享与分配决策提供了可靠支持。

Mohamad Alkadamani, Amir Ghasemi, Halim Yanikomeroglu2026-03-12⚡ eess

Protein Counterfactuals via Diffusion-Guided Latent Optimization

该论文提出了名为 MCCOP 的框架，通过在预训练扩散模型引导的连续潜在空间中进行流形约束优化，生成兼具生物合理性、最小突变数且能实现目标属性（如稳定性或活性）的蛋白质序列反事实，从而为蛋白质工程提供可解释的机制洞察和具体的设计指导。

Weronika Kłos, Sidney Bender, Lukas Kades2026-03-12🤖 cs.LG

Evaluating randomized smoothing as a defense against adversarial attacks in trajectory prediction

该论文提出并评估了一种基于随机平滑的防御机制，证明其能在不牺牲正常场景下预测精度的前提下，有效且低成本地提升多种轨迹预测模型在自动驾驶场景中对对抗攻击的鲁棒性。

Julian F. Schumann, Eduardo Figueiredo, Frederik Baymler Mathiesen, Luca Laurenti, Jens Kober, Arkady Zgonnikov2026-03-12🤖 cs.LG

ReTabSyn: Realistic Tabular Data Synthesis via Reinforcement Learning

ReTabSyn 是一种基于强化学习的表格数据合成框架，它通过优化条件分布 $P(y\mid \bm{X})$ 而非全联合分布，在小样本、类别不平衡及分布偏移等场景下显著提升了合成数据的下游任务效用。

Xiaofeng Lin, Seungbae Kim, Zhuoya Li, Zachary DeSoto, Charles Fleming, Guang Cheng2026-03-12📊 stat

Towards Cold-Start Drafting and Continual Refining: A Value-Driven Memory Approach with Application to NPU Kernel Synthesis

针对数据稀缺的 NPU 内核合成领域，本文提出了名为 EvoKernel 的自进化智能体框架，通过基于价值的记忆检索机制实现从冷启动草稿到持续优化的自动化流程，显著提升了大模型在特定硬件生态中的代码正确率与执行效率。

Yujie Zheng, Zhuo Li, Shengtao Zhang, Hanjing Wang, Junjie Sheng, Jiaqian Wang, Junchi Yan, Weinan Zhang, Ying Wen, Bo Tang, Muning Wen2026-03-12🤖 cs.LG

$V_{0.5}$ : Generalist Value Model as a Prior for Sparse RL Rollouts

本文提出了 $V_{0.5}$ 模型，通过实时统计检验动态融合通用价值模型先验与稀疏采样经验均值，在极低方差下构建鲁棒优势基线，从而在数学推理任务中显著超越 GRPO 和 DAPO 并实现更快的收敛。

Yi-Kai Zhang, Yueqing Sun, Hongyan Hao, Qi Gu, Xunliang Cai, De-Chuan Zhan, Han-Jia Ye2026-03-12🤖 cs.LG

cs.LG