Latent Sculpting for Zero-Shot Generalization: A Manifold Learning Approach to Out-of-Distribution Anomaly Detection

该论文提出了一种名为“潜在雕刻”(Latent Sculpting)的分层两阶段表示学习架构,通过结合基于 Transformer 的二值潜在雕刻损失与掩码自回归流(MAF),在 CIC-IDS-2017 基准测试中实现了针对零日网络威胁的高精度零样本泛化异常检测,显著克服了传统监督模型在分布外数据上的泛化崩溃问题。

Rajeeb Thapa Chhetri, Saurab Thapa, Avinash Kumar, Zhixiong Chen2026-03-10🤖 cs.LG

Certifying the Right to Be Forgotten: Primal-Dual Optimization for Sample and Label Unlearning in Vertical Federated Learning

本文提出了 FedORA 框架,利用原始 - 对偶优化方法解决垂直联邦学习中的样本与标签遗忘难题,通过引入不确定性损失函数、自适应步长及非对称批处理设计,在显著降低计算与通信开销的同时,实现了与重新训练相当的遗忘效果与模型效用。

Yu Jiang, Xindi Tong, Ziyao Liu, Xiaoxi Zhang, Kwok-Yan Lam, Chee Wei Tan2026-03-10🤖 cs.LG

Sparse Offline Reinforcement Learning with Corruption Robustness

本文针对高维稀疏离线强化学习中的强数据污染问题,提出了一种基于稀疏鲁棒估计器预言机的演员 - 评论家方法,克服了传统最小二乘价值迭代在稀疏场景下的局限性,首次在高维稀疏马尔可夫决策过程及单策略集中度覆盖假设下,给出了具有抗污染能力的非平凡理论保证。

Nam Phuong Tran, Andi Nika, Goran Radanovic, Long Tran-Thanh, Debmalya Mandal2026-03-10🤖 cs.LG

Reliable Grid Forecasting: State Space Models for Safety-Critical Energy Systems

本文针对安全关键的电网负荷预测,提出了一套超越传统精度指标(如 MAPE)的单向风险评估框架,通过对比多种神经网络架构在加州独立系统运营商数据上的表现,揭示了概率校准可能导致的“虚假安全”问题,并引入偏差约束目标以实现尾部风险最小化与避免过度预测之间的可审计权衡。

Sunki Hong, Jisoo Lee2026-03-10⚡ eess

From Mice to Trains: Amortized Bayesian Inference on Graph Data

该论文提出了一种将 amortized Bayesian inference(ABI)框架适配于图数据的两阶段方法,通过结合置换不变的图编码器与灵活的后验估计网络,实现了对节点、边及图级别参数的高效、无似然贝叶斯推断,并在合成数据及生物和物流领域的真实数据上验证了其参数恢复与校准性能。

Svenja Jedhoff, Elizaveta Semenova, Aura Raulo, Anne Meyer, Paul-Christian Bürkner2026-03-10🤖 cs.LG

DevBench: A Realistic, Developer-Informed Benchmark for Code Generation Models

DevBench 是一个基于真实开发者遥测数据构建的代码生成基准测试,旨在通过涵盖六种语言和六类任务的 1800 个评估实例,在避免训练数据污染的同时,从功能正确性、语义推理及实际效用等多维度对大语言模型进行更具生态效度的评估与诊断。

Pareesa Ameneh Golnari, Adarsh Kumarappan, Wen Wen, Xiaoyu Liu, Gabriel Ryan, Yuting Sun, Shengyu Fu, Elsie Nallipogu2026-03-10🤖 cs.LG

ELSA: Efficient LLM-Centric Split Aggregation for Privacy-Aware Hierarchical Federated Learning over the Network Edge

本文提出了 ELSA 框架,通过融合行为感知客户端聚类、资源自适应模型分割以及基于计算草图与语义子空间正交扰动的轻量级通信机制,有效解决了资源受限边缘网络中大规模语言模型在数据异构、设备不稳定及隐私风险下的分层联邦微调难题。

Xiaohong Yang, Tong Xie, Minghui Liwang, Chikai Shang, Yang Lu, Zhenzhen Jiao, Liqun Fu, Seyyedali Hosseinalipour2026-03-10🤖 cs.LG

Continuous-Flow Data-Rate-Aware CNN Inference on FPGA

该论文提出了一种面向 FPGA 的连续流数据率感知 CNN 推理架构,通过交错低数据率信号、共享硬件单元及优化并行化策略,解决了卷积层和池化层导致的数据率下降问题,从而在实现接近 100% 硬件利用率的同时显著降低了逻辑资源消耗,使得在单块 FPGA 上部署 MobileNet 等复杂网络成为可能。

Tobias Habermann, Michael Mecik, Zhenyu Wang, César David Vera, Martin Kumm, Mario Garrido2026-03-10🤖 cs.LG

MeanCache: From Instantaneous to Average Velocity for Accelerating Flow Matching Inference

本文提出了名为 MeanCache 的训练无关缓存框架,通过利用缓存的 Jacobian-向量积构建平均速度以替代瞬时速度,并配合轨迹稳定性调度策略,在 FLUX.1、Qwen-Image 和 HunyuanVideo 等模型上实现了显著加速(最高达 4.56 倍)的同时保持了优于现有基线的生成质量。

Huanlin Gao, Ping Chen, Fuyuan Shi, Ruijia Wu, Li YanTao, Qiang Hui, Yuren You, Ting Lu, Chao Tan, Shaoan Zhao, Zhaoxiang Liu, Fang Zhao, Kai Wang, Shiguo Lian2026-03-10🤖 cs.LG