cs.LG 篇论文 | Gist.Science

LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation

LookaheadKV 提出了一种轻量级的 KV 缓存淘汰框架，通过引入参数高效模块直接预测未来重要性评分，在无需耗时的草稿生成前提下，实现了比现有方法更精准的淘汰效果并显著降低了推理开销。

Jinwoo Ahn, Ingyu Seong, Akhil Kedia, Junhan Kim, Hyemi Jang, Kangwook Lee, Yongkweon Jeon2026-03-12🤖 cs.LG

NCAA Bracket Prediction Using Machine Learning and Combinatorial Fusion Analysis

该论文提出了一种基于组合融合分析（CFA）的新方法，通过秩 - 分特征函数和认知多样性整合多种评分系统来生成球队排名，在 2024 年 NCAA 锦标赛预测中取得了 74.60% 的准确率，优于现有的十大主流排名系统。

Yuanhong Wu, Isaiah Smith, Tushar Marwah, Michael Schroeter, Mohamed Rahouti, D. Frank Hsu2026-03-12🤖 cs.LG

ECoLAD: Deployment-Oriented Evaluation for Automotive Time-Series Anomaly Detection

本文提出了面向部署的 ECoLAD 评估协议，通过在受限计算资源下对多种异常检测器进行实证研究，揭示了仅关注准确率的现有基准测试可能误导部署决策，并证明轻量级经典检测器在车载遥测场景的吞吐量约束下比深度学习方法更具可行性。

Kadir-Kaan Özer, René Ebeling, Markus Enzweiler2026-03-12🤖 cs.LG

Historical Consensus: Preventing Posterior Collapse via Iterative Selection of Gaussian Mixture Priors

该论文提出了一种名为“历史共识训练”的迭代方法，通过利用高斯混合模型聚类的多样性来构建参数空间中的稳定屏障，从而在无需特定架构约束或超参数调优的情况下，彻底消除了变分自编码器中的后验坍塌问题。

Zegu Zhang, Jian Zhang2026-03-12🤖 cs.LG

Quantifying Membership Disclosure Risk for Tabular Synthetic Data Using Kernel Density Estimators

该论文提出了一种基于核密度估计（KDE）的实用方法，通过建模合成数据与训练记录间的最近邻距离分布，在不依赖计算密集型影子模型的情况下，有效量化了表格合成数据中的成员披露风险，并实现了比现有基线更优的风险评估效果。

Rajdeep Pathak, Sayantee Jana2026-03-12📊 stat

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

该论文提出了名为 RAD 的新型对齐框架，通过引入基于最优传输的一阶随机占优约束替代传统的期望成本约束，实现了对尾部风险和谱风险测度的普适性控制，从而在提升模型无害性的同时增强了其对分布外场景的鲁棒性。

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

该论文针对质谱分子结构识别中的高误报风险，提出了一种基于风险 - 覆盖率权衡的筛选预测框架，通过评估不同不确定性量化策略，证明利用计算成本较低的一阶置信度及检索级偶然不确定性，结合分布外风险控制方法，可在保证高概率满足预设错误率约束的前提下，有效筛选出可信的分子结构注释。

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem Waegeman2026-03-12📊 stat

Ranking Reasoning LLMs under Test-Time Scaling

该论文正式化了测试时扩展下的密集基准排名问题，推出了开源库 Scorio 以实施多种统计排名方法，并通过在多个数学基准上的实验验证了这些方法在不同预算下对贝叶斯金标准的可靠性。

Mohsen Hariri, Michael Hinczewski, Jing Ma, Vipin Chaudhary2026-03-12📊 stat

Bio-Inspired Self-Supervised Learning for Wrist-worn IMU Signals

该论文提出了一种基于生物启发式自监督学习的新方法，通过引入受运动控制子运动理论启发的“运动片段”标记策略，利用 Transformer 对腕部 IMU 信号进行掩码重建预训练，从而在数据稀缺场景下显著提升了人类活动识别的鲁棒性与效率。

Prithviraj Tarale, Kiet Chu, Abhishek Varghese, Kai-Chun Liu, Maxwell A Xu, Mohit Iyyer, Sunghoon I. Lee2026-03-12🤖 cs.LG

Pointy - A Lightweight Transformer for Point Cloud Foundation Models

该论文提出了一种名为 Pointy 的轻量级 Transformer 点云架构，仅通过 3.9 万个点云样本的训练，便在性能上超越了依赖大规模跨模态监督或更多数据的基础模型，并通过统一的复现研究证明了精心设计的架构与训练策略在无需复杂 Tokenizer 的情况下即可实现卓越效果。

Konrad Szafer, Marek Kraft, Dominik Belter2026-03-12🤖 cs.LG

TOSSS: a CVE-based Software Security Benchmark for Large Language Models

本文介绍了 TOSSS（基于 CVE 的双选项安全片段选择）基准，旨在通过让大语言模型在安全与易受攻击的代码片段间进行选择来评估其软件安全能力，该基准具有可扩展性，并在 14 个主流模型上进行了 C/C++ 和 Java 代码的测试。

Marc Damie, Murat Bilgehan Ertan, Domenico Essoussi, Angela Makhanu, Gaëtan Peter, Roos Wensveen2026-03-12🤖 cs.LG

FRIEND: Federated Learning for Joint Optimization of multi-RIS Configuration and Eavesdropper Intelligent Detection in B5G Networks

本文提出了一种名为 FRIEND 的联邦学习框架，通过在 B5G 多 RIS 辅助的无蜂窝毫米波网络中利用边缘设备协同训练深度卷积神经网络来检测窃听者，从而在保护数据隐私的同时将保密速率提升了约 30%。

Maria Lamprini A. Bartsioka, Ioannis A. Bartsiokas, Anastasios K. Papazafeiropoulos, Maria A. Seimeni, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🤖 cs.LG

cs.LG

LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation

NCAA Bracket Prediction Using Machine Learning and Combinatorial Fusion Analysis

ECoLAD: Deployment-Oriented Evaluation for Automotive Time-Series Anomaly Detection

Historical Consensus: Preventing Posterior Collapse via Iterative Selection of Gaussian Mixture Priors

Quantifying Membership Disclosure Risk for Tabular Synthetic Data Using Kernel Density Estimators

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

Ranking Reasoning LLMs under Test-Time Scaling

Bio-Inspired Self-Supervised Learning for Wrist-worn IMU Signals

Pointy - A Lightweight Transformer for Point Cloud Foundation Models

TOSSS: a CVE-based Software Security Benchmark for Large Language Models

FRIEND: Federated Learning for Joint Optimization of multi-RIS Configuration and Eavesdropper Intelligent Detection in B5G Networks

Federated Learning-driven Beam Management in LEO 6G Non-Terrestrial Networks

The Discrete Charm of the MLP: Binary Routing of Continuous Signals in Transformer Feed-Forward Layers

MCMC Informed Neural Emulators for Uncertainty Quantification in Dynamical Systems

ForwardFlow: Simulation only statistical inference using deep learning

Bayesian Optimization with Gaussian Processes to Accelerate Stationary Point Searches

Factorized Neural Implicit DMD for Parametric Dynamics

Cross-Species Transfer Learning for Electrophysiology-to-Transcriptomics Mapping in Cortical GABAergic Interneurons

Leech Lattice Vector Quantization for Efficient LLM Compression