cs.LG 篇论文 | Gist.Science

From Mice to Trains: Amortized Bayesian Inference on Graph Data

该论文提出了一种将 amortized Bayesian inference（ABI）框架适配于图数据的两阶段方法，通过结合置换不变的图编码器与灵活的后验估计网络，实现了对节点、边及图级别参数的高效、无似然贝叶斯推断，并在合成数据及生物和物流领域的真实数据上验证了其参数恢复与校准性能。

Svenja Jedhoff, Elizaveta Semenova, Aura Raulo, Anne Meyer, Paul-Christian Bürkner2026-03-10🤖 cs.LG

DevBench: A Realistic, Developer-Informed Benchmark for Code Generation Models

DevBench 是一个基于真实开发者遥测数据构建的代码生成基准测试，旨在通过涵盖六种语言和六类任务的 1800 个评估实例，在避免训练数据污染的同时，从功能正确性、语义推理及实际效用等多维度对大语言模型进行更具生态效度的评估与诊断。

Pareesa Ameneh Golnari, Adarsh Kumarappan, Wen Wen, Xiaoyu Liu, Gabriel Ryan, Yuting Sun, Shengyu Fu, Elsie Nallipogu2026-03-10🤖 cs.LG

A Component-Based Survey of Interactions between Large Language Models and Multi-Armed Bandits

这篇论文是首篇从组件层面系统综述大语言模型与多臂老虎机双向交互的文献，深入探讨了两者在解决各自关键挑战（如从预训练到个性化）及优化核心决策组件方面的互补优势、现有方法、性能表现及未来研究方向。

Siguang Chen, Chunli Lv, Miao Xie2026-03-10🤖 cs.LG

ELSA: Efficient LLM-Centric Split Aggregation for Privacy-Aware Hierarchical Federated Learning over the Network Edge

本文提出了 ELSA 框架，通过融合行为感知客户端聚类、资源自适应模型分割以及基于计算草图与语义子空间正交扰动的轻量级通信机制，有效解决了资源受限边缘网络中大规模语言模型在数据异构、设备不稳定及隐私风险下的分层联邦微调难题。

Xiaohong Yang, Tong Xie, Minghui Liwang, Chikai Shang, Yang Lu, Zhenzhen Jiao, Liqun Fu, Seyyedali Hosseinalipour2026-03-10🤖 cs.LG

Continuous-Flow Data-Rate-Aware CNN Inference on FPGA

该论文提出了一种面向 FPGA 的连续流数据率感知 CNN 推理架构，通过交错低数据率信号、共享硬件单元及优化并行化策略，解决了卷积层和池化层导致的数据率下降问题，从而在实现接近 100% 硬件利用率的同时显著降低了逻辑资源消耗，使得在单块 FPGA 上部署 MobileNet 等复杂网络成为可能。

Tobias Habermann, Michael Mecik, Zhenyu Wang, César David Vera, Martin Kumm, Mario Garrido2026-03-10🤖 cs.LG

MeanCache: From Instantaneous to Average Velocity for Accelerating Flow Matching Inference

本文提出了名为 MeanCache 的训练无关缓存框架，通过利用缓存的 Jacobian-向量积构建平均速度以替代瞬时速度，并配合轨迹稳定性调度策略，在 FLUX.1、Qwen-Image 和 HunyuanVideo 等模型上实现了显著加速（最高达 4.56 倍）的同时保持了优于现有基线的生成质量。

Huanlin Gao, Ping Chen, Fuyuan Shi, Ruijia Wu, Li YanTao, Qiang Hui, Yuren You, Ting Lu, Chao Tan, Shaoan Zhao, Zhaoxiang Liu, Fang Zhao, Kai Wang, Shiguo Lian2026-03-10🤖 cs.LG

PASS: Certified Subset Repair for Classical and Quantum Pairwise Constrained Clustering

PASS 是一种可扩展的成对约束 k-均值聚类框架，它通过将优化集中于小型工作子集并引入基于列表着色的可验证修复机制，有效解决了大规模及量子/混合场景下的约束可行性问题，在降低运行时间的同时保证了聚类质量。

Pedro Chumpitaz-Flores, My Duong, Ying Mao, Kaixun Hua2026-03-10🤖 cs.LG

Model-Free Neural State Estimation in Nonlinear Dynamical Systems: Comparing Neural and Classical Filters

该论文通过系统实证比较，表明在非线性动态系统中，无需系统方程的模型-free 神经状态估计器（特别是状态空间模型）在性能上可媲美强非线性卡尔曼滤波，同时具备更高的推理吞吐量。

Zhuochen Liu, Hans Walker, Rahul Jain2026-03-10🤖 cs.LG

TimeSliver : Symbolic-Linear Decomposition for Explainable Time Series Classification

TimeSliver 是一种新颖的可解释深度学习框架，它通过联合利用原始时间序列数据及其符号化抽象来构建保持时序结构的表示，从而线性编码每个时间段的贡献并赋予其有意义的评分，在显著提升时序归因解释性的同时保持了与最先进基线相当的预测性能。

Akash Pandey, Payal Mohapatra, Wei Chen, Qi Zhu, Sinan Keten2026-03-10🤖 cs.LG

Transferable Graph Condensation from the Causal Perspective

该论文提出了一种名为 TGCC 的基于因果不变性的可迁移图数据集压缩方法，通过提取域不变因果特征并结合谱域增强对比学习，有效解决了现有方法在跨任务和跨域场景中泛化能力不足的问题，显著提升了压缩数据集的性能。

Huaming Du, Yijie Huang, Su Yao, Yiying Wang, Yueyang Zhou, Jingwen Yang, Jinshi Zhang, Han Ji, Yu Zhao, Guisong Liu, Hegui Zhang, Carl Yang, Gang Kou2026-03-10🤖 cs.LG

FlowSymm: Physics Aware, Symmetry Preserving Graph Attention for Network Flow Completion

FlowSymm 提出了一种融合群作用、图注意力机制与隐式双层优化的新型架构，通过构建保持局部守恒律的对称性保持解空间，实现了在交通、能源和出行等网络中缺失流量的精确恢复。

Ege Demirci, Francesco Bullo, Ananthram Swami, Ambuj Singh2026-03-10🤖 cs.LG

Mem-T: Densifying Rewards for Long-Horizon Memory Agents

本文提出了 Mem-T 自主记忆代理及其配套的 MoT-GRPO 树引导强化学习框架，通过构建记忆操作树实现稀疏奖励的稠密化与端到端优化，显著提升了长程记忆管理性能并降低了推理成本。

Yanwei Yue, Boci Peng, Xuanbo Fan, Jiaxin Guo, Qiankun Li, Yan Zhang2026-03-10🤖 cs.LG

Bitcoin Price Prediction using Machine Learning and Combinatorial Fusion Analysis

该论文提出将组合融合分析（CFA）应用于比特币价格预测，通过融合多个模型的评分与排名特征，显著提升了预测精度，实现了 0.19% 的 MAPE 并优于现有模型。

Yuanhong Wu, Wei Ye, Jingyan Xu, D. Frank Hsu2026-03-10🤖 cs.LG

In-Run Data Shapley for Adam Optimizer

该论文针对现有“运行中”数据 Shapley 方法因依赖 SGD 线性假设而无法适配 Adam 优化器的局限，提出了一种名为"Adam-Aware In-Run Data Shapley"的新方法，通过引入固定状态假设下的效用重定义及线性化幽灵近似技术，在保持接近标准训练吞吐量的同时，实现了对 Adam 优化器下数据贡献的高保真度（相关系数>0.99）且可扩展的精准评估。

Meng Ding, Zeqing Zhang, Di Wang, Lijie Hu2026-03-10🤖 cs.LG

Do Schwartz Higher-Order Values Help Sentence-Level Human Value Detection? A Study of Hierarchical Gating and Calibration

该研究表明，在句子级人类价值观检测任务中，施瓦茨高阶价值观结构更适合作为归纳偏置而非刚性路由规则，且通过阈值调整和集成等校准方法比层级门控或独立使用紧凑大语言模型能带来更显著的性能提升。

Víctor Yeste, Paolo Rosso2026-03-10🤖 cs.LG

cs.LG