cs.LG 篇论文 | Gist.Science

XConv: Low-memory stochastic backpropagation for convolutional layers

XConv 是一种无需修改架构或代码即可无缝集成的卷积层替代方案，它通过存储高度压缩的激活值并利用多通道随机迹估计来近似权重梯度，在显著降低显存占用（减少两倍以上）的同时保持了与精确梯度方法相当的训练性能。

Anirudh Thatipelli, Jeffrey Sam, Mathias Louboutin, Ali Siahkoohi, Rongrong Wang, Felix J. HerrmannWed, 11 Ma🤖 cs.LG

A Survey on Decentralized Federated Learning

这篇论文系统回顾了截至 2026 年初的去中心化联邦学习方法，将其划分为传统分布式与基于区块链两大架构，提出了以核心瓶颈为导向的统一分类体系，总结了评估现状与局限，并指出了未来在拓扑感知威胁模型、去中心化隐私定义、抗操纵激励机制及目标模型界定等方向的研究重点。

Edoardo Gabrielli, Anthony Di Pietro, Dario Fenoglio, Giovanni Pica, Gabriele TolomeiWed, 11 Ma🤖 cs.LG

Polynomially Over-Parameterized Convolutional Neural Networks Contain Structured Strong Winning Lottery Tickets

该论文通过利用多维随机子集和问题在随机依赖情形下的最新进展，首次证明了在多项式过参数化的卷积神经网络中存在能够近似任意较小网络的“结构化强彩票票”，从而为结构化剪枝场景下的强彩票票假设提供了首个次指数级上界。

Arthur da Cunha, Francesco d'Amore, Emanuele NataleWed, 11 Ma🤖 cs.LG

Provable Filter for Real-world Graph Clustering

该论文提出了一种名为“可证明过滤器”的新方法，通过构建同配与异配图并设计低通与高通滤波器来同时捕捉同质与异质结构信息，从而有效解决了现有图聚类方法难以适应真实世界复杂图结构的难题。

Xuanting Xie, Erlin Pan, Zhao Kang, Wenyu Chen, Bingheng LiWed, 11 Ma🤖 cs.LG

Enhancing Computational Efficiency in Multiscale Systems Using Deep Learning of Coordinates and Flow Maps

该论文提出了一种结合坐标发现与流图学习的深度学习框架，通过构建精确的时间步进方法，在显著降低计算成本的同时实现了多尺度系统（如 Fitzhugh-Nagumo 神经元模型和 Kuramoto-Sivashinsky 方程）的高效高精度模拟。

Asif Hamid, Danish Rafiq, Shahkar Ahmad Nahvi, Mohammad Abid BazazWed, 11 Ma🤖 cs.LG

Sparse Variational Student-t Processes for Heavy-tailed Modeling

该论文提出了首个可扩展的稀疏变分 Student-t 过程（SVTP）框架，通过引入两种新型推理算法及基于 Beta 函数的自然梯度优化方法，在保持大规模数据计算效率的同时，显著提升了模型对异常值和重尾分布的鲁棒性，在预测精度和收敛速度上均优于稀疏高斯过程。

Jian Xu, Delu Zeng, John PaisleyWed, 11 Ma🤖 cs.AI

HYGENE: A Diffusion-based Hypergraph Generation Method

本文提出了 HYGENE，这是一种基于扩散模型的超图生成方法，它通过在超图二分表示上采用渐进式局部扩展策略，首次利用深度学习成功实现了能够生成具有真实多样性的复杂超图。

Dorian Gailhard, Enzo Tartaglione, Lirida Naviner, Jhony H. GiraldoWed, 11 Ma🤖 cs.LG

Robust Training of Neural Networks at Arbitrary Precision and Sparsity

该论文提出了一种将量化和稀疏化统一建模为加性噪声的框架，通过引入基于岭回归的去噪反量化变换来构建明确的梯度路径，从而解决了传统直通估计器在超低精度和稀疏训练中的不稳定性问题，实现了任意精度与稀疏度下的鲁棒训练并取得了最先进的性能。

Chengxi Ye, Grace Chu, Yanfeng Liu, Yichi Zhang, Lukasz Lew, Li Zhang, Mark Sandler, Andrew HowardWed, 11 Ma🤖 cs.AI

ARLBench: Flexible and Efficient Benchmarking for Hyperparameter Optimization in Reinforcement Learning

该论文提出了 ARLBench，这是一个专为强化学习超参数优化设计的高效且灵活的基准测试框架，它通过精选代表性任务子集大幅降低了计算成本，从而促进了不同自动强化学习方法之间的公平比较与广泛研究。

Jannis Becktepe, Julian Dierkes, Carolin Benjamins, Aditya Mohan, David Salinas, Raghu Rajan, Frank Hutter, Holger Hoos, Marius Lindauer, Theresa EimerWed, 11 Ma🤖 cs.LG

DRUPI: Dataset Reduction Using Privileged Information

本文提出了利用特权信息（如特征标签或注意力标签）进行辅助监督的 DRUPI 方法，通过合成额外信息来增强数据集压缩效果，并在多个基准数据集上显著提升了模型性能。

Shaobo Wang, Youxin Jiang, Tianle Niu, Yantai Yang, Ruiji Zhang, Shuhao Hu, Shuaiyu Zhang, Chenghao Sun, Weiya Li, Conghui He, Xuming Hu, Linfeng ZhangWed, 11 Ma🤖 cs.AI

Unsupervised Representation Learning from Sparse Transformation Analysis

本文提出了一种完全无监督的表示学习方法，通过将潜在变量的概率流模型分解为稀疏激活的旋转场和势场，从而学习出由独立变换基元构成的解耦表示，并在序列变换数据集上实现了领先的数据似然度和近似等变性误差表现。

Yue Song, Thomas Anderson Keller, Yisong Yue, Pietro Perona, Max WellingWed, 11 Ma🤖 cs.LG

Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

该论文提出了一种基于控制障碍函数和可微优化的数据驱动方法，通过量化智能体为安全交互而调整自身行为的意愿（即责任分配），从数据中学习并解释多智能体交互中的安全规范。

Isaac Remy, David Fridovich-Keil, Karen LeungWed, 11 Ma🤖 cs.LG

cs.LG

XConv: Low-memory stochastic backpropagation for convolutional layers

A Survey on Decentralized Federated Learning

Polynomially Over-Parameterized Convolutional Neural Networks Contain Structured Strong Winning Lottery Tickets

Provable Filter for Real-world Graph Clustering

Enhancing Computational Efficiency in Multiscale Systems Using Deep Learning of Coordinates and Flow Maps

Sparse Variational Student-t Processes for Heavy-tailed Modeling

HYGENE: A Diffusion-based Hypergraph Generation Method

Robust Training of Neural Networks at Arbitrary Precision and Sparsity

ARLBench: Flexible and Efficient Benchmarking for Hyperparameter Optimization in Reinforcement Learning

DRUPI: Dataset Reduction Using Privileged Information

Unsupervised Representation Learning from Sparse Transformation Analysis

Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

Calabi-Yau metrics through Grassmannian learning and Donaldson's algorithm

Adaptive and Stratified Subsampling for High-Dimensional Robust Estimation

Scalable Message Passing Neural Networks: No Need for Attention in Large Graph Representation Learning

SPDIM: Source-Free Unsupervised Conditional and Label Shift Adaptation in EEG

Prognostics for Autonomous Deep-Space Habitat Health Management under Multiple Unknown Failure Modes

Morphological-Symmetry-Equivariant Heterogeneous Graph Neural Network for Robotic Dynamics Learning

CuriousBot: Interactive Mobile Exploration via Actionable 3D Relational Object Graph

Molecular Fingerprints Are Strong Models for Peptide Function Prediction