stat.ML 篇论文 | Gist.Science

The Role of Feature Interactions in Graph-based Tabular Deep Learning

该论文通过合成数据集研究发现，现有的基于图的表格深度学习（GTDL）方法虽旨在通过建模特征交互来提升预测，却未能有效恢复真实的图结构，而强制引入真实交互结构后预测性能显著提升，从而强调了准确建模图结构对于提升预测精度的关键作用。

Elias Dubbeldam, Reza Mohammadi, Marit Schoonhoven, S. Ilker BirbilTue, 10 Ma🤖 cs.LG

Wasserstein Gradient Flows for Scalable and Regularized Barycenter Computation

该论文提出了一种基于 Wasserstein 梯度流的新型算法，通过时间离散化和最小批量最优传输，实现了可扩展且支持模块化正则化及监督信息整合的概率测度巴氏中心计算，并在多个领域的基准测试中确立了新的最先进水平。

Eduardo Fernandes Montesuma, Yassir Bendou, Mike GartrellTue, 10 Ma🤖 cs.LG

Bayesian neural networks with interpretable priors from Mercer kernels

该论文提出了一种名为“Mercer 先验”的新方法，通过利用协方差核的 Mercer 表示直接在神经网络参数上定义先验分布，使贝叶斯神经网络能够生成近似高斯过程的样本，从而在保持可扩展性的同时实现具有可解释性的不确定性量化。

Alex Alberts, Ilias BilionisTue, 10 Ma🤖 cs.LG

Shortcut Invariance: Targeted Jacobian Regularization in Disentangled Latent Space

该论文提出了一种名为“捷径不变性”的潜在空间正则化方法，通过在解耦潜在空间中识别捷径对齐轴并注入各向异性噪声来实施定向雅可比正则化，从而在不依赖捷径标签或冲突样本的情况下，有效抑制捷径学习并提升模型的分布外泛化能力。

Shivam Pal, Sakshi Varshney, Piyush RaiTue, 10 Ma🤖 cs.LG

Beyond Additivity: Sparse Isotonic Shapley Regression toward Nonlinear Explainability

本文提出了稀疏各向同性 Shapley 回归（SISR）框架，通过联合学习单调变换以恢复可加性并施加 L0 稀疏约束，有效解决了传统 Shapley 值在处理非线性依赖和特征选择时的失真与计算效率问题，为高维非线性可解释性提供了理论坚实且实用的解决方案。

Jialai SheTue, 10 Ma🤖 cs.LG

Topological Spatial Graph Coarsening

本文提出了一种基于三角形感知图滤过和持久图描述符的参数化空间图粗化方法，通过折叠短边在显著减小图规模的同时，有效保留了原始空间图的关键拓扑特征，并具备旋转、平移及缩放不变性。

Anna Calissano, Etienne LasalleTue, 10 Ma🤖 cs.LG

Sparse Offline Reinforcement Learning with Corruption Robustness

本文针对高维稀疏离线强化学习中的强数据污染问题，提出了一种基于稀疏鲁棒估计器预言机的演员 - 评论家方法，克服了传统最小二乘价值迭代在稀疏场景下的局限性，首次在高维稀疏马尔可夫决策过程及单策略集中度覆盖假设下，给出了具有抗污染能力的非平凡理论保证。

Nam Phuong Tran, Andi Nika, Goran Radanovic, Long Tran-Thanh, Debmalya MandalTue, 10 Ma🤖 cs.LG

From Mice to Trains: Amortized Bayesian Inference on Graph Data

该论文提出了一种将 amortized Bayesian inference（ABI）框架适配于图数据的两阶段方法，通过结合置换不变的图编码器与灵活的后验估计网络，实现了对节点、边及图级别参数的高效、无似然贝叶斯推断，并在合成数据及生物和物流领域的真实数据上验证了其参数恢复与校准性能。

Svenja Jedhoff, Elizaveta Semenova, Aura Raulo, Anne Meyer, Paul-Christian BürknerTue, 10 Ma🤖 cs.LG

Scalable multitask Gaussian processes for complex mechanical systems with functional covariates

本文提出了一种可扩展的多任务高斯过程模型，通过引入完全可分离核结构来联合处理函数型协变量与多任务相关性，利用克罗内克积结构实现高效计算，并在铆接装配等复杂机械系统中以少量样本实现了优于单任务模型的精准预测与不确定性量化。

Razak Christophe Sabi Gninkou (UPHF, INSA Hauts-De-France, CERAMATHS), Andrés F. López-Lopera (IMAG, LEMON, UM), Franck Massa (LAMIH, INSA Hauts-De-France, UPHF), Rodolphe Le Riche (LIMOS, UCA [2017-2020], ENSM ST-ETIENNE, CNRS)Tue, 10 Ma🔢 math

The Partition Principle Revisited: Non-Equal Volume Designs Achieve Minimal Expected Star Discrepancy

本文提出了一种基于非等体积分区的新设计，证明了其产生的分层采样点集在期望星不一致性上优于传统的抖动采样，并推导出了更优的显式上界，从而为高维数值积分中应用非等体积分区提供了理论基础。

Xiaoda XuTue, 10 Ma🤖 cs.LG

Khatri-Rao Clustering for Data Summarization

该论文提出了基于 Khatri-Rao 积的聚类新范式，通过假设质心由多个简洁的“原型质心”交互生成，分别构建了 Khatri-Rao k-Means 算法与深度聚类框架，从而在保持数据摘要准确性的同时显著提升了其简洁性。

Martino Ciaperoni, Collin Leiber, Aristides Gionis, Heikki MannilaTue, 10 Ma🤖 cs.LG

Latent Autoencoder Ensemble Kalman Filter for Data assimilation

该论文提出了一种潜在自编码器集合卡尔曼滤波（LAE-EnKF）方法，通过在具有线性稳定动力学的潜在空间中重构数据同化问题，有效解决了标准集合卡尔曼滤波在处理强非线性系统时的性能瓶颈，并在保持计算效率的同时显著提升了同化精度与稳定性。

Xin T. Tong, Yanyan Wang, Liang YanTue, 10 Ma🤖 cs.LG

NEST: Network- and Memory-Aware Device Placement For Distributed Deep Learning

本文提出了 NEST，一种结合结构化动态规划的网络、计算与内存感知设备放置框架，通过统一建模并行策略、网络拓扑及内存约束，显著提升了分布式深度学习训练的吞吐量、内存效率与可扩展性。

Irene Wang, Vishnu Varma Venkata, Arvind Krishnamurthy, Divya MahajanTue, 10 Ma🤖 cs.LG

CREDO: Epistemic-Aware Conformalized Credal Envelopes for Regression

本文提出了 CREDO 方法，通过先构建能反映认知不确定性的可信集包络、再应用分箱共形校准，实现了兼具分布无关覆盖率保证与可解释性（可分解为偶然噪声、认知膨胀及校准松弛）的回归预测区间。

Luben M. C. Cabezas, Sabina J. Sloman, Bruno M. Resende, Fanyi Wu, Michele Caprio, Rafael IzbickiTue, 10 Ma🤖 cs.LG

Bilateral Trade Under Heavy-Tailed Valuations: Minimax Regret with Infinite Variance

该论文研究了具有无界方差（有限 $p$ 阶矩， $p \in (1,2)$ ）和 $\beta$ -Hölder 连续市场价值函数的上下文双边贸易问题，通过扩展自界性质并结合截断均值估计，确定了最小最大遗憾的精确收敛速率，该速率在 $p=2$ 时退化为经典非参数速率，而在 $p \to 1^+$ 时趋于线性速率。

Hangyi ZhaoTue, 10 Ma🤖 cs.LG

Kernel Methods for Some Transport Equations with Application to Learning Kernels for the Approximation of Koopman Eigenfunctions: A Unified Approach via Variational Methods, Green's Functions and the Method of Characteristics

本文提出了一种统一的变分、格林函数及特征线方法框架，用于构建适配输运方程的再生核，以通过多核学习自动学习并收敛逼近非线性动力系统的 Koopman 特征函数。

Boumediene Hamzi, Houman Owhadi, Umesh VaidyaTue, 10 Ma🔢 math

stat.ML