stat.ML 篇论文 | Gist.Science

The Volterra signature

本文提出了一种名为 Volterra 签名（ $\mathrm{VSig}(x;K)$ ）的显式特征表示方法，通过引入时间核函数将输入路径展开至张量代数，不仅建立了包含可识别性、通用近似定理及核技巧在内的严格学习理论保证，还利用线性状态空间方程和重参数化不变性实现了高效计算，从而在动态学习任务中显著优于传统的路径签名基线。

Paul P. Hager, Fabian N. Harang, Luca Pelizzari + 1 more2026-03-06💻 cs

Oracle-efficient Hybrid Learning with Constrained Adversaries

本文提出了一种在混合在线学习设置下兼具统计最优性与计算效率的算法，该算法在约束对手标签生成机制的前提下，利用 ERM 预言机实现了基于 Rademacher 复杂度的遗憾界，并进一步应用于高维动作集下的随机零和博弈均衡计算。

Princewill Okoroafor, Robert Kleinberg, Michael P. Kim2026-03-06💻 cs

K-Means as a Radial Basis function Network: a Variational and Gradient-based Equivalence

本文通过变分和梯度分析，严格证明了经典 K-Means 算法与具有平滑责任机制的可微径向基函数（RBF）神经网络之间的等价性，并引入 Entmax-1.5 解决低温数值不稳定问题，从而实现了将 K-Means 无缝嵌入深度学习架构以进行端到端联合优化。

Felipe de Jesus Felix Arredondo, Alejandro Ucan-Puc, Carlos Astengo Noguez2026-03-06🔢 math

Optimal Prediction-Augmented Algorithms for Testing Independence of Distributions

本文提出了一种利用辅助预测信息来增强分布独立性检验的框架，该框架在确保最坏情况下有效性的同时，能够根据预测质量自适应地降低样本复杂度，并证明了其样本复杂度的最优性。

Maryam Aliakbarpour, Alireza Azizi, Ria Stevens2026-03-06💻 cs

sFRC for assessing hallucinations in medical image restoration

本文提出了一种名为 sFRC 的新方法，即通过在深度学习医学图像恢复输出的小补丁上执行傅里叶环相关分析并扫描其与参考图像的对应关系，以有效检测并量化由欠采样数据引起的幻觉伪影，从而评估不同重建方法的鲁棒性。

Prabhat Kc, Rongping Zeng, Nirmal Soni + 1 more2026-03-06🔬 physics

Why the Brain Consolidates: Predictive Forgetting for Optimal Generalisation

该论文提出“预测性遗忘”假说，认为大脑通过离线巩固过程选择性地保留能预测未来结果的信息，从而在压缩存储复杂度的同时优化泛化能力，解决了传统记忆巩固理论难以解释的表征漂移和语义化等问题。

Zafeirios Fountas, Adnan Oomerjee, Haitham Bou-Ammar + 2 more2026-03-06💻 cs

Distributional Equivalence in Linear Non-Gaussian Latent-Variable Cyclic Causal Models: Characterization and Learning

该论文针对线性非高斯潜在变量循环因果模型，首次提出了无结构假设下的分布等价性图判据与等价类遍历算法，从而实现了无需特定结构约束的因果发现。

Haoyue Dai, Immanuel Albrecht, Peter Spirtes + 1 more2026-03-06💻 cs

The Inductive Bias of Convolutional Neural Networks: Locality and Weight Sharing Reshape Implicit Regularization

该论文证明了卷积神经网络中的局部性和权重共享机制通过将滤波器耦合至低维补丁流形，有效克服了全连接网络在高维球面数据上过拟合的局限，从而显著提升了模型的泛化能力。

Tongtong Liang, Esha Singh, Rahul Parhi + 2 more2026-03-06💻 cs

How Does the ReLU Activation Affect the Implicit Bias of Gradient Descent on High-dimensional Neural Network Regression?

本文通过新颖的原始 - 对偶分析，证明了在高维随机特征下，梯度下降训练浅层 ReLU 模型时的隐式偏差以高概率逼近最小 L2 范数解，且两者之间的差距为 $O(\sqrt{n/d})$ 。

Kuo-Wei Lai, Guanghui Wang, Molei Tao + 1 more2026-03-06🔢 math

Non-Euclidean Gradient Descent Operates at the Edge of Stability

该论文通过方向平滑性视角将“边缘稳定性”现象推广至非欧几里得梯度下降，提出了一种适用于任意范数（包括 $\ell_{\infty}$ 、块坐标下降等）的广义锐度度量，并实验验证了各类优化器在训练过程中均表现出先渐进锐化后在$2/\eta$阈值附近震荡的稳定性特征。

Rustem Islamov, Michael Crawshaw, Jeremy Cohen + 1 more2026-03-06🔢 math

Federated Causal Discovery Across Heterogeneous Datasets under Latent Confounding

本文提出了 fedCI 及其扩展算法 fedCI-IOD，通过联邦学习框架在保护隐私的前提下，实现了跨异构数据集（含不同变量集、特定站点效应及混合变量类型）且存在潜在混杂因素的高效因果发现。

Maximilian Hahn, Alina Zajak, Dominik Heider + 1 more2026-03-06🤖 cs.AI

Towards a data-scale independent regulariser for robust sparse identification of non-linear dynamics

本文提出了一种名为“系数变异序贯阈值”（STCV）的新型稀疏回归算法，通过引入无量纲的统计指标替代传统的幅度阈值，有效解决了数据归一化对稀疏动力学识别（SINDy）造成的扭曲问题，从而在含噪及归一化数据中实现了更鲁棒、准确的物理定律发现。

Jay Raut, Daniel N. Wilke, Stephan Schmidt2026-03-06🤖 cs.LG

Learning Optimal Individualized Decision Rules with Conditional Demographic Parity

本文提出了一种将人口统计公平性（DP）和条件人口统计公平性（CDP）约束纳入个性化决策规则估计的新框架，通过扰动无约束最优规则实现高效求解，并从理论收敛性、模拟实验及俄勒冈州健康保险实验实证中验证了该方法在平衡决策效用与公平性方面的有效性。

Wenhai Cui, Wen Su, Donglin Zeng + 1 more2026-03-06🤖 cs.LG

Layer by layer, module by module: Choose both for optimal OOD probing of ViT

该论文通过广泛实验发现，预训练与下游数据间的分布偏移是导致 ViT 深层性能下降的主因，并进一步提出在分布偏移较大时探测前馈网络激活、在偏移较小时探测归一化多头自注意力输出，能实现最优的分布外探测效果。

Ambroise Odonnat, Vasilii Feofanov, Laetitia Chapel + 2 more2026-03-06🤖 cs.LG

Bayesian Supervised Causal Clustering

本文提出了一种以处理效应为导向的贝叶斯监督因果聚类（BSCC）方法，旨在识别在协变量特征和治疗效应上均具有同质性的患者亚组，并通过模拟数据及真实世界卒中试验数据验证了其在个性化决策中的实用性。

Luwei Wang, Nazir Lone, Sohan Seth2026-03-06🤖 cs.LG

How important are the genes to explain the outcome - the asymmetric Shapley value as an honest importance metric for high-dimensional features

该论文针对临床预测中评估高维基因组特征重要性时传统方法忽略共线性和依赖方向性的问题，提出利用非对称沙普利值作为更诚实的度量指标，推导了高效的局部与全局计算算法，并通过结直肠癌无进展生存期预测实例验证了其在推断和性能分解方面的有效性。

Mark A. van de Wiel, Jeroen Goedhart, Martin Jullum + 1 more2026-03-06🤖 cs.LG

stat.ML