stat.ML 篇论文 | Gist.Science

SurvHTE-Bench: A Benchmark for Heterogeneous Treatment Effect Estimation in Survival Analysis

本文提出了首个针对右删失生存数据中异质性处理效应估计的综合基准 SurvHTE-Bench，通过构建涵盖合成、半合成及真实世界数据的多样化数据集，首次对各类生存 HTE 方法在不同假设及现实条件下的表现进行了严谨评估，从而为因果生存分析方法的公平、可复现及可扩展评价奠定了基础。

Shahriar Noroozizadeh, Xiaobin Shen, Jeremy C. Weiss + 1 more2026-03-06🤖 cs.AI

Sample-Optimal Locally Private Hypothesis Selection and the Provable Benefits of Interactivity

本文提出了一种仅需 $O(\log \log k)$ 轮交互的 $\varepsilon$ -局部差分隐私算法，将 $k$ 个分布假设选择问题的样本复杂度从非交互情形下的 $\Omega(k \log k)$ 优化至最优的 $\Theta(k)$ ，从而证明了交互性在该场景下的显著优势。

Alireza F. Pour, Hassan Ashtiani, Shahab Asoodeh2026-03-05🤖 cs.LG

List Sample Compression and Uniform Convergence

该论文研究了列表 PAC 学习中的泛化原理，证明了均匀收敛性在此设定下仍等价于可学习性，但推翻了 Littlestone 和 Warmuth 的样本压缩猜想，表明存在无法被压缩的列表可学习类。

Steve Hanneke, Shay Moran, Tom Waknine2026-03-05🤖 cs.LG

Tracking solutions of time-varying variational inequalities

本文扩展了现有变分不等式跟踪理论，不仅为非单调函数和周期性非次线性路径情形提供了跟踪界，还深入研究了周期性时变变分不等式离散动力系统的收敛行为与轨迹，揭示了其可能呈现的混沌特性或收敛至解的现象。

Hédi Hadiji, Sarah Sachs, Cristóbal Guzmán2026-03-05🤖 cs.LG

AuToMATo: An Out-Of-The-Box Persistence-Based Clustering Algorithm

本文介绍了 AuToMATo，一种基于持久同调的聚类算法，它通过结合 ToMATo 算法与自举程序来区分密度函数的显著峰值，并提供了无需调参的默认配置，在多项测试中表现优于现有最先进算法，且能无缝集成至 scikit-learn 并有效应用于 Mapper 算法。

Marius Huber, Sara Kalisnik, Patrick Schnider2026-03-05🤖 cs.LG

Low-Rank Contextual Reinforcement Learning from Heterogeneous Human Feedback

本文提出了低秩上下文强化学习人类反馈（LoCo-RLHF）框架，通过利用用户上下文与问答对交互的低秩结构来建模异质性反馈，并结合基于悲观主义的子空间策略以应对分布偏移，从而在保持计算效率的同时实现了更优的个性化对齐性能与理论保证。

Seong Jin Lee, Will Wei Sun, Yufeng Liu2026-03-05🤖 cs.LG

DCENWCNet: A Deep CNN Ensemble Network for White Blood Cell Classification with LIME-Based Explainability

本文提出了一种名为 DCENWCNet 的新型深度卷积神经网络集成模型，通过结合三种具有不同配置架构的 CNN 来优化白细胞分类性能，并利用 LIME 技术增强模型的可解释性，从而在 Rabbin-WBC 数据集上实现了优于现有最先进方法的分类精度与诊断可信度。

Sibasish Dhibar2026-03-05🤖 cs.AI

Scalable physics-informed deep generative model for solving forward and inverse stochastic differential equations

本文提出了一种可扩展的物理信息深度生成模型（sPI-GeM），通过结合物理信息基网络与深度生成模型，有效解决了高维随机空间和高维物理空间下的随机微分方程正演与反演问题。

Shaoqian Zhou, Wen You, Ling Guo + 1 more2026-03-05🔬 physics

Optimal Best-Arm Identification under Fixed Confidence with Multiple Optima

本文针对已知最优臂数量的多最优臂随机多臂老虎机问题，推导了更紧的信息论下界，并提出了一种改进的 Track-and-Stop 算法，证明了其在渐近意义下达到了样本复杂度最优。

Lan V. Truong2026-03-05🤖 cs.LG

Convergence, Sticking and Escape: Stochastic Dynamics Near Critical Points in SGD

本文研究了在一维景观中随机梯度下降（SGD）在无限方差与有限方差噪声下的收敛性与逃逸动力学，揭示了噪声特性与函数几何结构如何共同影响 SGD 从初始点进入局部极小值的时间尺度、在局部极大值附近的滞留行为以及逃离尖锐极大值后抵达相邻极小值的概率。

Dmitry Dudukalov, Artem Logachov, Vladimir Lotov + 3 more2026-03-05🤖 cs.LG

A Copula Based Supervised Filter for Feature Selection in Diabetes Risk Prediction Using Machine Learning

本文提出了一种基于 Gumbel copula 尾部相关性的监督特征选择滤波器，通过捕捉特征与糖尿病阳性类别的极端共现关系，在 CDC 大规模调查和 PIMA 临床基准数据集上实现了高效、可解释且性能优越的风险预测特征筛选。

Agnideep Aich, Md Monzur Murshed, Sameera Hewage + 1 more2026-03-05🤖 cs.LG

Boosting In-Context Learning in LLMs Through the Lens of Classical Supervised Learning

该论文提出了监督校准（SC）框架，通过在 logits 空间学习最优的仿射变换并引入正则化技术，克服了现有方法仅能平移决策边界的局限，从而显著提升了大语言模型在上下文学习中的分类性能与稳定性。

Korel Gundem, Juncheng Dong, Dennis Zhang + 2 more2026-03-05🤖 cs.AI

Honesty in Causal Forests: When It Helps and When It Hurts

该论文通过 7,500 个基准数据集证明，因果森林中默认采用的“诚实估计”策略虽能降低过拟合风险，却可能因限制数据利用而加剧欠拟合，导致个体处理效应估计精度下降，因此建议将其视为一种正则化手段，应根据具体应用场景和目标审慎选择而非盲目默认使用。

Yanfang Hou, Carlos Fernández-Loría2026-03-05🤖 cs.LG

Federated ADMM from Bayesian Duality

本文提出了一种基于贝叶斯对偶性的新方法，通过变分贝叶斯目标函数的优化统一并推广了联邦 ADMM 算法，使其在保持原有结构的同时，能够针对高斯分布及更广泛的指数族分布衍生出具有更快收敛速度或更高精度的新型变体。

Thomas Möllenhoff, Siddharth Swaroop, Finale Doshi-Velez + 1 more2026-03-05🤖 cs.LG

Finite-Dimensional Gaussian Approximation for Deep Neural Networks: Universality in Random Weights

该论文研究了具有有限阶矩随机初始权重的深度神经网络，在激活函数满足 Lipschitz 条件且层宽以任意相对速率趋于无穷时，建立了有限维分布在 Wasserstein-1 范数下的高斯近似误差界，并给出了特定比例增长情形下的具体收敛速率。

Krishnakumar Balasubramanian, Nathan Ross2026-03-05🤖 cs.LG

Best-of- $\infty$ -- Asymptotic Performance of Test-Time LLM Ensembling

本文研究了基于多数投票的无限次测试时 LLM 集成（Best-of- $\infty$ ）的渐近性能，并提出了一种基于答案一致性的自适应生成方案及多模型加权集成方法，通过混合整数线性规划优化权重，在有限计算预算下显著提升了模型表现。

Junpei Komiyama, Daisuke Oba, Masafumi Oyamada2026-03-05🤖 cs.AI

Learning in an Echo Chamber: Online Learning with Replay Adversary

该论文通过引入“重放对抗”学习框架，提出了扩展阈值维数（ExThD）作为衡量在线学习在自我标注数据回声室效应下可学习性的精确指标，并证明了基于闭包的不当学习算法能在此设定下达到最优错误界，而传统算法或不当学习则面临显著的性能分离。

Daniil Dmitriev, Harald Eskelund Franck, Carolin Heinzler + 1 more2026-03-05🤖 cs.LG

Buzz, Choose, Forget: A Meta-Bandit Framework for Bee-Like Decision Making

本文提出了名为 MAYA 的基于多臂老虎机的序贯模仿学习模型，通过引入约 7 次试验的有限时间窗口来模拟蜜蜂的记忆机制，在真实与模拟数据上均优于传统基线，并能有效解释个体学习策略及推断生态轨迹。

Emmanuelle Claeys, Elena Kerjean, Jean-Michel Loubes2026-03-05🤖 cs.LG

Implicit Bias of Per-sample Adam on Separable Data: Departure from the Full-batch Regime

该论文揭示了在可分数据上，单样本（增量式）Adam 优化器的隐式偏差会显著偏离全批量模式，可能收敛至 $\ell_2$ 最大间隔分类器，其具体偏差取决于批处理策略与数据集特性，而 Signum 算法则对所有批量大小均保持 $\ell_\infty$ 最大间隔偏差。

Beomhan Baek, Minhak Song, Chulhee Yun2026-03-05🤖 cs.AI

Implicit Bias of the JKO Scheme

该论文通过刻画 Jordan-Kinderlehrer-Otto (JKO) 方案在步长二阶下的隐式偏差，揭示了该方案实际上是在最小化一个由原始能量泛函减去其度量曲率平方项构成的修正能量泛函，并指出这一偏差对应于熵、KL 散度等常见泛函中的特定正则化项（如 Fisher 信息），从而解释了 JKO 方案在保持能量耗散和无条件稳定性方面的独特性质。

Peter Halmos, Boris Hanin2026-03-05🤖 cs.AI

stat.ML