stat.ML 篇论文 | Gist.Science

Prognostics for Autonomous Deep-Space Habitat Health Management under Multiple Unknown Failure Modes

该论文提出了一种基于无监督学习的双阶段框架，利用未标记的故障数据联合识别深空栖息地中的潜在故障模式并筛选关键传感器，从而在缺乏先验知识的情况下实现更准确的剩余寿命预测。

Benjamin Peters, Ayush Mohanty, Xiaolei Fang, Stephen K. Robinson, Nagi GebraeelWed, 11 Ma🤖 cs.LG

Improving clustering quality evaluation in noisy Gaussian mixtures

本文提出了一种基于特征重要性重缩放（FIR）的理论方法，通过根据特征离散度调整其贡献来抑制噪声，从而显著提升了高维或含噪高斯混合数据中聚类有效性指标与真实标签之间的相关性及评估鲁棒性。

Renato Cordeiro de Amorim, Vladimir MakarenkovWed, 11 Ma🤖 cs.LG

A Consequentialist Critique of Binary Classification Evaluation: Theory, Practice, and Tools

本文从决策理论的后果主义视角出发，批判了机器学习领域过度依赖固定阈值评估的现状，提出应优先采用 Brier 分数等严格评分规则，并通过构建决策框架、开发 Python 工具包及改进算法来弥合理论与实践的差距。

Gerardo Flores, Abigail Schiff, Alyssa H. Smith, Julia A Fukuyama, Ashia C. WilsonWed, 11 Ma🤖 cs.AI

Regret-Optimal Q-Learning with Low Cost for Single-Agent and Federated Reinforcement Learning

该论文提出了两种新型无模型强化学习算法（Q-EarlySettled-LowCost 和 FedQ-EarlySettled-LowCost），首次同时实现了近最优遗憾、关于状态与动作数量的线性预热成本以及对数级策略切换或通信开销，从而显著降低了单智能体及联邦强化学习中的实际部署代价。

Haochen Zhang, Zhong Zheng, Lingzhou XueWed, 11 Ma🤖 cs.LG

Uncovering Social Network Activity Using Joint User and Topic Interaction

本文提出了一种名为“交互级联混合模型”（MIC）的标记多维霍克斯过程模型，通过联合刻画用户行为与多个信息级联间的复杂相互作用，在模拟信息传播及揭示社交网络活动方面展现出优于现有方法的性能。

Gaspard Abel, Argyris Kalogeratos, Jean-Pierre Nadal, Julien Randon-FurlingWed, 11 Ma🤖 cs.LG

Global Convergence of Iteratively Reweighted Least Squares for Robust Subspace Recovery

本文证明了在确定性条件下，带有动态平滑正则化的迭代重加权最小二乘法（IRLS）变体能够从任意初始化线性全局收敛至真实子空间，填补了该算法在鲁棒子空间恢复及非凸流形优化领域缺乏理论保证的空白，并将其应用扩展至仿射子空间估计与神经网络训练。

Gilad Lerman, Kang Li, Tyler Maunu, Teng ZhangWed, 11 Ma🤖 cs.LG

Repulsive Monte Carlo on the sphere for the sliced Wasserstein distance

本文提出并评估了多种基于排斥性节点（如行列式点过程和排斥过程）的蒙特卡洛积分方法以计算高维球面上的切片 Wasserstein 距离，并通过方差分析揭示了 UnifOrtho 估计量在大维数下的优势，最终建议在小维数场景使用随机拟蒙特卡洛法，而在大维数场景使用 UnifOrtho 方法。

Vladimir Petrovic, Rémi Bardenet, Agnès DesolneuxWed, 11 Ma🤖 cs.LG

Personalized Collaborative Learning with Affinity-Based Variance Reduction

该论文提出了一种名为 AffPCL 的新型个性化协同学习框架，通过精心设计的偏差校正与重要性校正机制，在无需预先知晓系统异质性水平的情况下，实现了从同质环境下的线性加速到异质环境下的独立学习基线之间的自适应平滑过渡，并揭示了即使在高度异质条件下协作仍能获得线性加速的新见解。

Chenyu Zhang, Navid AzizanWed, 11 Ma🤖 cs.LG

An AI-powered Bayesian Generative Modeling Approach for Arbitrary Conditional Inference

该论文提出了一种名为贝叶斯生成建模（BGM）的统一框架，通过随机迭代贝叶斯更新算法学习生成模型，从而无需重新训练即可实现对任意变量子集的灵活条件推断，并兼具优越的预测性能、不确定性量化能力及理论保证。

Qiao Liu, Wing Hung WongWed, 11 Ma🤖 cs.AI

Robust Assortment Optimization from Observational Data

本文提出了一种基于观测数据的鲁棒 assortment 优化框架，通过建模客户偏好分布偏移并最大化最坏情况下的预期收益，在理论界定了计算可行性与样本复杂度上下界的同时，揭示了实现样本高效鲁棒学习所需的最小数据条件“鲁棒单项覆盖”，从而弥合了鲁棒性与统计效率之间的差距。

Miao Lu, Yuxuan Han, Han Zhong, Zhengyuan Zhou, Jose BlanchetWed, 11 Ma🤖 cs.LG

Non-Rectangular Average-Reward Robust MDPs: Optimal Policies and Their Transient Values

本文研究了非矩形平均奖励鲁棒马尔可夫决策过程，证明了在弱通信假设下存在实现次线性期望遗憾的鲁棒最优策略，揭示了其鲁棒值的极小极大表示，并指出平均奖励最优性可能掩盖极差的瞬态表现，进而提出了一种结合最坏情况最优策略、序贯检验与在线学习回退机制的基于时段的策略，以实现常数阶的瞬态值。

Shengbo Wang, Nian SiWed, 11 Ma🤖 cs.LG

Robust Parameter and State Estimation in Multiscale Neuronal Systems Using Physics-Informed Neural Networks

本文提出了一种基于物理信息神经网络（PINN）的框架，能够仅利用部分电压观测数据，在强非线性和多尺度动力学条件下，鲁棒且准确地重建神经元模型中的隐藏状态变量并推断生物物理参数，有效克服了传统数值方法在初始猜测敏感和收敛失败方面的局限。

Changliang Wei, Yangyang Wang, Xueyu ZhuWed, 11 Ma🤖 cs.LG

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

本文针对多变量时间序列建模中变量顺序人为性导致的问题，从理论上证明了置换等变线性状态空间系统的规范形式，并据此提出了 VI 2D SSM 及其架构 VI 2D Mamba，通过消除变量轴上的序列依赖链，在降低计算复杂度与简化稳定性分析的同时实现了卓越的性能。

Seungwoo Jeong, Heung-Il SukWed, 11 Ma🤖 cs.AI

On the Formal Limits of Alignment Verification

该论文证明了在 AI 对齐验证中，无法同时满足完备性、通用性和可计算性这三个属性，从而确立了形式化对齐认证的固有局限，并指出通过放宽任一条件仍可实现有意义的保障。

Ayushi AgarwalWed, 11 Ma🤖 cs.LG

Micro-Diffusion Compression -- Binary Tree Tweedie Denoising for Online Probability Estimation

本文介绍了 Midicoth，一种通过引入基于二叉树分解的微观扩散去噪层，将概率校准转化为一系列高效二分类任务，从而在稀疏数据下修正自适应统计模型偏差并实现无损压缩的在线系统。

Roberto TacconelliWed, 11 Ma🤖 cs.LG

Multi-level meta-reinforcement learning with skill-based curriculum

本文提出了一种结合技能基课程学习的多层级元强化学习框架，通过递归压缩马尔可夫决策过程（MDP）来构建层级结构，从而有效降低随机性、解耦子任务并促进技能在不同问题与层级间的迁移，最终实现更高效且可解释的复杂序列决策。

Sichen Yang (Johns Hopkins University), Mauro Maggioni (Johns Hopkins University)Wed, 11 Ma🤖 cs.AI

The Temporal Markov Transition Field

本文提出了“时间马尔可夫转移场”（TMTF），通过划分时间序列为多个连续片段并分别估计局部转移矩阵，解决了传统马尔可夫转移场（MTF）在刻画非平稳过程时因全局平均而丢失时序动态信息的缺陷，从而生成能清晰反映不同时间段演化特征的二维图像表示。

Michael LeznikWed, 11 Ma🤖 cs.LG

Cross-Domain Uncertainty Quantification for Selective Prediction: A Comprehensive Bound Ablation with Transfer-Informed Betting

本文提出了一种名为“转移信息博彩（TIB）”的新方法，通过结合跨域风险分布预热与博彩置信序列，在数据稀缺场景下显著提升了选择性预测的覆盖率，并系统评估了九类有限样本界在多个基准测试中的表现。

Abhinaba BasuWed, 11 Ma🤖 cs.AI

Functional Bias and Tangent-Space Geometry in Variational Inference

该论文建立了一个几何框架，证明变分推断中后验函数量的主导偏差取决于其在变分切空间正交方向上的分量，从而从几何角度解释了均值场变分推断为何会系统性地扭曲跨块依赖关系。

Sean PlummerWed, 11 Ma📊 stat

Kernel Debiased Plug-in Estimation based on the Universal Least Favorable Submodel

本文提出了一种基于通用最不利子模型的核去偏插件估计量（ULFS-KDPE），该方法通过在再生核希尔伯特空间中构建自适应去偏流，无需显式推导或计算有效影响函数即可在标准正则条件下实现非参数模型中路径可微参数的半参数效率估计，并具备坚实的泛函分析基础与良好的数值稳定性。

Haiyi Chen, Yang Liu, Ivana MalenicaWed, 11 Ma🤖 cs.LG