stat.ML 篇论文 | Gist.Science

ContextBench: Modifying Contexts for Targeted Latent Activation

本文提出了名为 ContextBench 的基准测试，旨在评估生成能激活特定潜在特征或行为且语言流畅的输入的方法，并通过结合大语言模型辅助与扩散模型修复的改进进化提示优化策略，实现了在激发效果与语言流畅度之间的最佳平衡。

Robert Graham, Edward Stevinson, Leo Richter, Alexander Chia, Joseph Miller, Joseph Isaac BloomMon, 09 Ma🤖 cs.AI

Iterative Quantum Feature Maps

本文提出了一种名为迭代量子特征映射（IQFMs）的混合量子 - 经典框架，该框架通过迭代连接浅层量子特征映射与经典计算的增强权重，结合对比学习和逐层训练机制，有效克服了深层量子电路的噪声与资源瓶颈，并在无需优化变分参数的情况下实现了优于量子卷积神经网络且媲美经典神经网络的分类性能。

Nasa Matsumoto, Quoc Hoan Tran, Koki Chinzei, Yasuhiro Endo, Hirotaka OshimaMon, 09 Ma⚛️ quant-ph

Learning the action for long-time-step simulations of molecular dynamics

该论文提出了一种基于数据驱动的结构保持（辛且时间可逆）映射来学习机械作用量的方法，从而在分子动力学模拟中实现大时间步长积分，有效消除了非结构保持机器学习预测器导致的能量不守恒等病理行为，并具备在不同热力学条件和化学组分间迁移的能力。

Filippo Bigi, Johannes Spies, Michele CeriottiMon, 09 Ma🔬 cond-mat.mtrl-sci

Kernel VICReg for Self-Supervised Learning in Reproducing Kernel Hilbert Space

本文提出了 Kernel VICReg，一种将 VICReg 自监督学习目标引入再生核希尔伯特空间（RKHS）的新框架，通过核化损失函数中的方差、不变性和协方差项，在无需显式映射的情况下实现非线性特征学习，从而在非线性结构显著或样本有限的场景下有效缓解表征坍塌并提升性能。

M. Hadi Sepanj, Benyamin Ghojogh, Saed Moradi, Paul FieguthMon, 09 Ma🤖 cs.LG

Spectral/Spatial Tensor Atomic Cluster Expansion with Universal Embeddings in Cartesian Space

本文提出了张量原子团簇展开（TACE）方法，通过在笛卡尔空间中利用不可约笛卡尔张量分解局部环境，统一了标量与张量建模，实现了无需克莱布希 - 高登系数的频域与空域高效计算，并展示了其在分子、材料、光谱、外场响应及多保真度训练等广泛场景中的高精度、稳定性与通用性。

Zemin Xu, Wenbo Xie, P. HuMon, 09 Ma🔬 cond-mat.mtrl-sci

Learning Centre Partitions from Summaries

该论文提出了一种基于多中心汇总统计量的序贯聚类算法（CoC），通过多轮 Cochran 型检验与自助法重采样，在检验参数同质性的同时实现中心分组的准确恢复，并证明了其在大样本下以概率趋近于 1 恢复真实分组的理论性质。

Zinsou Max Debaly, Jean-Francois Ethier, Michael H. Neumann, Félix Camirand-LemyreMon, 09 Ma🔢 math

Self-Speculative Masked Diffusions

该论文提出了一种名为“自投机掩码扩散”的新型离散数据生成模型，通过引入因果注意力机制和模型集成的投机采样策略，实现了非因子化的联合预测，从而在文本和蛋白质序列生成任务中将所需的网络前向传播次数减少了约一半。

Andrew Campbell, Valentin De Bortoli, Jiaxin Shi, Arnaud DoucetMon, 09 Ma🤖 cs.LG

Escaping Model Collapse via Synthetic Data Verification: Near-term Improvements and Long-term Convergence

该论文通过理论分析与多领域实验证实，引入外部验证器（如人类或更优模型）来指导合成数据重训练，不仅能有效避免模型崩溃并带来短期性能提升，还能在长期将模型参数收敛至验证器的“知识中心”。

Bingji Yi, Qiyuan Liu, Yuwei Cheng, Haifeng XuMon, 09 Ma🤖 cs.LG

CADM: Cluster-customized Adaptive Distance Metric for Categorical Data Clustering

该论文提出了一种针对分类数据聚类的簇定制自适应距离度量方法（CADM），通过根据各簇属性分布动态更新距离并扩展至混合数据，在多个数据集上取得了优异的聚类性能。

Taixi Chen, Yiu-ming Cheung, Yiqun ZhangMon, 09 Ma🤖 cs.LG

DAISI: Data Assimilation with Inverse Sampling using Stochastic Interpolants

本文提出了 DAISI，一种基于流生成模型的可扩展数据同化算法，它通过结合新颖的逆采样步骤与基于引导的条件采样，利用数据驱动的先验在无需重训练的情况下有效处理非线性、稀疏且含噪的观测数据，从而克服了传统高维数据同化方法对高斯近似的依赖。

Martin Andrae, Erik Larsson, So Takao, Tomas Landelius, Fredrik LindstenMon, 09 Ma🤖 cs.LG

Data-Driven Global Sensitivity Analysis for Engineering Design Based on Individual Conditional Expectations

本文提出了一种基于个体条件期望（ICE）曲线的全局敏感性分析方法，通过计算 ICE 曲线的期望特征重要性及其标准差来有效捕捉输入变量间的交互作用，克服了传统偏依赖图（PDP）在强交互场景下因平均化效应而掩盖交互信息的局限，并通过数学证明和多个工程算例验证了该方法在揭示数据驱动模型特征重要性方面的优越性。

Pramudita Satria Palar, Paul Saves, Rommel G. Regis, Koji Shimoyama, Shigeru Obayashi, Nicolas Verstaevel, Joseph MorlierMon, 09 Ma🤖 cs.AI

Learning Optimal Distributionally Robust Individualized Treatment Rules Integrating Multi-Source Data

该论文提出了一种融合多源数据并基于先验信息的分布鲁棒个体化治疗规则（PDRO-ITR）方法，通过构建随协变量变化的分布不确定性集来应对后验偏移问题，从而在确保最坏情况下稳健性能的同时实现了优于现有方法的决策效率。

Wenhai Cui, Wen Su, Xingqiu ZhaoMon, 09 Ma🤖 cs.LG

Prediction-Powered Conditional Inference

本文提出了一种结合核函数定位与机器学习预测校正的统计推断方法，旨在利用少量标注数据和大量无标签数据，在不依赖参数模型假设的情况下，实现对固定测试点处条件函数量（如条件均值）的高效、有效且方差更小的统计推断。

Yang Sui, Jin Zhou, Hua Zhou, Xiaowu DaiMon, 09 Ma🤖 cs.LG

Behavior-dLDS: A decomposed linear dynamical systems model for neural activity partially constrained by behavior

本文提出了行为分解线性动态系统（b-dLDS）模型，旨在从大规模神经活动中解耦与行为直接相关的动态子系统和并行内部计算，并在模拟数据及斑马鱼大规模神经记录中验证了其在识别行为相关动态连接网络方面的优越性。

Eva Yezerets, En Yang, Misha B. Ahrens, Adam S. CharlesMon, 09 Ma🤖 cs.LG

Improved Scaling Laws via Weak-to-Strong Generalization in Random Feature Ridge Regression

该论文通过随机特征岭回归的确定性等价分析，证明了在弱到强泛化场景下，即使教师模型标签不完美甚至测试误差不随样本量下降，强学生模型仍能通过两阶段训练突破原有缩放律限制，在偏差主导和方差主导区域均实现更优的测试误差缩放甚至达到极小极大最优速率。

Diyuan Wu, Lehan Chen, Theodor Misiakiewicz, Marco MondelliMon, 09 Ma🤖 cs.LG

Design Experiments to Compare Multi-armed Bandit Algorithms

该论文针对多臂老虎机算法比较中因依赖轨迹导致实验成本高昂的问题，提出了一种名为“人工回放”（Artificial Replay）的新实验设计，通过复用历史轨迹数据，在确保估计量无偏的同时，将实验成本从$2T $降至约$ T$，并显著降低了估计量的方差。

Huiling Meng, Ningyuan Chen, Xuefeng GaoMon, 09 Ma🤖 cs.LG

Large deviation principles for convolutional Bayesian neural networks

本文首次建立了无限通道卷积神经网络在条件协方差矩阵及后验分布上的大偏差原理，并推广了适用于一般感受野架构的高斯等价性证明。

Federico Bassetti, Vassili De Palma, Lucia LadelliMon, 09 Ma🔢 math

Agnostic learning in (almost) optimal time via Gaussian surface area

本文改进了Klivans等人关于高斯表面面积与 $L_1$ 多项式逼近度之间关系的分析，将高斯分布下概念类的伪多项式逼近度从 $O(\Gamma^2 / \varepsilon^4)$ 提升至 $\tilde O(\Gamma^2 / \varepsilon^2)$ ，从而在统计查询模型中实现了多项式阈值函数伪学习复杂度的（近）最优界。

Lucas Pesenti, Lucas Slot, Manuel WiedmerMon, 09 Ma🤖 cs.LG

Predictive Coding Graphs are a Superset of Feedforward Neural Networks

该论文证明了预测编码图（PCGs）在数学上是前馈人工神经网络（多层感知机）的超集，从而将预测编码网络更紧密地融入现代机器学习框架，并强化了对神经网络拓扑结构的研究。

Björn van ZwolMon, 09 Ma🤖 cs.AI

Gradient Flow Polarizes Softmax Outputs towards Low-Entropy Solutions

该论文通过解析基于 softmax 的梯度流动力学，揭示了优化过程会内在驱动模型输出趋向低熵解，从而为 Transformer 中注意力集中和巨大激活等实证现象提供了理论解释。

Aditya Varre, Mark Rofin, Nicolas FlammarionMon, 09 Ma🤖 cs.LG