Including historical control data in simultaneous inference for pre-clinical multi-arm studies

该论文提出了一种基于动态贝叶斯借用和同时可信区间的统计方法,旨在将历史对照数据纳入二分类终点(如长期致癌性研究)的多臂试验中,从而在有效控制族系错误率并抵御数据漂移的同时,显著减少实验动物的使用量。

Max Menssen, Carsten Kneuer, Gyamfi Akyianu, Christian Röver, Tim Friede, Frank SchaarschmidtFri, 13 Ma📊 stat

Exploiting Expertise of Non-Expert and Diverse Agents in Social Bandit Learning: A Free Energy Approach

本文提出了一种基于自由能的社会多臂老虎机学习算法,使智能体能够在无需奖励信息或先验规范的情况下,自主评估并有效利用非专家及多样化同伴的行为策略,从而在保持对数遗憾的同时显著提升个体学习性能。

Erfan Mirzaei, Seyed Pooya Shariatpanahi, Alireza Tavakoli, Reshad Hosseini, Majid Nili AhmadabadiFri, 13 Ma📊 stat

A Further Efficient Algorithm with Best-of-Both-Worlds Guarantees for mm-Set Semi-Bandit Problem

本文证明了在mm-集半带问题中,结合特定分布(Fréchet 和 Pareto)与几何重采样的 Follow-the-Perturbed-Leader (FTPL) 算法,不仅能在对抗和随机设置下分别达到最优的O(mdT)O(\sqrt{mdT})对数遗憾,实现“双世界”最优性,还将计算复杂度从O(d2)O(d^2)降低至O(md(log(d/m)+1))O(md(\log(d/m)+1))

Botao Chen, Jongyeong Lee, Chansoo Kim, Junya HondaFri, 13 Ma📊 stat

Language Generation with Replay: A Learning-Theoretic View of Model Collapse

该论文从学习理论视角出发,通过引入“重放对手”模型,精细刻画了生成式语言模型在训练数据混入自身历史输出(即模型崩溃)时的学习极限,揭示了重放机制虽不影响最强的一致性生成,却会破坏较弱的非一致性及极限生成能力,从而从理论上验证了数据清洗等实践策略的有效性及其局限性。

Giorgio Racca, Michal Valko, Amartya SanyalFri, 13 Ma📊 stat

Causal Representation Learning with Optimal Compression under Complex Treatments

该论文针对多治疗场景下的个体治疗效应估计难题,提出了一种基于最优压缩的因果表示学习框架,通过推导新的泛化界确定最优平衡权重,并设计了具有 O(1) 可扩展性的“治疗聚合”策略及生成式架构 Multi-Treatment CausalEGM,在显著降低计算复杂度的同时实现了高精度的估计效果。

Wanting Liang, Haoang Chi, Zhiheng ZhangFri, 13 Ma📊 stat

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

本文提出了 EnTransformer,一种将随机学习范式"engression"与 Transformer 架构相结合的新型深度生成式框架,通过引入随机噪声并优化基于能量的评分目标,在不依赖参数假设的情况下实现了多变量时间序列的相干概率预测,并在多个基准数据集上展现出优于现有模型的校准性能。

Rajdeep Pathak, Rahul Goswami, Madhurima Panja, Palash Ghosh, Tanujit ChakrabortyFri, 13 Ma📊 stat

Bayesian Model Calibration with Integrated Discrepancy: Addressing Inexact Dislocation Dynamics Models

本文提出了一种新颖的贝叶斯模型校准方法,通过将模型差异重新定义为集成在模拟器内部的参数不确定性(而非 Kennedy 和 O'Hagan 方法中独立的“包罗万象”差异项),并利用高斯过程代理模型确保计算可行性,成功应用于将离散位错动力学模拟器的预测结果校准至分子动力学观测数据。

Liam Myhill, Enrique Martinez Saez, Sez RusscherFri, 13 Ma📊 stat

Low-Rank and Sparse Drift Estimation for High-Dimensional Lévy-Driven Ornstein--Uhlenbeck Processes

本文针对具有低秩加稀疏结构的高维 Lévy 驱动 Ornstein-Uhlenbeck 过程,提出了一种基于核范数与 1\ell_1 惩罚的凸估计量,并在特定正则性条件下推导了其非渐近 Oracle 不等式,证明了该方法能在保持离散化偏差的同时,通过利用结构特性显著改善估计风险对维度的依赖关系。

Marina PalaistiFri, 13 Ma📊 stat