Mitigating the Multiplicity Burden: The Role of Calibration in Reducing Predictive Multiplicity of Classifiers
本文基于九个信贷风险基准数据集的实证分析表明,后验校准(特别是 Platt 缩放和等温回归)能有效降低分类器在 Rashomon 集合内的预测多重性,从而缓解算法任意性并提升程序公平性。
3552 篇论文
本文基于九个信贷风险基准数据集的实证分析表明,后验校准(特别是 Platt 缩放和等温回归)能有效降低分类器在 Rashomon 集合内的预测多重性,从而缓解算法任意性并提升程序公平性。
该论文提出了一种基于条件归一化流的异常检测方法,通过在潜在空间引入显式归纳偏置并约束其遵循预设的时间动态,将异常检测转化为对潜在轨迹分布的统计一致性检验,从而有效解决了传统基于观测空间似然的方法难以识别违背时序结构异常的问题。
本文提出了一种基于自由能的社会多臂老虎机学习算法,使智能体能够在无需奖励信息或先验规范的情况下,自主评估并有效利用非专家及多样化同伴的行为策略,从而在保持对数遗憾的同时显著提升个体学习性能。
该论文通过将导航视为受记忆约束的序贯决策问题,扩展了信息嗅探理论,提出用户基于局部与全局线索进行“适度”检查而非全盘扫描的模型,成功解释了试错导航中的 premature 选择、误入歧途及回退恢复等关键行为。
本文证明了在-集半带问题中,结合特定分布(Fréchet 和 Pareto)与几何重采样的 Follow-the-Perturbed-Leader (FTPL) 算法,不仅能在对抗和随机设置下分别达到最优的对数遗憾,实现“双世界”最优性,还将计算复杂度从降低至。
该论文从学习理论视角出发,通过引入“重放对手”模型,精细刻画了生成式语言模型在训练数据混入自身历史输出(即模型崩溃)时的学习极限,揭示了重放机制虽不影响最强的一致性生成,却会破坏较弱的非一致性及极限生成能力,从而从理论上验证了数据清洗等实践策略的有效性及其局限性。
该论文提出了一种无需先验知识的无监督方法,使具身智能体能够自主发现动作空间的对称群结构,并证明了在最小假设下真实对称群分解的可识别性,从而实现了更优的线性对称解耦表示学习。
该论文通过揭示 LiRA、RMIA 和 BASE 等主流成员推理攻击均属于具有不同分布假设的指数族对数似然比框架,进而提出了基于共轭先验的贝叶斯方差推断攻击(BaVarIA),有效解决了小影子模型预算下的方差估计瓶颈,在多个数据集和预算设置下实现了优于现有方法的稳定性能。
该论文提出了 OSMDA 框架,通过利用基础视觉语言模型将遥感图像与 OpenStreetMap 渲染图配对并自动生成富含元数据的描述,实现了无需人工标注或更强教师模型即可完成的遥感领域自适应,并在多项基准测试中取得了优于现有方法的性能。
本文旨在为新兴的四元数机器学习领域奠定基础,系统阐述了用于建模四元值随机过程的增强统计理论、利用该统计特性的广泛线性模型、算法推导所需的四元数微积分与代数,以及实际应用中至关重要的均方估计方法。
本文提出了逆神经算子(INO)框架,通过结合条件傅里叶神经算子重构轨迹与摊销漂移模型在参数空间进行无梯度优化,实现了从稀疏观测中高效、准确地反演常微分方程参数,在保持高精度的同时将推理速度提升了 487 倍。
该论文提出了一种面向多站部署的 WiFi 信道状态信息(CSI)感知框架,通过结合跨模态自监督预训练以学习对站点特征缺失具有不变性的表征,并引入站点级掩码增强策略,有效解决了实际应用中站点特征缺失与标注数据稀缺的双重挑战。
该论文通过识别时间序列预测中的三大分布偏移挑战,利用消融研究揭示可逆实例归一化(RevIN)中部分组件的冗余或负面影响,从而提出了提升其鲁棒性与泛化能力的新视角。
FlexRec 是一种基于强化学习的后训练框架,通过引入基于反事实交换的因果项级奖励和不确定性感知的批评引导缩放机制,有效解决了大语言模型推荐系统在序列奖励稀疏噪声下的训练难题,从而实现了针对动态需求的灵活适应与显著性能提升。
该论文针对多治疗场景下的个体治疗效应估计难题,提出了一种基于最优压缩的因果表示学习框架,通过推导新的泛化界确定最优平衡权重,并设计了具有 O(1) 可扩展性的“治疗聚合”策略及生成式架构 Multi-Treatment CausalEGM,在显著降低计算复杂度的同时实现了高精度的估计效果。
本文提出了 EnTransformer,一种将随机学习范式"engression"与 Transformer 架构相结合的新型深度生成式框架,通过引入随机噪声并优化基于能量的评分目标,在不依赖参数假设的情况下实现了多变量时间序列的相干概率预测,并在多个基准数据集上展现出优于现有模型的校准性能。
该论文针对现有化学理解任务局限于静态分子表征的不足,提出了旨在将 4D 分子轨迹转化为可解释自然语言描述的“化学动力学理解(ChemDU)”新任务,并构建了首个相关基准数据集 Chem4DBench 及统一模型 Chem4DLLM,以推动动态化学理解与多模态科学推理的研究。
本文提出了面向移动端算子生成的评估框架 MobileKernelBench 及多智能体系统 MoKA,旨在解决大模型在移动端内核生成中面临的编译失败率高和性能提升有限等挑战,实验表明 MoKA 能将编译成功率提升至 93.7% 并使 27.4% 的生成算子实现加速。
该论文提出了 ProtoSR 方法,通过利用指令微调大语言模型从海量非结构化放射学报告中挖掘细粒度知识并构建多模态原型库,进而指导结构化报告生成模型进行预测修正,从而在 Rad-ReStruct 基准上实现了细粒度图像理解与结构化报告生成的最先进性能。
该研究通过对 Geneformer 单细胞基础模型进行全电路映射、高阶组合消融和因果轨迹引导实验,揭示了其内部存在严重的特征冗余、重尾枢纽架构以及未注释的生物学偏差,并证实了模型层位置对细胞分化方向具有因果控制作用。