Overcoming Representation Bias in Fairness-Aware data Repair using Optimal Transport
本文提出了一种基于贝叶斯非参数停止规则的公平感知数据修复方法,通过构建最优传输量化算子有效克服了代表性偏差并实现了对档案数据的修复,同时引入了新的公平分布目标定义以平衡公平性与数据保真度。
2316 篇论文
本文提出了一种基于贝叶斯非参数停止规则的公平感知数据修复方法,通过构建最优传输量化算子有效克服了代表性偏差并实现了对档案数据的修复,同时引入了新的公平分布目标定义以平衡公平性与数据保真度。
本文提出了一种完全无监督的表示学习方法,通过将潜在变量的概率流模型分解为稀疏激活的旋转场和势场,从而学习出由独立变换基元构成的解耦表示,并在序列变换数据集上实现了领先的数据似然度和近似等变性误差表现。
该论文提出了一种基于控制障碍函数和可微优化的数据驱动方法,通过量化智能体为安全交互而调整自身行为的意愿(即责任分配),从数据中学习并解释多智能体交互中的安全规范。
本文综述了机器学习在数值卡拉比 - 丘度量中的应用,并提出了一种结合唐纳森算法与在格拉斯曼流形上执行梯度下降的新方法,通过寻找高效截面子空间来计算里奇平坦近似,并在德沃克族三维流形上验证了该方法并观察到模参数变化时非平凡局部极小值的出现。
本文提出自适应重要性采样和分层子采样两种估计器,在高维稀疏回归中有效应对重尾噪声、-污染及-混合依赖性,填补了理论与算法间的空白,实现了最小化最优收敛率并提供了有效的坐标置信区间。
该论文提出了一种名为 SMPNN 的新型可扩展图神经网络架构,通过将标准卷积消息传递机制集成到预归一化 Transformer 块中替代注意力机制,不仅克服了传统图神经网络因过平滑而难以构建深层网络的局限,还在无需计算昂贵的注意力机制的情况下,在大规模图表示学习任务中实现了与最先进模型相当甚至更优的性能。
本文针对脑电信号中无标签目标域适应面临的标签分布偏移挑战,提出了一种基于信息最大化原则的参数高效流形优化策略 SPDIM,通过引入新颖的生成模型并修正传统黎曼统计对齐方法的局限性,在睡眠分期等实际场景中显著提升了泛化性能。
该论文提出了一种基于无监督学习的双阶段框架,利用未标记的故障数据联合识别深空栖息地中的潜在故障模式并筛选关键传感器,从而在缺乏先验知识的情况下实现更准确的剩余寿命预测。
本文提出了一种名为 MS-HGNN 的形态对称等变异质图神经网络,通过将机器人运动学结构与形态对称性作为约束嵌入架构,实现了在多种多体动力学系统(包括四足机器人)中高效且泛化能力强的动力学学习。
该论文提出了一种基于可操作 3D 关系对象图的移动机器人探索系统,通过编码多样化的物体关系并实现主动交互,有效克服了现有方法在大规模移动探索空间中的局限性,并在泛化性和性能上超越了仅依赖视觉语言模型的方法。
该研究通过在 132 个数据集上的实验证明,基于简单分子指纹的轻量级模型在肽功能预测任务中表现优于复杂的图神经网络和 Transformer 模型,从而挑战了必须建模长程相互作用才能准确预测肽性质的传统假设。
本文介绍了专为光变曲线设计的 Astromer 2 基础模型,该模型通过在 MACHO 巡天数据上进行自监督预训练并引入加权样本嵌入技术,在分类任务中显著优于其前代模型,特别是在小样本场景下展现了卓越的泛化能力。
该论文提出了一个统一框架来量化个性化对机器学习模型预测和解释的影响,揭示了二者可能产生分歧,并推导了检测个性化效应的统计界限,指出在特定数据集下某些效果本质上不可检验,从而强调了联合评估预测与解释及设计具备充分信息的数据集的重要性。
该论文通过引入数据集的“空间签名”概念,将半值法数据估值中的效用选择问题转化为低维空间中的线性泛函问题,并提出了一种实用的鲁棒性度量方法,以量化和评估效用变化对数据估值结果的影响。
本文提出了一种基于无似然推断的端到端 Real2Sim2Real 框架,通过利用视觉和本体感知数据估计可变形线性物体(DLO)物理参数的后验分布以进行域随机化训练,实现了无需微调即可将模拟中训练的策略零样本迁移至真实世界的 DLO 操控任务。
本文提出了一种基于特征重要性重缩放(FIR)的理论方法,通过根据特征离散度调整其贡献来抑制噪声,从而显著提升了高维或含噪高斯混合数据中聚类有效性指标与真实标签之间的相关性及评估鲁棒性。
本文提出了“功能单元”这一新概念,旨在弥合传统“成分 - 微观结构”范式向数据驱动的人工智能范式转型过程中的认知鸿沟,通过梳理研究范式的演变、阐述功能单元在多尺度设计中的关键作用,并探讨其融入 AI 驱动材料创新的路径与挑战,从而为材料科学研究提供新视角。
本文提出了 HyConEx,这是一种专为表格数据设计的基于深度超网络的分类模型,它能够同时输出预测结果和将样本导向替代类别的局部反事实解释,从而实现了预测与解释的一体化。
本文通过混合整数线性规划构建全局最优模型树,在多个基准数据集上验证了其在保持高可解释性的同时,能以极小的树结构实现与贪婪算法及主流模型相媲美的预测精度,并进一步探讨了多变量分裂对准确率与可解释性的权衡影响。
本文从决策理论的后果主义视角出发,批判了机器学习领域过度依赖固定阈值评估的现状,提出应优先采用 Brier 分数等严格评分规则,并通过构建决策框架、开发 Python 工具包及改进算法来弥合理论与实践的差距。