Mitigating Bias in Concept Bottleneck Models for Fair and Interpretable Image Classification

该论文针对概念瓶颈模型(CBM)在图像分类中存在的概念信息泄露及性别偏见问题,提出了包括 Top-k 概念过滤、移除偏见概念和对抗性去偏在内的三种缓解技术,显著提升了模型在公平性与性能之间的权衡,推动了可解释且公平图像分类的发展。

Schrasing Tong, Antoine Salaun, Vincent Yuan, Annabel Adeyeri, Lalana Kagal2026-03-09🤖 cs.LG

Reference-guided Policy Optimization for Molecular Optimization via LLM Reasoning

该论文针对大语言模型在分子优化任务中因缺乏轨迹数据而导致推理能力退化和奖励稀疏的问题,提出了一种名为 RePO 的参考引导策略优化方法,通过结合强化学习与参考分子引导的混合训练机制,在无需轨迹数据的情况下有效平衡了探索与利用,显著提升了分子优化的成功率与泛化性能。

Xuan Li, Zhanke Zhou, Zongze Li, Jiangchao Yao, Yu Rong, Lu Zhang, Bo Han2026-03-09🤖 cs.AI

A Persistent-State Dataflow Accelerator for Memory-Bound Linear Attention Decode on FPGA

本文提出了一种基于 FPGA 的持久状态数据流加速器,通过将 Gated DeltaNet 的完整循环状态驻留于片上 BRAM 并结合流水线数据流设计,成功将内存受限的线性注意力解码转化为计算受限任务,在 AMD Alveo U55C 上实现了比 NVIDIA H100 GPU 快 4.5 倍且能效高出 60 倍的解码性能。

Neelesh Gupta, Peter Wang, Rajgopal Kannan, Viktor K. Prasanna2026-03-09🤖 cs.LG

Who We Are, Where We Are: Mental Health at the Intersection of Person, Situation, and Large Language Models

该论文基于交互主义和建构主义心理学理论,提出了一种融合个体特质与情境特征的机器学习方法,利用大型语言模型分析社交媒体数据以预测心理健康状态,在保持竞争力的同时显著提升了模型的可解释性。

Nikita Soni, August Håkan Nilsson, Syeda Mahwish, Vasudha Varadarajan, H. Andrew Schwartz, Ryan L. Boyd2026-03-09🤖 cs.AI

Omni-Masked Gradient Descent: Memory-Efficient Optimization via Mask Traversal with Improved Convergence

本文提出了一种名为 Omni-Masked Gradient Descent (OMGD) 的内存高效优化方法,该方法通过掩码遍历机制在无需额外显存开销的情况下,将非凸优化场景下的迭代复杂度从 O(ϵ4)\mathcal{O}(\epsilon^{-4}) 严格提升至 O~(ϵ3)\tilde{\mathcal{O}}(\epsilon^{-3}),并在大语言模型的预训练与微调任务中展现出优于基线的性能。

Hui Yang, Tao Ren, Jinyang Jiang, Wan Tian, Yijie Peng2026-03-09🤖 cs.LG

Agnostic learning in (almost) optimal time via Gaussian surface area

本文改进了Klivans等人关于高斯表面面积与L1L_1多项式逼近度之间关系的分析,将高斯分布下概念类的伪多项式逼近度从O(Γ2/ε4)O(\Gamma^2 / \varepsilon^4)提升至O~(Γ2/ε2)\tilde O(\Gamma^2 / \varepsilon^2),从而在统计查询模型中实现了多项式阈值函数伪学习复杂度的(近)最优界。

Lucas Pesenti, Lucas Slot, Manuel Wiedmer2026-03-09🤖 cs.LG