Beyond Attention Heatmaps: How to Get Better Explanations for Multiple Instance Learning Models in Histopathology
该论文提出了一种无需额外标签的通用框架来评估多重实例学习(MIL)热图的质量,并通过大规模基准测试发现扰动法、层相关传播(LRP)和积分梯度(IG)等方法优于传统的注意力热图,从而验证了改进的可解释性对于提升数字病理模型可靠性及获取生物学洞察的重要性。
10410 篇论文
该论文提出了一种无需额外标签的通用框架来评估多重实例学习(MIL)热图的质量,并通过大规模基准测试发现扰动法、层相关传播(LRP)和积分梯度(IG)等方法优于传统的注意力热图,从而验证了改进的可解释性对于提升数字病理模型可靠性及获取生物学洞察的重要性。
该论文提出了一种结合 Koopman 算子(通过 EDMD 近似)与波变换特征及 Transformer 架构的心电图分类方法,研究发现虽然简单的特征混合未带来提升,但通过优化径向基函数字典构建的 Koopman 特征在四分类任务中表现优于波变换基线及混合系统,有效展示了将动力系统理论融入时间序列分类的潜力。
该论文提出用固定的参数化沃尔什 - 阿达玛变换替代多头注意力中的密集输出投影,在消除约 25% 注意力参数并显著降低内存与推理成本的同时,保持了模型在标准基准测试上的性能甚至略有提升。
本文提出了一种针对时间序列分类问题的新型反事实解释生成方法,通过在输入空间进行梯度优化并结合软动态时间规整(soft-DTW)与k近邻约束,有效生成了兼具有效性、稀疏性、邻近性以及符合真实时间分布结构的高可信度反事实样本。
该论文通过证明在线均值差估计量与带有最优控制变量的离线逆倾向评分估计量等价,以及回归调整方法与双重鲁棒估计的结构一致性,统一了在线实验与离线策略评估中常用的方差缩减方法。
该论文通过博弈论分析指出,现有基准测试因缺乏纳什均衡而导致开发者策略性“刷榜”的激励错位问题,并证明采用“先调优后测试”的新评估协议可在温和条件下构建出唯一纳什均衡,从而确保模型排名真实反映其潜在质量。
该论文提出了一种基于分数阶微积分中加权分数阶魏尔积分的优化算法,通过引入动态加权的历史梯度记忆机制替代瞬时梯度,有效解决了极度不平衡数据(如金融欺诈检测)中的过拟合问题,并显著提升了模型性能。
该论文揭示了大语言模型具有类似变色龙的内在行为可塑性,并提出了一种名为 Token-Conditioned Reinforcement Learning (ToCoRL) 的框架,通过利用基于 Token 前缀的条件生成与强化学习,将推理时的行为适应转化为稳定的可学习模式,从而在不损害模型能力的情况下实现精确的行为控制(例如让擅长推理的模型也能高效回答事实性问题)。
该论文针对离线多智能体强化学习中非线性价值分解导致的训练不稳定问题,提出了一种保持贝尔曼不动点的尺度不变价值归一化(SVN)方法,并结合对关键组件交互的分析,总结出一套能够充分释放离线多智能体强化学习潜力的实用方案。
本文提出了几何约束异常值合成(GCOS)框架,通过在特征空间中生成符合流形结构的虚拟异常值并结合对比正则化,显著提升了深度神经网络在近分布异常检测任务中的鲁棒性,并支持向具有统计误差保证的共形异常检测扩展。
该论文提出了一种结合双层优化与混合演员 - 评论家架构的元强化学习框架,通过共享状态特征提取器和参数共享机制显著提升了样本效率与任务适应性,并在近十年的真实建筑能源管理系统数据上验证了其优于传统方法的快速适应能力。
该论文提出了 SYNAPSE 框架,这是一种无需重新训练的系统性方法,通过提取 CLS 表示、训练轻量级线性探针及前向钩子干预,实现了对 Transformer 模型内部神经元行为的跨领域分析与扰动测试,揭示了其内部表征的冗余稳定性与特定类别的脆弱性。
本文介绍了 IronEngine,这是一个围绕统一编排核心构建的通用 AI 助手平台,通过创新的三阶段流水线、分层记忆架构及自适应模型管理,实现了高效的任务规划与执行,并在文件操作基准测试中展现出卓越的性能。
该论文提出了一种名为 GRACE 的自适应动态扩展框架,通过“增长、评估、压缩”的循环策略,在类增量学习中有效平衡了模型的可塑性与稳定性,在实现顶尖性能的同时将内存占用降低了高达 73%。
这项前瞻性临床可行性研究表明,在真实世界的初级保健环境中,由人工实时监督的 AMIE 对话式 AI 在安全性、患者满意度及诊断准确性方面表现良好,且其诊断与管理计划质量与初级保健医生相当,但在治疗方案的实用性和成本效益方面仍略逊一筹。
LycheeCluster 提出了一种结合边界感知分块与基于三角不等式的递归分层索引的新型 KV 缓存管理方法,通过将检索过程从线性扫描优化为对数级剪枝,在几乎不损失模型性能的前提下实现了高达 3.6 倍的端到端推理加速。
该论文通过研究世界模型在连续观测漂移下的自监控机制,揭示了检测阈值的普遍存在性及其受噪声基底、检测器与环境动态三者交互决定的本质,同时指出了正弦漂移的不可检测性以及“崩溃先于感知”的不可监控失效模式。
本文提出了一种基于自适应熵驱动的传感器选择策略的异构多传感器融合粒子滤波器,用于在固定沿海平台上实现单船跟踪,并通过在塞浦路斯阿依纳帕码头的实地部署验证了该方法能在不同距离和传感器可用性条件下,通过动态切换模态在跟踪精度与连续性之间取得最佳平衡。
本文提出了名为 MedCertAIn 的预测不确定性框架,该框架利用自监督潜在表示中的跨模态相似性和模态特定数据损坏来构建数据驱动的先验,从而显著提升了基于 MIMIC-IV 和 MIMIC-CXR 多模态临床数据的住院风险预测性能及不确定性量化能力。
该论文通过引入条件信息瓶颈(CIB)原理,将推理过程重构为一种在保留任务关键信息前提下的有损压缩问题,提出了一种基于语义惊讶度的强化学习目标,从而在显著降低推理成本的同时有效避免了传统预算强制方法对关键逻辑的误删。