TA-GGAD: Testing-time Adaptive Graph Model for Generalist Graph Anomaly Detection
该论文针对图异常检测中的跨域泛化难题,提出了一种名为 TA-GGAD 的测试时自适应图基础模型,通过定义并建模“异常异配性”(Anomaly Disassortativity)特征失配问题,实现了仅需单次训练即可在多个不同领域图上达到最先进的检测精度。
2393 篇论文
该论文针对图异常检测中的跨域泛化难题,提出了一种名为 TA-GGAD 的测试时自适应图基础模型,通过定义并建模“异常异配性”(Anomaly Disassortativity)特征失配问题,实现了仅需单次训练即可在多个不同领域图上达到最先进的检测精度。
该论文提出了一种结合差分隐私的零阶优化框架,将数据集压缩技术扩展至决策树和 Cox 回归等非可微临床模型,从而在保护患者隐私的同时实现了模型无关的临床数据共享。
本文提出了 M3GCLR 框架,通过建立无限骨架数据博弈模型、引入多视角旋转增强与时间平均锚点、构建强对抗极小极大博弈及双损失均衡优化器,有效解决了现有自监督骨架动作识别方法在视角差异建模、对抗机制及增强扰动控制方面的局限,并在多个基准数据集上取得了优于或持平最先进水平的性能。
该论文提出了一种名为 MIL-PF 的可扩展框架,通过结合冻结的基础模型编码器与轻量级的注意力机制多示例学习(MIL)聚合模块,在无需重新训练大型骨干网络的情况下,利用预计算特征高效解决了高分辨率乳腺 X 光影像分类中注释稀缺和计算成本高昂的挑战,并实现了临床规模下的最佳分类性能。
本文提出了 SPAARS 框架,通过结合课程学习策略,先在低维潜在空间进行安全高效的探索以规避重建损失带来的性能瓶颈,再无缝过渡到原始动作空间进行精细化利用,从而在离线到在线强化学习中显著提升了样本效率与最终性能。
本文提出了一种名为脉冲串谐振器(PTR)的可微分合成架构,通过直接建模基于物理的排气脉冲序列及其在谐振器中的传播,实现了比传统谐波加噪声基线模型更准确且具备物理可解释性的引擎声音合成。
本文介绍了 ICDAR 2025 端到端文档图像机器翻译竞赛,该竞赛通过 OCR 免提与 OCR 辅助两个赛道及不同规模模型子任务,吸引了 69 支团队参与,旨在推动复杂版本文档翻译研究并展示了大模型在该领域的巨大潜力。
该论文提出了全卷积扩散模型(FCDM),通过采用类似 ConvNeXt 的骨干网络,在显著降低计算成本、训练步数和硬件需求的同时,实现了与主流 Transformer 架构相媲美的生成性能,从而证明了现代卷积设计是高效扩展扩散模型的有效替代方案。
该论文提出了 PromptDLA,一种利用描述性知识作为线索、通过定制化提示将领域先验融入文档布局分析(DLA)的框架,有效解决了跨域数据直接合并训练导致的性能瓶颈,并在多个主流数据集上取得了最先进(SOTA)的泛化性能。
该论文提出了一种基于隐式最大似然估计(IMLE)的分布蒸馏框架,通过将条件流匹配(CFM)专家模型蒸馏为单步学生模型,在保留多模态动作分布的同时消除了迭代积分带来的延迟,实现了融合多模态感知的高频实时机器人轨迹控制。
该研究通过法语患者记录实验发现,大型语言模型会利用嵌入的社会决定因素刻板印象来做出基于性别的决策,表明评估社会决定因素之间的交互作用可有效补充现有的模型偏见评估方法。
该论文提出了“开放世界运动预测”这一新范式,通过构建首个端到端类增量运动预测框架,利用伪标签策略和基于查询特征方差的重放采样机制,在从相机图像直接预测轨迹的同时有效缓解了灾难性遗忘,实现了自动驾驶系统在动态变化环境中的持续适应与零样本迁移。
本文介绍了 CERES,这是一个首个集概率性、开放性、持续运行、机器可读及承诺公开前瞻性验证于一体的自动化急性粮食不安全早期预警系统,它通过融合多源数据每周为 43 个高风险国家生成 90 天后的危机、紧急和饥荒阶段概率预测。
该论文提出了包含道德困境中常识矛盾的新基准 CoMoral,发现当前大语言模型倾向于优先进行道德推理而忽视常识,且存在仅在矛盾由次要角色而非主要角色引发时才更易识别的叙事焦点偏差。
该论文提出了一种开放、透明且可复现的方法,利用领域知识与大语言模型构建了首个针对欧盟《人工智能法案》的评估数据集,涵盖风险分类、条款检索、义务生成及问答等任务,旨在解决 NLP 和 RAG 系统在合规性评估中缺乏自动化资源的问题。
本文提出了一种名为 OncoAgent 的新型指南感知 AI 代理框架,它能够将文本临床指南直接转化为三维靶区轮廓,在无需重新训练的情况下实现了食管癌等病例的零-shot 自动勾画,其性能媲美全监督基线模型且更受临床医生在指南依从性和可接受性方面的青睐。
本文提出了变分混合专家路由(VMoER)框架,通过将贝叶斯推理限制在专家选择阶段,在几乎不增加计算成本的情况下,显著提升了大规模混合专家模型在不确定性量化、路由稳定性及分布外检测方面的表现。
本文提出了 RoadLogic 这一开源工具,它通过结合答案集编程、运动规划及规范监控技术,成功将声明式的 OpenSCENARIO 规范自动转化为符合约束且多样化的可执行自动驾驶仿真场景,从而填补了现有方案在系统化实例化方面的空白。
该论文通过实证研究与基于率失真理论的分析,揭示了任务级模型合并崩溃现象,指出任务间表征的不兼容性是导致合并失败的关键因素,而非传统观点认为的参数空间冲突,并据此建立了任务可合并性的理论极限。
本文提出了 EvoDriveVLA,一种通过自锚点感知蒸馏和神谕引导轨迹蒸馏实现感知与规划协同优化的新型视觉 - 语言 - 动作模型,有效解决了自动驾驶中视觉编码器解冻后的感知退化及长期规划累积不稳定问题,并在开环和闭环评估中取得了最先进性能。