A Systematic Comparison of Training Objectives for Out-of-Distribution Detection in Image Classification
该论文在 OpenOOD 标准协议下,系统比较了交叉熵、原型、三元组及平均精度四种训练目标在图像分类中的分布外检测性能,发现交叉熵损失在保持分布内精度的同时,能提供最为稳健的近域与远域分布外检测效果。
4842 篇论文
该论文在 OpenOOD 标准协议下,系统比较了交叉熵、原型、三元组及平均精度四种训练目标在图像分类中的分布外检测性能,发现交叉熵损失在保持分布内精度的同时,能提供最为稳健的近域与远域分布外检测效果。
该论文提出了一种基于生成对抗网络与残差自编码器的半监督异常检测框架,通过仅使用标称样本训练,成功在制药行业高速吹灌封(BFS)生产线上实现了满足 500 毫秒时序约束的高精度在线缺陷检测与定位。
该论文提出了难度缩放的分段式 GRPO(DSS-GRPO)方法,通过将奖励信号分解为思维与回答两个独立部分并施加难度感知调整,在有效压缩思维链长度的同时避免了模型回答质量的下降。
该论文提出了一种名为 SMAT 的四阶段多智能体训练课程,通过模拟人类自然适应过程来训练髋部外骨骼控制器,使其在无需针对特定用户重新训练的情况下,即可在物理实验中实现一致的辅助效果并显著降低肌肉激活度。
该论文提出了一种基于 NVIDIA Omniverse 构建的阿尔及尔国际机场高保真数字孪生体的合成数据生成管道,用于解决行李推车检测中的隐私与数据多样性难题,实验表明结合少量真实标注数据的混合训练策略在显著降低标注成本的同时,其检测精度(mAP@50 达 0.94)可媲美甚至超越全量真实数据基线。
本文提出了名为 AtomicVLA 的统一规划与执行框架,通过技能引导的混合专家模型(SG-MoE)和灵活路由编码器构建可扩展的原子技能库,有效解决了现有视觉 - 语言 - 动作(VLA)模型在长程任务规划、多步问题解决及持续技能学习方面的局限性,并在仿真与真实世界实验中显著超越了现有基线模型。
本文提出了 Ref-DGS 框架,通过解耦表面重建与镜面反射,利用几何高斯、局部反射高斯及全局环境反射场,在不依赖显式光线追踪的情况下高效实现了包含近场强镜面反射场景的高质量重建与新视图合成。
该研究开发了一种结合高斯混合变分自编码器与皮尔逊相关系数的 AI 驱动方法,成功从稀疏采样的扫描透射 X 射线显微镜数据中实现了钠离子电池正极材料(NaₓV₂(PO₄)₂F₃)在充放电过程中纳米级多相分布与演变的精准识别与映射。
这篇论文系统综述了 2022 年至 2026 年初大语言模型智能体中的记忆机制,通过构建“写入 - 管理 - 读取”循环框架与三维分类体系,深入探讨了五种核心记忆技术、评估范式的演进、关键应用场景及工程挑战,并展望了持续巩固、因果检索等未来前沿方向。
该论文提出了一种利用运动矢量、残差图和帧类型等压缩域信息的 CDA-VSR 网络,通过运动矢量引导的可变形对齐、残差门控融合及帧类型感知重建模块,在 REDS4 数据集上实现了比现有最先进方法 TMP 更高的重建质量(PSNR 提升 0.13 dB)和两倍以上的推理速度,从而解决了带宽受限场景下在线视频超分辨率实时处理的难题。
本文提出了 TDM-R1,一种基于轨迹分布匹配(TDM)的新型强化学习范式,通过解耦奖励学习与生成器训练并引入每步奖励信号,成功解决了少步扩散模型无法利用非可微奖励(如人类偏好)进行优化的难题,在文本渲染、视觉质量及偏好对齐等任务中实现了最先进的性能。
该论文介绍了 VoiceSHIELD-Small,这是一种基于 Whisper-small 的轻量级实时模型,能够同步完成语音转录与恶意内容检测,在保持低延迟的同时实现了 99.16% 的高准确率,旨在解决语音交互中的新兴安全风险。
该论文介绍了专为英国穆斯林女性设计的文化敏感型代理 AI 应用"YAQIN",通过结合伊斯兰心理学与用户共创方法,利用基于检索增强生成的聊天机器人和引导式日记功能,有效填补了现有心理健康服务在文化适配性上的空白,从而提升了该群体的信任度与参与度。
该研究通过在双臂老虎机任务中测试大语言模型,发现其在不同奖励条件下均表现出将位置偏好放大为僵化决策策略的鲁棒性偏差,且这种由低学习率和高逆温度导致的过度利用行为难以通过常规解码参数调整消除,进而揭示了这些偏差可能深刻影响人机协作的潜在机制。
该研究提出了一种新颖的多智能体架构,通过分工协作将用户描述转化为可执行的 OpenSeesPy 脚本,有效解决了大语言模型在复杂多步结构建模中的幻觉与误差累积问题,并在基准测试中实现了极高的准确率与可扩展性。
该论文通过构建涵盖多种问题类型和参数规模的自然语言离散优化数据集,评估了包括 Llama-3 系列和 ChatGPT 在内的不同大语言模型及思维链(CoT)方法的性能,发现强模型表现更优但 CoT 并非总是有效,且数据扰动虽能提升简单问题的表现却引入了不稳定性,从而为自动化求解离散优化问题提供了基准评估与实用建议。
本文提出了一种名为 FedShift 的新型两阶段“藏与寻”分布式对抗攻击方法,通过在联邦图学习训练前注入隐藏移位器并在训练后利用全局模型高效生成扰动,在显著降低时间成本的同时实现了高攻击成功率并有效规避了主流防御算法。
该论文提出了一种名为 DECADE 的无监督扩散模型,通过引入时间一致性约束,有效解决了铷 -82 动态心脏 PET 成像中因缺乏配对数据和高噪声导致的去噪难题,在提升图像质量的同时保持了血流动力学参数的定量准确性。
本文介绍了 QuadAI 团队在 SemEval-2026 任务 3 中提出的系统,该系统通过集成学习将结合回归与分类头的混合 RoBERTa 编码器与大语言模型(LLM)相结合,利用预测级堆叠显著提升了多维方面情感分析的性能。
ProgAgent 提出了一种结合进度感知奖励学习与 JAX 原生高吞吐架构的持续强化学习智能体,通过从无人标注专家视频中提取密集奖励、引入对抗性正则化以应对分布偏移,并融合 PPO 与核心集回放等机制,有效解决了机器人终身学习中的灾难性遗忘与奖励指定难题,在多个基准测试及真实机器人任务中显著超越了现有基线。