PDD: Manifold-Prior Diverse Distillation for Medical Anomaly Detection
本文提出了 PDD 框架,通过结合 VMamba 与 Wide-ResNet 的双教师先验、流形匹配统一模块及多样化蒸馏策略,有效解决了医学图像中细微异质异常检测的难题,并在多个数据集上取得了显著优于现有最先进方法的性能。
4040 篇论文
本文提出了 PDD 框架,通过结合 VMamba 与 Wide-ResNet 的双教师先验、流形匹配统一模块及多样化蒸馏策略,有效解决了医学图像中细微异质异常检测的难题,并在多个数据集上取得了显著优于现有最先进方法的性能。
这篇教程以扩展特殊欧几里得群 SE₂(3) 的李群理论为基础,系统介绍了面向控制的辅助惯性导航系统,通过明确不变性与对称性的作用,构建了融合惯性测量与辅助信息的几何框架,并探讨了高阶状态表示、同步观测器设计及等变滤波等现代扩展方法。
该论文提出了名为 CanoVerse 的包含 32 万个 3D 对象的超大规模标准化数据集及高效对齐框架,通过解决 3D 资产的方向歧义问题,显著提升了 3D 生成稳定性、跨模态检索精度及零样本点云姿态估计能力。
该论文针对现有生成式视频世界模型无法模拟“视线外”动态演化的问题,提出了名为 LiveWorld 的新框架,通过引入持久化全局状态和基于监控的机制,实现了物体在未被观测时仍能持续演化并在重访时保持时空一致性的 4D 动态世界模拟。
该论文提出了一种结合结构变迁路径与动态网络建模的过渡态理论框架,旨在刻画并预测网络结构变化,并证明在有限假设下可利用横截面模型近似预测小群体派系重组等过程。
本文提出了基于坎贝尔“盲变与选择性保留”理论的多角色协作系统 NarrativeLoom,通过让 AI 生成多样化叙事选项并由用户筛选,显著提升了合作创作故事在专家评估中的流畅性、灵活性、原创性和精致度等创造力维度,且该系统对写作新手尤为有益。
该论文提出了一种在推理阶段通过最大化模型内部“自我确定性”来最小化不确定性的新方法,该方法在思维层面而非词元层面进行选择,以少量采样显著提升了大语言模型在数学推理任务中的表现,并揭示了早期推理步骤的确定性对最终准确性的关键预测作用。
本文提出了 PromptGate,一种针对开放集联邦主动学习的动态视觉语言模型门控框架,通过联邦类特定上下文优化在保护隐私的同时自适应本地临床领域,有效过滤分布外噪声并显著提升标注数据纯度。
本文提出了 RoTri-Diff,一种通过显式建模机器人 - 物体三角交互(RoTri)几何约束并结合分层扩散过程,以解决双臂协作中碰撞与不稳定问题、显著提升双臂操作性能的模仿学习框架。
该论文提出了一种名为 ACD-U 的框架,通过结合非对称协同教学(利用预训练 CLIP Vision Transformer 与 CNN 的互补特性)和基于损失轨迹及 CLIP 一致性检查的机器遗忘机制,实现了从被动避免错误到主动修正错误的范式转变,从而在含噪标签数据上取得了最先进的鲁棒性表现。
该研究提出了一种可视化框架,系统评估了基于 Transformer 的计算病理学模型中的类别可视化与激活图谱,揭示了模型在不同标签粒度下对组织形态学概念的学习结构,并证实了这些可视化方法在反映专家共识与内在病理复杂性方面的有效性。
该论文提出了一种利用图神经网络预测 SAT 求解器初始分支顺序的预处理方法,在随机 3-CNF 和伪工业基准测试中显著提升了求解速度并展现出良好的泛化能力,但在更复杂的工业实例上因求解器动态启发式策略的覆盖及实例复杂性而效果有限。
该论文提出了 GFM-Retriever,一种利用预训练图基础模型进行跨域检索并结合信息瓶颈原理筛选最小充分子图的框架,旨在解决 GraphRAG 在冷启动场景下的检索冗余与不完整问题,从而实现高效且可解释的多跳推理。
本文提出了名为 FreeFly-Thinking 的端到端无人机视觉语言导航框架,通过构建专用数据集、引入思维链推理机制以及采用监督微调与强化微调的两阶段训练策略,有效解决了复杂户外场景中无人机依据自然语言指令进行连续导航的难题。
该论文针对现有方法在记录创意活动轨迹时缺乏意图与高层级创意决策关联的问题,提出了三种互补方案,分别通过节点式界面管理生成式 AI 状态、构建可视化创作词汇以及将语义历史嵌入交互状态,以更好地捕捉和解读跨领域的创意实践。
这项针对加纳大学生的混合方法研究表明,在混合式学习环境中,学生因便利性、易用性及社交普及度等因素,更倾向于使用 WhatsApp 和 Telegram 等即时通讯工具而非机构学习管理系统,凸显了将数字学习策略与学生实际数字习惯相契合的重要性。
本文针对自主智能体面临的提示注入等执行层漏洞,提出了包含沙箱隔离、意图验证、零信任授权及审计日志的四层治理架构(LGA),并通过构建双语基准测试与多模型实验,验证了该架构在保持低延迟的同时能有效拦截绝大多数恶意工具调用。
该论文提出了无需训练的 FastSTAR 框架,通过结合时空相似性评估的 Token 剪枝与部分更新机制,有效解决了时空自回归视频生成中的“Token 爆炸”问题,在保持高质量的同时实现了最高 2.01 倍的加速。
该论文提出了“重解强化学习”(Re²)方法,通过让大语言模型在推理过程中学会灵活放弃低效路径并重新解题,从而在无需监督微调的情况下显著提升其推理性能并解决过度思考问题。
该论文提出了一种名为 Gate-SDF 的神经符号距离场,通过将其与基于 GPU 并行计算的模型预测路径积分(MPPI)控制器相结合,实现了无需预定义轨迹或精确门框位姿估计的、能够应对任意位置与姿态门框的鲁棒且高速的自主无人机竞速。