DINOv3 Visual Representations for Blueberry Perception Toward Robotic Harvesting
本文评估了 DINOv3 作为冻结骨干网络在蓝莓机器人采摘任务(如分割与检测)中的表现,指出其虽能通过轻量级解码器显著提升分割效果,但在处理尺度变化及空间聚合目标(如簇检测)时存在局限,因此更适合作为依赖下游空间建模的语义骨干而非端到端任务模型。
6475 篇论文
本文评估了 DINOv3 作为冻结骨干网络在蓝莓机器人采摘任务(如分割与检测)中的表现,指出其虽能通过轻量级解码器显著提升分割效果,但在处理尺度变化及空间聚合目标(如簇检测)时存在局限,因此更适合作为依赖下游空间建模的语义骨干而非端到端任务模型。
本文提出了一种结合事件触发控制障碍函数、控制李雅普诺夫函数及自适应攻击恢复机制的事件驱动安全弹性控制框架,旨在确保网联自动驾驶车辆在混合交通流中面对指数无界虚假数据注入攻击及人类驾驶车辆不确定性时,仍能实现安全的车道变换与稳定运行。
本文提出了一种名为广义单智能体优势估计器(GPAE)的多智能体强化学习新框架,该框架通过引入单智能体价值迭代算子和双截断重要性采样比率方案,在无需直接估计 Q 函数的情况下实现了稳定的离线策略学习与精准的信用分配,从而显著提升了复杂场景下的协调能力和样本效率。
本文提出了一种基于代理的评估框架,通过引入评估代理来确保逻辑推理任务评估的可复现性与鲁棒性,并在 FOLIO 数据集上验证了该方法下自动形式化代理在逻辑推理任务中显著优于思维链基线的表现。
本文提出了“必选边环覆盖问题”(RCCP)的 ASP 完备性框架,通过引入等效流模型实现了在矩形网格上的致密构造,从而解决了 MIT 难度小组提出的约束图可满足性(CGS)开放问题,完善了 Kakuro 等谜题的复杂度分类,并证明了 Chocona、Four Cells 等多个纸笔谜题的 ASP 完备性。
本文介绍了 Mica,一种基于 Arm CCA 的机密计算架构,它通过解耦机密性与信任,为不可信组件间的通信提供可验证的策略控制与隔离机制,从而在最小化可信计算基扩展的同时,确保敏感数据在分布式云工作流中不会泄露。
本文提出了 LDP-Slicing 框架,通过将图像像素分解为比特平面并结合感知混淆与隐私预算优化策略,在无需训练的情况下有效解决了本地差分隐私在图像数据上的高维效用损失问题,显著提升了下游任务的性能。
本文提出了名为 RISCBench 的基准测试套件及开放方法论,通过引入“持续瞬时吞吐量(SIT)”指标,旨在量化并评估 RISC-V 核心在 FPGA 及类 FPGA 异构计算引擎中作为编排引擎时的调度效率,以弥补传统峰值性能指标在反映系统实际持续行为方面的不足。
本文通过跨硬件架构和数据集的实证研究,对比了多种二进制浮点数转最短十进制字符串的算法,发现 Schubfach 和 Dragonbox 等现代技术在速度上比传统 Dragon4 快十倍,但现有实现(包括标准库)往往无法始终生成最短字符串且指令数远高于最优方案,从而为未来优化指明了方向。
本文通过设计科学研究,展示了全球解决方案倡议(GSI)D-Hub 平台如何利用可解释人工智能整合多源数据,有效解决多方协作中的信息不对称问题,从而构建了一个透明、可信且可扩展的全球发展生态系统。
该研究通过混合结构方程模型与多元线性回归分析,发现针对撒哈拉以南非洲移民的 AI 诈骗脆弱性主要受既往被 targeting 经历的影响,而 AI 内容识别能力及高验证行为则是显著的防护因素。
该论文提出了一种将伦理原则转化为可执行控制机制的“伦理设计”架构,通过在每个 AI 生命周期阶段实施包含性能、合规及可持续性指标的“三重门”机制,填补了现有治理框架在端到端操作控制方面的空白,从而为构建可验证、可落地的未来 AI 伦理治理体系提供了实践基础。
该研究利用因果推断方法分析发现,作者种族、性别及所属机构所在地(特别是全球南方)对论文录用排名存在显著的负面因果影响,凸显了在传统及人工智能辅助的同行评审中实施公平性干预的紧迫性。
该论文提出了一种利用状态分层多智能体架构结合大语言模型与小语言模型(SLMs)的 5G/6G 意图驱动网络编排新框架,实验表明两者在翻译精度上表现相当,但 SLMs 能将编排生命周期整体完成速度提升 20%。
针对虚拟现实环境中缺乏直接交互线索的背景物体状态变化检测难题,该论文提出了专用的 ObjChangeVR 数据集,并设计了结合视点感知、时序检索与跨视角推理的 ObjChangeVR 框架,显著提升了多模态大模型在此类任务上的表现。
该论文提出了一种基于扰动保真度(Perturbation Fidelity)的边际一致性框架,通过结合注意力加权聚合与边际感知训练,显著提升了侵入性肺腺癌全切片图像亚型分类在真实世界扰动下的鲁棒性与跨机构泛化能力。
该论文提出了 PaLMR 框架,通过构建感知对齐的数据层与过程对齐的优化层,解决了多模态大模型在强化学习中因过度关注最终答案而容忍推理过程幻觉的问题,从而显著提升了视觉推理的忠实度与可靠性。
该论文提出了一种名为 DAPR 的框架,通过结合数字孪生、异步联邦学习、GRU-VAE 预测模型和深度强化学习,优化了车联网边缘计算中的客户端选择与内容预测,从而显著提升了缓存命中率并降低了传输延迟。
本文提出了一种名为 FCBNet 的参数高效卷积模型,通过采用冻结的 ConvNeXt 骨干网络、特征校正模块(FCB)及轻量级解码器,在多种光谱模态下实现了超过 85% 的 mIoU 高精度杂草分割,同时显著降低了训练时间和参数量。
本文提出了 GameVerse 基准,通过引入“反思并重试”的范式,证明视觉语言模型能够像人类一样从视频反馈(包括失败轨迹和专家教程)中学习并优化游戏策略。