Robotic Foundation Models for Industrial Control: A Comprehensive Survey and Readiness Assessment Framework
这篇论文全面综述了机器人基础模型(RFM)的工业适用性,提出了包含 149 项具体标准的评估框架,并通过大规模评估发现当前 RFM 在工业领域的成熟度有限且发展不均衡,强调未来的进步应依赖于将安全、实时性、鲁棒感知及系统集成等要素系统性地纳入可审计的部署堆栈中。
3853 篇论文
这篇论文全面综述了机器人基础模型(RFM)的工业适用性,提出了包含 149 项具体标准的评估框架,并通过大规模评估发现当前 RFM 在工业领域的成熟度有限且发展不均衡,强调未来的进步应依赖于将安全、实时性、鲁棒感知及系统集成等要素系统性地纳入可审计的部署堆栈中。
本文提出了一种名为 XMACNet 的可解释轻量级注意力 CNN 模型,通过融合可见光图像与植被指数并引入 StyleGAN 数据增强,在辣椒病害分类任务中实现了高精度、强可解释性及边缘部署能力。
本文提出了名为 EarthBridge 的高保真跨模态图像翻译框架,通过结合非马尔可夫桥过程扩散模型与对比无配对学习方法,在第四届多模态航拍图像挑战赛翻译赛道中取得了第二名的优异成绩。
本文提出了一种基于梯度的嵌套共设计框架,通过结合最优控制规划器与神经代理气动模型,实现了对固定翼滑翔机气动外形与控制策略的联合优化,从而在显著缩短计算时间的同时,有效提升了其在复杂动态任务(如停栖和短距着陆)中的性能。
本文提出了 HiDE 框架,通过构建分层外部先验字典进行级联检索,并结合上下文感知的参数估计网络,有效解决了现有方法中外部先验利用不充分的问题,显著提升了学习式图像压缩的编码效率。
该论文提出了一种结合空间填充曲线(Morton 和 Hilbert 曲线)重排序与线性八叉树的高效 3D 点云邻域搜索方法,通过引入 kNN 局部性直方图优化缓存访问,实现了比现有方案快 10 倍的搜索速度及高达 36 倍的并行加速比。
该论文提出了一种结合 RRT 式搜索、基于采样的模型预测控制以及稳定状态流形采样策略的新方法,旨在通过黑盒仿真引导探索,从而在无需特定任务指导的情况下,为不同机器人形态生成多样化的长程操作策略。
本文提出了 HybridMimic 框架,通过让学习策略动态预测连续接触状态和期望质心速度来调节基于质心模型的控制器,从而在 Booster T1 人形机器人硬件实验中实现了比现有强化学习基线更低的跟踪误差和更强的动态适应性。
该论文提出了一种利用虚拟现实收集眼动数据训练预测模型,并通过从仿真到物理实机的多层级控制器筛选框架,成功开发出需个性化定制的凝视驱动辅助颈外骨骼系统,以解决垂头综合征患者的头部运动支持难题。
该论文提出了 AceMAD 框架,通过利用真理持有者能预判群体错误而幻觉多数者无法察觉的认知势能不对称性,将多智能体辩论从易陷入错误共识的“鞅诅咒”随机游走转化为具有正向漂移的定向收敛过程,从而在初始多数意见错误时仍能准确提取稀疏的真实信号。
该论文提出了一种结合 VGG19、Efficient-Net 和 ResNet50 提取特征并由 Bi-LSTM 进行分类的混合机器学习模型,用于基于新生儿脑部 MRI 图像早期检测脑瘫,其 98.83% 的准确率优于多个单独使用的预训练模型。
该论文针对当前 AI 评估方法难以反映实际运营现状的问题,提出了“情境规范”(context specification)这一流程,旨在将模糊的利益相关者视角转化为明确的可测量构念,从而为组织在真实部署环境中制定明智的 AI 决策和评估提供基础路线图。
该论文指出,在去中心化多智能体强化学习中,由于将同伴策略纳入世界边界会引发非平稳性,导致跨回合的不变决策核心(Invariant Core)可能收缩或消失,从而将此类问题重新定义为一种源于“智能体 - 世界”边界漂移的持续学习挑战。
本研究利用人工智能辅助技术,构建了涵盖 2005 至 2026 年社会社会工作与研究学会(SSWR)会议近 2.4 万篇摘要的数据库,揭示了该领域在作者协作、国际参与度及研究方法(以定量为主)等方面的显著演变趋势。
该论文通过引入新型网络故障注入工具 NetFI 并结合包含 15 名受试者的用户研究,系统分析了丢包、延迟和通信中断等网络服务质量因素对不同熟练度外科医生执行远程手术任务性能、运动原语及主观工作负荷的具体影响,从而为确定远程手术的操作边界及开发鲁棒控制策略提供了量化依据。
该论文揭示了一种长程视觉语言模型的行为规律,即模型在推理过程中保持与视觉状态一致的时间锚定能力(通过步级接地率 SGR 衡量),是预测其分布外泛化性能的关键指标,且该能力独立于模型规模和最终答案准确率。
该论文提出了一种面向全向飞行器的基于模型预测的零空间优化控制分配策略,通过在线求解约束迭代 LQR 问题并显式考虑执行器非对称动力学,有效抑制了电机指令振荡并提升了轨迹跟踪性能。
该论文通过案例研究展示了如何利用本地部署的 AI 模型分析四万余份招聘数据,从而为社会工作硕士(MSW)项目提供基于劳动力市场需求的课程规划情报,并强调了将数据洞察与利益相关者的情境知识相结合的重要性。
本文提出了 RoboCritics 方法,通过引入编码机器人专家知识的运动级评估器,为基于大语言模型的机器人编程提供透明反馈与自动修复机制,从而显著提升了端到端编程的安全性、执行质量及用户可控性。
该论文提出了基于运动学空间旋量等价性定义的“运动比特”(MotionBit)概念,构建了名为 MoRiBo 的手动标注基准,并开发了一种无需学习的图分割方法,在移动刚体分割任务中显著优于现有方法,为具身推理与机器人操作提供了关键的物理交互理解基础。