cuRoboV2: Dynamics-Aware Motion Generation with Depth-Fused Distance Fields for High-DoF Robots
本文提出了 cuRoboV2,这是一个统一的动力学感知运动生成框架,通过引入 B 样条轨迹优化、GPU 原生深度融合距离场感知以及可扩展的全身计算技术,实现了从单臂机械臂到高自由度人形机器人的高效、安全且实时的高成功率运动规划。
867 篇论文
本文提出了 cuRoboV2,这是一个统一的动力学感知运动生成框架,通过引入 B 样条轨迹优化、GPU 原生深度融合距离场感知以及可扩展的全身计算技术,实现了从单臂机械臂到高自由度人形机器人的高效、安全且实时的高成功率运动规划。
本文提出了 Safe-SAGE 框架,通过融合多传感器感知与语义理解,利用拉普拉斯调制的泊松安全函数构建多层安全滤波器,使足式机器人能够在动态环境中实现兼顾语义上下文差异与严格安全保证的自适应导航。
RoboPocket 提出了一种基于智能手机的便携式系统,通过增强现实(AR)视觉预测实现无需物理机器人的策略即时迭代,并配合异步在线微调,显著提升了机器人模仿学习的数据效率与样本效率。
本文提出了一种融合视觉惯性里程计与激光雷达相对定位的协同导航方法,通过异构无人机编队实现了微小型无人机在复杂环境下的精确轨迹引导与高精度建图。
本文综述了自动驾驶强化学习中的奖励函数设计,通过将其目标划分为安全、舒适、通行效率及交通规则遵守四类来揭示现有研究在目标聚合、情境感知及标准化方面的不足,并提出了构建上下文感知且能解决冲突的奖励验证框架等未来研究方向。
本文提出了一种结合定制粒子滤波与高斯过程隐式表面的统一贝叶斯框架,通过主动触觉探索实现已知物体的识别与位姿估计,并利用最大后验估计引导先验知识来高效重建和迁移学习新物体的形状。
该论文提出了名为 MIKASA 的综合基准测试套件,旨在通过建立记忆密集型任务分类框架、统一评估基准 MIKASA-Base 以及包含 32 个桌面机器人操作任务的 MIKASA-Robo,解决强化学习领域缺乏通用记忆能力评估标准的问题,从而推动复杂场景下记忆增强智能体的研究与发展。
本文提出了由生成式 AI 驱动的“进化 6.0"自主机器人系统,该系统通过整合视觉语言模型、视觉语言动作模型及文本转 3D 生成模型,实现了机器人自主设计并制造任务所需工具、进而执行人类指令的能力。
本文提出了名为 RoboGuard 的两阶段安全护栏架构,通过利用受保护的根信任大语言模型将安全规则情境化并结合时序逻辑控制合成,有效解决了大语言模型机器人在面对幻觉和对抗性越狱攻击时的安全风险,在显著降低不安全行为执行率的同时保持了任务性能。
本文提出了一种结合可微分优化与自监督深度感知的无人机轨迹规划方法,通过构建无需专家标注的 3D 成本地图并引入神经网络时间分配策略,在仿真与真实环境中显著提升了跟踪精度与控制效率。
本文提出了 TPK 框架,通过融合针对车辆、行人和骑行者的类特定交互与运动学先验知识,显著提升了自动驾驶轨迹预测的可解释性、物理可行性及整体可信度。
该论文提出了一种名为“特征混合”的极简多模态异常合成方法,并发布了新的 CARLA-OOD 数据集,旨在通过理论支持的高效合成策略显著提升多模态数据中的分布外检测与分割性能。
本文介绍了 pyCub,这是一个基于 Python 的开源 iCub 人形机器人物理仿真与教学框架,它摒弃了传统 C++ 和 YARP 的复杂性,通过涵盖从基础控制到复杂交互任务的分级练习,降低了人形机器人学习门槛,并已在实际课程中得到验证。
本文提出了 Q-SVMPC 方法,通过结合强化学习先验与 Q 值引导的 Stein 变分推理,将基于学习的模型预测控制转化为轨迹后验推断,从而在保持解多样性的同时显著提升了导航、机器人操作及真实采摘任务中的样本效率、稳定性与鲁棒性。
本文提出了 VITA,一种无需迭代去噪和视觉条件输入的流匹配策略框架,通过联合训练动作自编码器与引入流潜在解码技术,实现了从视觉表征到潜在动作的直接映射,在显著降低推理延迟的同时保持了顶尖的性能表现。
本文提出了 Point2Act,一种利用多模态大语言模型通过高效 3D 蒸馏直接检索上下文相关 3D 动作点的框架,旨在解决现有方法在零样本场景下难以精确定位 3D 操作位置的问题,从而实现快速且精准的机器人抓取。
本文提出了一种仅依靠机器人全身敏感皮肤提供的触觉反馈(而非视觉)来定位和抓取物体的方法,通过“全身粗略探索”与“末端精细定位”两阶段策略,在模拟和真实实验中实现了高效且成功的物体抓取,特别适用于视觉受限的复杂环境。
本文提出了一种基于投影几何代数的机器人惯性辨识基参数几何分析方法,通过构建四面体点模型并推导共享点、定点及平面旋转三大原则,实现了具有计算复杂度的基参数自动识别算法,并在多种串联与并联机器人上验证了其通用性、鲁棒性与高效性。
本文提出了 Event-LAB 框架,旨在通过统一的包管理和命令行接口解决事件基定位领域因代码依赖和数据格式多样化导致的评估困难问题,从而实现跨数据集和多种方法(如 VPR 和 SLAM)的标准化、可复现的系统化评估与分析。
本文针对 embodied intelligence 中动作提示视频分割面临的标注噪声问题,首次构建了 ActiSeg-NL 基准,系统评估了多种噪声学习策略,并提出了并行掩码头机制(PMHM)以有效应对文本和掩码标注噪声。