Environment-Aware Path Generation for Robotic Additive Manufacturing of Structures
该论文提出了一种环境感知的路径生成框架,通过结合四种路径规划算法在线生成适应动态障碍环境的机器人增材制造工具路径,并评估了不同规划器在复杂场景下的可行性及关键结构性能指标。
864 篇论文
该论文提出了一种环境感知的路径生成框架,通过结合四种路径规划算法在线生成适应动态障碍环境的机器人增材制造工具路径,并评估了不同规划器在复杂场景下的可行性及关键结构性能指标。
该论文提出了一种基于本地部署开源大语言模型的隐私保护视觉语言框架,用于医疗翻译机器人,通过新构建的临床对话手势数据集实现了对同意和指令等言语行为的高精度识别,并生成了比基线更具拟人化且恰当的机器人手势。
本文提出了 Safe-Night VLA 框架,通过融合长波红外热感知与语言模型实现语义推理,并结合控制障碍函数安全过滤器,使机器人在非结构化环境中能够“看见”不可见目标并安全执行热感知操作。
EmboAlign 提出了一种无需数据的框架,通过利用视觉语言模型提取的组合作为约束条件,在推理阶段对视频生成模型的输出进行筛选和轨迹优化,从而显著提升了零样本机器人操作的成功率。
该论文提出了一种结合约束贝叶斯优化树搜索与 STL 增强冲突基搜索的两阶段框架,通过局部代价地图学习和形式化 STL 推理,在满足运动学动力学约束及信号时序逻辑规范的前提下,实现了多机器人轨迹规划的高效性、安全性与可扩展性。
该论文提出了一种名为 TDGC 的分层策略架构,通过解耦高层任务决策与底层步态控制,利用强化学习训练的低层策略和基于稀疏语义或几何线索的高层策略,有效解决了四足机器人在非分布环境变化下的模拟到现实迁移难题,显著提升了复杂地形中的导航成功率与鲁棒性。
本文提出了一种名为 CDF-Glove 的轻量级、低成本(约 230 美元)缆索驱动力反馈手套,该设备通过提供实时触觉反馈显著提升了遥操作演示质量,使基于扩散策略的模仿学习在任务成功率上提高了 55%,并缩短了约 47.2% 的任务完成时间。
本文提出了 HiLAM,一种利用预训练模型提取底层动态并聚合为高层潜在技能的分层潜在动作模型,旨在从无动作视频中捕捉长时程时间结构并实现鲁棒的技能发现。
本文提出了一种名为 OpenHEART 的鲁棒且样本高效的框架,通过引入基于采样的抽象特征提取(SAFE)和关节信息估计器(ArtIEst),使足式操作机器人能够成功应对门、抽屉等异构可动物体的多样化开启动作。
本文提出了一种名为 SILA Bot 的小型蜥蜴仿生机器人,通过建立步态参数与沙土深度的线性关系,并利用本体感知信号(如关节扭矩)结合 K 近邻分类器实现深度估计,最终设计了一种低计算复杂度的线性反馈控制器,使机器人能够在未知深度的复杂自然地形中实现高效的自适应运动。
该论文提出了一种名为 TraD-RL 的强化学习方法,通过融合专家轨迹引导、基于控制障碍函数的动力学安全约束以及多阶段课程学习策略,有效解决了自动驾驶赛车在高动态非线性环境下的训练不稳定与安全性问题,实现了速度与稳定性的协同优化。
本文提出了名为 DexEMG 的轻量级肌电遥操作系统,通过训练基于表面肌电信号的手势预测模型(EMG2Pose)并结合鲁棒的手部重定向算法,实现了无需频繁个体校准即可在复杂环境中高精度控制灵巧机械手的通用化目标。
本文提出了 AnyCamVLA,一种无需额外演示数据或微调即可通过实时虚拟视角合成来适应不同相机视角的零-shot 框架,显著提升了预训练视觉 - 语言 - 动作模型在机器人操作中的视角鲁棒性。
该论文利用五个公共视频地点识别数据库和七种图像相似度方法,系统评估了合成新视角对视频地点识别的影响,发现少量合成视角能提升识别效果,而在大规模添加时,视角变化的幅度不如添加视角的数量和数据集图像类型重要。
本文提出了一种基于弹簧质量模型的简单控制策略,通过调整触地角度和施加预补偿力矩,有效解决了小型跳跃机器人在斜坡上因倾斜地面导致的不稳定旋转问题,使其能在无需复杂传感与计算的情况下实现稳定跳跃。
本文提出了一种基于精确凸多面体最近点计算生成线性控制屏障函数约束的迭代凸优化框架,通过局部线性化实现了非线性系统在多面体障碍物环境下的实时安全轨迹规划。
FTSplat 提出了一种前馈三角形点阵网络,通过从多视图图像直接预测连续三角形表面,实现了无需单场景优化即可生成适用于机器人仿真的高保真、流形几何 3D 重建。
该论文提出了名为 Swooper 的基于深度强化学习的方法,通过两阶段训练策略使搭载简易夹爪的轻量级四旋翼无人机在零样本部署下实现了高达 1.5 米/秒的飞行速度与 84% 的实机抓取成功率。
本文针对 2025 年推出的 Crazyflie Brushless 无人机建立了精确的动力学模型,并通过仿真与硬件实验验证了其在强化学习控制及高难度特技动作(如后空翻)中的有效性,同时开源了该项目以助力相关研究。
本文提出了 PROBE,一种无需学习的 LiDAR 三维地点识别描述子,它通过将鸟瞰图(BEV)单元建模为伯努利随机变量并利用极坐标雅可比行列式解析地边缘化连续平移,实现了跨传感器泛化且无需针对特定数据集进行调优,在多个数据集上取得了优于现有手工描述子的性能。