Long-Short Term Agents for Pure-Vision Bronchoscopy Robotic Autonomy
该论文提出了一种仅依赖视觉的自主支气管镜导航框架,通过长短期智能体协同与世界模型批判机制,在无外部追踪传感器的情况下实现了高精度的机器人自主导航,并在体内外实验中验证了其达到专家水平的可行性。
864 篇论文
该论文提出了一种仅依赖视觉的自主支气管镜导航框架,通过长短期智能体协同与世界模型批判机制,在无外部追踪传感器的情况下实现了高精度的机器人自主导航,并在体内外实验中验证了其达到专家水平的可行性。
该论文提出了一种结合连续不安全步态惩罚机制与稀疏激光雷达高程图优化(含时空置信度衰减及边缘引导 U-Net)的单阶段训练框架,实现了双足机器人在楼梯及复杂户外地形上的安全、全向稳定行走。
本文提出了一种基于轨迹驱动的全局优化框架,能够同时识别水下欠驱动机构与软体机器人的耦合内部结构及外部水动力参数,从而实现了高保真的统一建模,并在从单臂到整体制动机器人的多种场景下验证了其准确性与可扩展性。
针对现有边缘云协同推理框架在处理视觉语言动作(VLA)模型时易受视觉噪声干扰且忽视任务冗余导致运动不连续的问题,本文提出了名为 RAPID 的新框架,通过冗余感知与兼容性优化实现了最高 1.73 倍的推理加速,同时仅引入 5%~7% 的额外开销。
本文提出了 VORL-EXPLORE 框架,通过引入表征局部可导航性的“执行保真度”信号,将任务分配与运动执行紧密耦合,并结合 Voronoi 优化与风险自适应仲裁机制,有效解决了动态密集环境中多机器人探索易出现的拥塞、振荡及冗余覆盖问题。
本文提出了 TeamHOI 框架,通过结合基于 Transformer 的局部观测策略与掩码对抗运动先验技术,实现了单一去中心化策略在任意团队规模下生成物理真实且协调的多智能体人机交互行为。
本文提出了一种名为“拖曳感知气动操纵性(DAAM)”的几何框架,通过引入基于剩余对称加速度能力的黎曼度量,将电机扭矩限制与气动阻力显式纳入冗余多旋翼飞行器的控制分配中,从而生成一种对广义力空间坐标缩放具有不变性、能自动规避阻力饱和并解析其全局跳变不连续性的状态相关最优分配策略。
本文提出了一种仅依赖本体感知的双时域混合内部模型,结合基于数字孪生与虚实混合技术的 MATRIX 硬件在环验证平台,成功实现了四足机器人在模拟月球重力及崎岖地形下的连续稳定跳跃。
本文提出了 DiffRacing 框架,通过融合向量场与可微物理策略学习,解决了无人机竞速中门框穿越等目标难以表达为平滑可微损失的问题,实现了无需显式系统辨识的高效仿真到现实迁移及鲁棒飞行。
本文提出了 AffordGrasp,一种基于扩散模型的跨模态框架,通过引入细粒度结构化语言标注和双条件引导机制,实现了能够同时满足物体几何约束、空间功能 affordance 及用户指令语义的高精度稳定人手抓取姿态生成。
本文提出了一种基于鲁棒正不变集(RPI)的系统性框架,用于为自主直升机计算具有形式化保证的轨迹跟踪误差界,并通过仿真验证了该框架在三种控制器架构下的有效性及其在轨迹规划中作为认证缓冲区的应用潜力。
本文提出了名为"See & Switch"的交互式机器人技能编程框架,该框架利用眼在手视觉信号在条件任务图中实现可靠的在线分支选择与异常检测,并通过多模态输入抽象层支持用户以多种直观方式(如示教、手柄和手势)高效地扩展和修正机器人技能。
本文介绍了 MRDrive,这是一款开源的混合现实驾驶模拟器,旨在通过结合真实车辆座舱与虚拟驾驶环境,解决传统驾驶模拟器在生态效度与实验控制之间的权衡难题,从而支持人机交互、注意力及可解释性等领域的汽车用户研究。
本文提出了一种针对冗余机器人的自适应视觉控制方案,通过在任务空间引入自适应视觉项并在零空间引入交互项,实现了在未知环境中无需标定即可自主执行任务并与人类安全协作,且系统稳定性已通过李雅普诺夫方法得到严格证明。
本文提出了名为 DeReCo 的框架,通过解耦表征学习与协调学习并采用三阶段训练策略,有效解决了去中心化多机器人协作搬运中因部分可观测性和非平稳性导致的训练不稳定与泛化难题,显著提升了样本效率及跨物体场景的适应能力。
本文提出了一个集成框架,通过引入强化学习增强的遥操作辅助系统 IMCopilot 和融合多模态触觉信息的混合专家 VLA 架构 MoDE-VLA,有效解决了高保真数据采集与多技能学习瓶颈,显著提升了机器人接触式灵巧操作的成功率。
SaiVLA-0 提出了一种受神经科学启发的“大脑 - 脑桥 - 小脑”三分架构,通过冻结的高层多模态先验、实时意图整合适配器及并行快速控制解码器,实现了计算感知、模块化且高效的视觉 - 语言 - 动作系统,并在 LIBERO 基准测试中显著提升了训练效率与任务成功率。
该论文提出了一种名为 TRIAGE 的轻量级后处理框架,通过将不确定性分解为源于观测噪声的偶然性不确定性和源于模型失配的认知不确定性,并据此分别触发观测恢复、控制调节及感知模型容量选择等针对性响应,从而在机器人操作和自适应感知任务中显著提升了系统性能与效率。
本文提出了无需训练的 UniGround 方法,通过两阶段的拓扑与语义推理机制,在 ScanRefer 和 EmbodiedScan 等基准测试中实现了无需 3D 监督的零样本开放世界 3D 视觉定位,并展现出对未见场景和分布外数据的强泛化能力。
该研究通过实验发现,机器人游戏主持人的交互方式(直接实体接触 vs. 数字中介)对用户体验的影响并非一概而论,而是受到用户机器人负面态度(NARS)的显著调节:高 NARS 用户在实体交互中因社交压力导致叙事沉浸感下降,而低 NARS 用户则未受此影响,从而揭示了基于用户特质进行自适应交互设计的重要性。