VEGA: Electric Vehicle Navigation Agent via Physics-Informed Neural Operator and Proximal Policy Optimization
本文提出了 VEGA,一种结合物理信息神经算子(PINO)进行车辆参数估计与近端策略优化(PPO)进行充电感知路径规划的电动汽车导航系统,该系统在跨大陆路线上实现了比传统启发式算法快 20 倍以上的推理速度,并展现出对法国和日本路网的零样本泛化能力。
864 篇论文
本文提出了 VEGA,一种结合物理信息神经算子(PINO)进行车辆参数估计与近端策略优化(PPO)进行充电感知路径规划的电动汽车导航系统,该系统在跨大陆路线上实现了比传统启发式算法快 20 倍以上的推理速度,并展现出对法国和日本路网的零样本泛化能力。
该论文提出了一种融合自然语言理解与空间推理的多模态框架,通过利用飞行员语音指令来增强无塔台空域中航空器目标预测的准确性,从而提升自主飞行决策能力。
本文提出了名为 GLIDE 的协同空地搜救框架,通过两架无人机分别执行目标搜索与地形侦察,引导无人地面车辆在未知环境中进行实时避障规划,从而显著提升了搜救任务的到达效率与导航安全性。
本文提出了一种面向腿式机器人的决策驱动语义对象探索方法,通过置信度校准的语义证据仲裁、受控增长的语义拓扑记忆以及语义效用驱动的亚目标选择机制,在无需稠密几何重建的情况下,将噪声语义观测转化为稳定可执行的探索决策,从而显著提升了开放世界中的探索性能。
本文提出了名为 GPHDM 的新方法,通过将高斯过程动力学模型扩展至双曲流形并结合分类学感知归纳偏置,实现了能够同时保留运动层级结构与时间动态、并生成物理一致轨迹的机器人拟人化运动生成。
本文介绍了 ROSflight 2.0,这是一个专为研究人员设计的基于 ROS 2 的轻量级开源无人机飞控生态系统,通过架构升级、硬件支持和仿真环境优化,显著提升了模块化与易用性,并验证了其在 400 Hz 频率下通过串行连接于机载计算机闭环控制多旋翼无人机的能力。
ROSplane 2.0 是一款专为研究人员设计的基于 ROS 2 的轻量化开源固定翼无人机自主系统,通过提供清晰的接口、模块化架构及无需昂贵工具的气动建模流程,显著降低了研究门槛并加速了从仿真到实机的实验迭代。
Phys2Real 提出了一种结合视觉语言模型物理参数先验与基于不确定性感知的在线交互适应的“实 - 仿 - 实”强化学习框架,通过融合 3D 高斯溅射重建、VLM 推断及在线估计,显著提升了机器人在复杂物理动力学任务中的 sim-to-real 迁移成功率与效率。
该论文提出了一种基于采样的混合模式控制方法,通过将非可微与算法化控制模式的选择、切换时机及持续时间建模为整数优化问题,实现了在机器人任务中从长期规划到高频控制的渐近最优切换与复杂行为合成。
该论文提出了名为 C3+ 的增强型接触隐式模型预测控制算法,结合完整的感知与执行流程,实现了在无需预知物体物理属性的情况下,对单个或多个任意几何形状物体的实时精准推挤操作,并在硬件实验中取得了 98% 的成功率。
本文提出了 AURASeg 框架,通过引入残差辅助边界细化模块、注意力渐进上采样解码器及轻量级多尺度上下文模块,有效解决了移动机器人在边缘设备上 drivable-area 分割中边界精度不足与特征表示受限的问题,并在多个数据集及 Jetson Nano 设备上验证了其优越性能与部署可行性。
本文提出了一种基于改进滑动窗口汉克尔动态模态分解(Hankel-DMD)的实时在线框架,通过奇异值硬阈值去噪和结构低秩一致性投影,从部分含噪数据中构建动态障碍物的非线性预测模型,实现了稳定的方差感知去噪与短期轨迹预测,适用于机器人实时运动规划。
该论文提出并通过实验验证了四种增强现实视野指示器(分为以机器人为中心的 egocentric 和以任务为中心的 allocentric 两类),旨在纠正人类对机器人视野的错误认知模型,其中将指示器直接置于任务空间(allocentric)的方法在协作任务中显著提高了人类对机器人视野判断的准确性。
本文提出了 ExpReS-VLA 方法,通过压缩经验回放、检索增强生成及阈值混合对比损失,实现了视觉 - 语言 - 动作模型在设备端的高效快速适配,在显著降低存储需求的同时有效防止灾难性遗忘,并大幅提升了机器人任务的成功率。
本文提出了 CAVER,一种通过新型 3D 打印末端执行器主动激发物体发声、结合视听特征表示以及好奇心驱动的探索算法,从而高效构建丰富视听知识并显著提升材料分类与音频模仿能力的机器人系统。
该论文提出了一种结合近端策略优化(PPO)与运动原型的任务空间框架,通过引入能量感知笛卡尔阻抗控制目标,实现了在复杂三维环境中具有接触安全性和高能效的机器人操作。
该论文提出了一种名为 WNumMPC 的分层多智能体导航方法,通过结合强化学习规划器生成的拓扑不变量(绕数)策略与模型预测控制,有效解决了无显式通信场景下因对称性导致的死锁问题,并在密集交互环境中实现了鲁棒的仿真到现实迁移。
本文提出了 Bi-AQUA,这是首个将显式光照建模与基于 Transformer 的双边动作分块相结合的水下机器人臂模仿学习框架,通过层级化光照感知设计有效克服了水下光照变化与能见度降低的挑战,并在真实世界的接触式操作任务中展现出优于传统方法的鲁棒性。
本文提出了名为 EchoVLA 的记忆增强型视觉 - 语言 - 动作模型,通过结合场景记忆与情景记忆来支持移动操作任务,并发布了 MoMani 基准数据集,在仿真和真实世界实验中显著提升了移动操作的成功率。
该论文提出了一种将动态风险场与随时间变化的凸可行空间生成相结合的新型轨迹规划框架,利用约束迭代线性二次型调节器(iLQR)算法在复杂动态交通场景(如换道和环岛)中实现了兼顾安全性、效率与舒适性的自主规划。