LiteVLA-Edge: Quantized On-Device Multimodal Control for Embedded Robotics
本文提出了 LiteVLA-Edge,一种专为嵌入式机器人设计的量化多模态控制方案,通过结合监督微调、4 位 GGUF 量化及 GPU 加速推理,实现了在 Jetson Orin 硬件上完全离线的端到端实时控制(约 6.6 Hz),为资源受限设备上的 VLA 部署提供了实用的系统路径。
867 篇论文
本文提出了 LiteVLA-Edge,一种专为嵌入式机器人设计的量化多模态控制方案,通过结合监督微调、4 位 GGUF 量化及 GPU 加速推理,实现了在 Jetson Orin 硬件上完全离线的端到端实时控制(约 6.6 Hz),为资源受限设备上的 VLA 部署提供了实用的系统路径。
本文提出了一种结合真实地形重建、异质智能体建模与强化学习自适应导航策略的多智能体模拟框架,用于在复杂起伏景观中高效模拟并分析考古学背景下人类群体及动物运输系统的移动行为与交互机制。
该论文通过引入三种定位误差模型并在 Argoverse 2 数据集上评估 MapTRv2 变体,揭示了定位误差(尤其是航向角误差)会显著扭曲在线 HD 地图构建的标签质量,导致模型性能呈非线性下降,并据此提出了一种基于距离的评估指标。
该论文提出了一种基于雷达点云配准与位姿图优化的方法,通过消除多车采集数据中的定位噪声,显著提升了全球雷达占用栅格地图的清晰度及车道线地图的生成质量,从而降低了自动驾驶高精地图的构建与维护成本。
本文提出了 Phys4D,一种通过三阶段训练范式(包括大规模伪监督预训练、基于仿真的监督微调及强化学习)将视频扩散模型转化为物理一致 4D 世界表示的方法,显著提升了生成内容在细粒度时空动态与物理合理性方面的表现。
本文提出了一种利用节点异质视野信息、通过平衡探测收益与路径成本来优化不确定环境中导航策略的新启发式算法,该方法在真实地形测试中相比传统最短路径基线显著降低了平均遍历成本,且计算开销远低于现有平衡观测与路径优化的方法。
本文提出了 ROBO(黎曼重叠块优化)算法,这是一种基于重叠域分解的分布式多机器人位姿图优化方法,通过灵活调整机器人间共享的位姿信息量来平衡通信开销与计算效率,从而在少量通信数据下显著加快收敛速度,并具备应对网络延迟的异步变体以适应实际应用。
本文提出了一种名为 MOPS-PRM 的基于路标的运动规划方法,该方法利用场景图将多对象感知成本嵌入高自由度机器人的规划过程,通过选择性采样配置来隐式满足感知约束,从而在仿真与真实实验中显著提升了多对象检测率和跟踪率。
本文提出了一种利用约束层阻尼(CLD)进行被动相位导向阻抗整形的方法,通过选择性地增强软体游泳机器人在高频驱动下的耗散阻抗分量以优化力 - 速相位对齐,从而在不依赖复杂控制的情况下显著提升了其瞬态推进性能,实现了峰值加速度和终端速度的数倍增长。
本文提出了一种基于因子图优化的实时松耦合 GNSS/IMU 融合架构,通过在城市峡谷等挑战性环境中的实验验证,分析了其在保证实时运行和服务可用性的同时,与批处理精度之间存在的权衡关系。
本文提出了一种基于增量优化与固定滞后边缘化的实时紧耦合 GNSS-IMU 因子图优化方法,并在城市复杂环境下利用 UrbanNav 数据集验证了其在信号遮挡与多径干扰场景中的高精度定位性能。
本文提出了 L2G-Det 框架,通过利用模板与查询图像间的密集局部匹配生成候选点,并以此引导增强版 Segment Anything Model(SAM)进行实例特定提示,从而在无需显式物体提议的情况下,实现了对开放世界场景中遮挡和杂乱背景下新颖物体实例的鲁棒检测与分割。
该论文提出了多尺度具身记忆(MEM)框架,通过结合视频编码的短期记忆与文本编码的长期记忆,使机器人策略能够处理长达 15 分钟的复杂长程任务并实现上下文自适应。
本文提出了名为 Touch2Insert 的触觉感知框架,通过从零样本接触中重建截面几何并配准来估计孔位姿态,实现了无需特定任务训练即可在多种连接器上完成亚毫米级精度的插拔操作。
本文提出了 MistyPilot,这是一个面向 Misty 社交机器人的智能体框架,它通过结合物理交互与社会智能代理、采用快慢思考范式以及提供五个基准数据集,有效解决了非专业用户在工具选择、编排及参数配置方面的挑战,显著提升了任务执行效率与情感交互能力。
本文提出了 TreeLoc++ 框架,该框架利用紧凑的数字森林清单(DFI)直接进行全局定位,通过引入成对距离直方图、胸径过滤及几何约束优化等策略,在无需密集点云数据的情况下实现了森林环境中厘米级精度的鲁棒 6 自由度定位,并展现出优异的长期变化适应能力与数据压缩效率。
本文提出了名为 UrbanHuRo 的双层人机协作框架,通过结合基于 K-次模最大化的分布式订单调度与深度次模奖励强化学习的路径规划算法,实现了城市配送与感知服务的联合优化,显著提升了感知覆盖率、快递员收入并减少了订单延误。
本文提出了 CoCo-TAMP 框架,利用大语言模型提供的常识推理(如物体位置偏好和共现规律)来指导部分可观测环境下的状态估计,从而显著提升了长程任务与运动规划的效率。
本文提出了一种结合可变刚度被动元件与人工肌肉的软体半主动背部支撑装置,该装置通过基于前臂肌电和背部惯性数据的重量自适应调节机制,在保持轻便紧凑的同时显著降低了用户在进行对称及非对称搬运任务时的背部肌肉活动。
本文提出了 X-Loco 框架,通过协同策略蒸馏与自适应专家选择机制,成功训练出首个仅依赖速度指令、无需参考运动即可同时实现直立行走、全身协调及跌倒恢复的视觉驱动通用型人形机器人 locomotion 策略。