Can we Trust Unreliable Voxels? Exploring 3D Semantic Occupancy Prediction under Label Noise
该论文针对真实世界中 3D 语义占据预测面临的标注噪声问题,首次建立了 OccNL 基准并揭示了现有 2D 去噪策略在稀疏 3D 空间中的失效,进而提出了基于双源部分标签推理的 DPR-Occ 框架,在极端噪声下显著提升了感知鲁棒性。
864 篇论文
该论文针对真实世界中 3D 语义占据预测面临的标注噪声问题,首次建立了 OccNL 基准并揭示了现有 2D 去噪策略在稀疏 3D 空间中的失效,进而提出了基于双源部分标签推理的 DPR-Occ 框架,在极端噪声下显著提升了感知鲁棒性。
本文提出了名为 SuperSuit 的双模态接口框架,通过统一的运动学映射和增量关节表示,实现了轮式移动机械臂在遥操作与主动演示模式下的无缝数据融合,从而显著提升了长程任务的数据采集效率与策略性能。
该论文提出了一种基于开源软件(ROS2 和 OScar)且符合 ETSI 标准的 1:10 比例微型车平台,旨在通过低成本方案解决从仿真到实地测试的过渡难题,并成功验证了其在交叉路口碰撞预警(ICW)等合作智能交通系统应用中的可行性。
本文提出了一种基于分层事件触发控制障碍函数的分布式控制框架,通过仅依赖局部邻居信息的共识协议与风险感知领导者切换策略,实现了多机械臂在受限通信和计算资源下对重型负载的协同搬运,并在保证严格安全约束的同时显著降低了计算成本与通信频率。
该论文通过受控实验发现,跨具身迁移中形态变化带来的挑战无法通过单纯增加数据多样性解决,而利用对齐场景、任务或轨迹的“数据类比”配对数据,能显著提升跨机器人设置的任务成功率。
该论文提出了一种无需重新训练的时空视觉 Token 剪枝框架,通过结合当前视图的空间选择与历史记忆的时空压缩,在显著降低计算延迟的同时保持导航精度,成功实现了大型多模态模型在四足机器人上的高效实时部署。
本文提出了一种将控制障碍函数与运动安全走廊相统一的“控制障碍走廊”新概念,通过将前者转化为局部安全目标区域,在满足特定收敛与衰减速率匹配条件的前提下,实现了复杂环境中安全且持续的路径跟踪与自主探索。
该论文提出了一种统一的低维设计嵌入方法,通过共享基函数将软体机器人的形状、材料和驱动统一建模,从而在显著降低搜索空间维度的同时实现了三者的高效联合优化,并证明了其性能优于现有的神经网络和体素化参数化方法。
本文提出了 CFEAR-TR,一种基于单旋转雷达的“教学 - 重复”定位流程,通过联合对齐实时扫描与历史地图及近期关键帧,利用多普勒补偿的表面点表示,在恶劣天气下实现了高达 29Hz 的轻量化、鲁棒且高精度的定位(误差低至 0.117 米和 0.096 度),显著缩小了雷达与激光雷达定位的差距。
本文提出了 SG-DOR 框架,通过构建包含方向条件遮挡推理的场景图,有效识别密集胡椒植株中遮挡目标果实的器官,从而为机器人采摘规划提供关键的结构化关系信号。
本文介绍了一种专为低重力天体探测设计的单足多模态跳跃机器人,它仅通过两个反作用轮和三个驱动器,即可实现滚动、定向跳跃、空中姿态调整及自主复位等复杂运动能力。
该论文提出了一种针对漫反射直接飞行时间(dToF)LiDAR 的简单空间标定方法,通过扫描后向反射贴片并执行背景减法,为每个 LiDAR 像素在共置 RGB 图像平面上重建响应图,从而实现了跨模态对齐与融合。
该论文提出了一种从人类演示中联合学习双臂机器人操作任务的符号化时序结构与亚符号化动作定时的方法,通过结合高斯混合模型、DPLL 算法及优化规划系统,生成比单一基线更贴近人类演示的可执行时序参数化计划。
本文提出了一种面向水下车辆 - 机械臂系统的新型不确定性感知自适应动力学框架,通过在线估计中嵌入凸物理一致性约束和移动视界估计,实现了参数的快速收敛、物理合理性及不确定性量化,并在实验验证中显著提升了控制精度与仿真可靠性。
本文针对无人机在运动方向与机头朝向不一致时缺乏全向感知能力的局限,提出了名为 Fly360 的两阶段感知决策框架,利用全景 RGB 观测生成深度图并配合固定随机偏航训练策略,实现了稳定且优于传统前视基线的 omnidirectional(全向)避障能力。
BEVLM 提出了一种将鸟瞰图(BEV)表示与大型语言模型(LLM)相结合的新框架,通过从 LLM 蒸馏语义知识并统一多视角输入,显著提升了自动驾驶在复杂场景下的空间推理能力、跨视图理解精度及端到端闭环驾驶的安全性。
本文提出了一种基于图刚性理论的分布式无人机编队控制新方法,通过将梯度下降指令分解并根据相对定位噪声分布进行修正,有效解决了传感器噪声导致的编队振荡与漂移问题,显著提升了无人机在真实环境下的紧密编队性能。
本文提出了名为 FEP-Nav 的生物启发框架,通过结合自上而下的解码器与自适应归一化机制,在无需梯度更新的情况下实时最小化变分自由能,从而显著提升了机器人在噪声和感官突变环境下的视觉导航鲁棒性。
本文提出了一种名为多特征隐式模型(MIMO)的新型物体表征方法,通过编码点与物体间的多空间特征来增强部分观测下的形状重建与空间关系建模能力,并基于此构建了一个能够从单或多视角人类演示视频中学习任务导向型物体抓取与重排任务的框架,在仿真与真实世界实验中均展现了优于现有方法的性能。
本文提出了一种基于线性时序逻辑(LTL)的风险感知自动驾驶方法,通过将包含事件时序与严重程度的 LTL 规范转化为线性规划问题,实现了在 Carla 仿真中平衡碰撞风险与交通违规等多类风险的类人驾驶策略合成。