LagMemo: Language 3D Gaussian Splatting Memory for Multi-modal Open-vocabulary Multi-goal Visual Navigation

本文提出了 LagMemo,一种利用语言 3D 高斯泼溅记忆构建统一 3D 语言记忆库的导航系统,通过高效查询与动态验证机制实现了多模态开放词汇及多目标视觉导航,并在其构建的 GOAT-Core 基准测试中显著超越了现有最先进方法。

Haotian Zhou, Xiaole Wang, He Li, Zhuo Qi, Jinrun Yin, Haiyu Kong, Jianghuan Xu, Huijing Zhao2026-03-10💻 cs

MobiDock: Design and Control of A Modular Self Reconfigurable Bimanual Mobile Manipulator via Robotic Docking

本文提出了名为 MobiDock 的模块化自重构双臂移动机器人系统,该系统通过基于视觉的自主对接和螺纹锁紧机制将两个独立机器人物理连接为统一平台,从而将复杂的多机器人协同控制简化为单系统管理,显著提升了动态稳定性、操作精度及任务执行效率。

Xuan-Thuan Nguyen, Khac Nam Nguyen, Ngoc Duy Tran, Thi Thoa Mac, Anh Nguyen, Hoang Hiep Ly, Tung D. Ta2026-03-10💻 cs

UnfoldLDM: Deep Unfolding-based Blind Image Restoration with Latent Diffusion Priors

本文提出了 UnfoldLDM,一种将深度展开网络与潜在扩散模型相结合的新型盲图像恢复框架,通过多粒度退化感知模块估计未知退化,并利用抗退化扩散先验与过平滑校正 Transformer 协同解决现有方法对退化模型的依赖及纹理过平滑问题,从而在多种盲恢复任务中实现领先性能。

Chunming He, Rihan Zhang, Zheng Chen, Bowen Yang, Chengyu Fang, Yunlong Lin, Yulun Zhang, Fengyang Xiao, Sina Farsiu2026-03-10💻 cs