Geometric Autoencoder for Diffusion Models

本文提出了一种名为几何自编码器(GAE)的框架,通过利用视觉基础模型构建优化的语义监督目标、采用潜变量归一化替代传统 KL 散度以及引入动态噪声采样机制,有效解决了现有潜在扩散模型在语义判别性、重建保真度与紧凑性之间的平衡难题,并在 ImageNet-1K 基准上实现了超越现有最先进方法的生成性能。

Hangyu Liu, Jianyong Wang, Yutao Sun2026-03-12💻 cs

Shape Control of a Planar Hyper-Redundant Robot via Hybrid Kinematics-Informed and Learning-based Approach

本文提出了一种名为 SpatioCoupledNet 的混合运动学信息与学习驱动的形状控制方法,通过分层神经网络架构和置信度门控机制,有效解决了柔性超冗余机器人因顺应性导致的稳定性问题,显著提升了其在复杂动态环境下的控制精度、收敛速度及抗干扰能力。

Yuli Song, Wenbo Li, Wenci Xin, Zhiqiang Tang, Daniela Rus, Cecilia Laschi2026-03-12💻 cs

Differentiable Geometric Indexing for End-to-End Generative Retrieval

该论文提出了一种名为可微分几何索引(DGI)的新方法,通过操作统一(利用 Gumbel-Softmax 和对称权重共享解决优化阻断)和等向几何优化(在单位超球面上使用缩放余弦相似度解决几何冲突),有效解决了生成式检索中索引构建与检索目标解耦及长尾项被热门项掩盖的问题,从而在大规模搜索和电商场景中实现了优于现有基线的性能。

Xujing Wang, Yufeng Chen, Boxuan Zhang, Jie Zhao, Chao Wei, Cai Xu, Ziyu Guan, Wei Zhao, Weiru Zhang, Xiaoyi Zeng2026-03-12💻 cs

World2Act: Latent Action Post-Training via Skill-Compositional World Models

该论文提出了 World2Act 框架,通过利用技能组合式世界模型将视觉 - 语言 - 动作策略的动作直接与世界模型的潜在动态对齐,并结合自动 LLM 技能分解流程解决视频生成长度不一致问题,从而显著提升了机器人在真实世界中的泛化能力和性能。

An Dinh Vuong, Tuan Van Vo, Abdullah Sohail, Haoran Ding, Liang Ma, Xiaodan Liang, Anqing Duan, Ivan Laptev, Ian Reid2026-03-12💻 cs

Reconstructing Bounded Treelength Graphs with Linearithmic Shortest Path Distance Queries

该论文提出了一种确定性算法,仅需 OΔ,tl(nlogn)O_{\Delta,\mathrm{tl}}(n \log n) 次最短路径距离查询,即可在最大度为 Δ\Delta 且树长为 tl\mathrm{tl} 的连通无向图中高效重构边集,从而将此类图的重建复杂度相比现有最优算法降低了 logn\log n 因子并达到了下界。

Chirag Kaudan (Oregon State University), Amir Nayyeri (Oregon State University)2026-03-12💻 cs

COHORT: Hybrid RL for Collaborative Large DNN Inference on Multi-Robot Systems Under Real-Time Constraints

本文提出了名为 COHORT 的基于 ROS 的多机器人协作框架,通过结合离线优势加权回归(AWR)与在线多智能体 PPO 的混合强化学习策略,动态调度大模型推理任务,在满足实时约束的同时显著降低了能耗并提升了 GPU 利用率。

Mohammad Saeid Anwar, Anuradha Ravi, Indrajeet Ghosh, Gaurav Shinde, Carl Busart, Nirmalya Roy2026-03-12💻 cs

A Secure Splitting and Acceleration Strategy for TCP/QUIC in Interplanetary Networks

本文提出了一种基于非透明安全代理(NTSP)架构的 TCP/QUIC 安全拆分与加速策略 PEPspace,通过结合利用深空链路预调度特性的速率拥塞控制、自适应前向纠错及理论推导的背压流控机制,有效解决了星际网络中的极端延迟与高丢包问题,显著提升了地球 - 月球场景下的传输性能与稳定性。

Jianhao Yu, Ye Li, Qingfang Jiang, Shuai Liu, Wenfeng Li, Kanglian Zhao2026-03-12💻 cs

KnowDiffuser: A Knowledge-Guided Diffusion Planner with LM Reasoning and Prior-Informed Trajectory Initialization

该论文提出了 KnowDiffuser,一种将语言模型的语义推理能力与扩散模型的轨迹生成能力相结合的知识引导规划框架,通过先验轨迹初始化和两阶段去噪机制,有效弥合了自动驾驶系统中语义理解与物理运动规划之间的鸿沟,并在 nuPlan 基准测试中显著优于现有方法。

Fan Ding, Xuewen Luo, Fengze Yang, Bo Yu, HwaHui Tew, Ganesh Krishnasamy, Junn Yong Loo2026-03-12💻 cs