COP-GEN: Latent Diffusion Transformer for Copernicus Earth Observation Data -- Generation Stochastic by Design

本文提出了 COP-GEN,一种基于潜在扩散变换器的多模态生成模型,它通过将地球观测数据间的跨模态映射建模为条件概率分布而非确定性映射,从而能够生成具有物理一致性且能反映自然不确定性的多样化数据,有效解决了传统模型在数据补全和跨传感器翻译任务中因忽略随机性而导致的性能瓶颈。

Miguel Espinosa, Eva Gmelich Meijling, Valerio Marsocci + 2 more2026-03-04💻 cs

LoGeR: Long-Context Geometric Reconstruction with Hybrid Memory

本文提出了 LoGeR,一种结合参数化测试时训练记忆与非参数滑动窗口注意力机制的新型混合记忆架构,旨在解决长视频稠密 3D 重建中的上下文连贯性难题,使其能够在无需后优化的情况下,从仅 128 帧的训练数据中泛化至数千帧甚至上万帧的超长序列,并显著超越现有最先进方法的重建精度与一致性。

Junyi Zhang, Charles Herrmann, Junhwa Hur + 5 more2026-03-04🤖 cs.LG

Tether: Autonomous Functional Play with Correspondence-Driven Trajectory Warping

本文提出了名为"Tether"的机器人自主功能化玩耍方法,该方法通过将少量源演示动作锚定到目标场景的语义关键点来实现开环策略的轨迹形变,并结合视觉语言模型驱动的闭环迭代机制,在仅需少量演示的情况下实现了真实世界中的多任务自主探索,从而高效生成大规模高质量数据以训练出媲美人类示范的闭环模仿策略。

William Liang, Sam Wang, Hung-Ju Wang + 3 more2026-03-04🤖 cs.AI