Tether: Autonomous Functional Play with Correspondence-Driven Trajectory Warping

本文提出了名为"Tether"的机器人自主功能化玩耍方法,该方法通过将少量源演示动作锚定到目标场景的语义关键点来实现开环策略的轨迹形变,并结合视觉语言模型驱动的闭环迭代机制,在仅需少量演示的情况下实现了真实世界中的多任务自主探索,从而高效生成大规模高质量数据以训练出媲美人类示范的闭环模仿策略。

William Liang, Sam Wang, Hung-Ju Wang + 3 more2026-03-04🤖 cs.AI

Beyond DAGs: A Latent Partial Causal Model for Multimodal Learning

本文提出了一种针对多模态数据的新型潜在部分因果模型,通过引入由无向边连接的潜在耦合变量来刻画跨模态知识传递,从理论上证明了多模态对比学习(MMCL)所学习到的表示对应于这些潜在变量,从而深化了对 MMCL 机制的理解并验证了其在解耦表示、少样本学习及领域泛化中的实际有效性。

Yuhang Liu, Zhen Zhang, Dong Gong + 6 more2026-03-03🤖 cs.LG

Changing the Training Data Distribution to Reduce Simplicity Bias Improves In-distribution Generalization

该论文通过理论证明锐度感知最小化(SAM)相比梯度下降(GD)具有更低的“简单性偏差”,并据此提出了一种名为 USEFUL 的算法,通过早期聚类识别并过采样特定样本以调整训练数据分布,从而显著提升了多种模型在多个数据集上的分布内泛化性能。

Dang Nguyen, Paymon Haddad, Eric Gan + 1 more2026-03-03🤖 cs.AI