TiPToP: A Modular Open-Vocabulary Planning System for Robotic Manipulation

本文提出了 TiPToP,一种结合预训练视觉基础模型与任务运动规划器(TAMP)的模块化开放词汇系统,仅需 RGB 图像和自然语言指令即可在零机器人数据的情况下解决多步操作任务,并在仿真与真实世界中展现出优于基于 350 小时演示微调的 VLA 模型的性能。

William Shen, Nishanth Kumar, Sahit Chintalapudi, Jie Wang, Christopher Watson, Edward Hu, Jing Cao, Dinesh Jayaraman, Leslie Pack Kaelbling, Tomás Lozano-Pérez2026-03-11💻 cs

Joint User Association and Resource Allocation for Adaptive Semantic Communication in 5G and Beyond Networks

本文针对 5G 及未来网络中用户异构性导致的语义通信效率问题,提出了一种自适应语义通信(ASC)框架,并通过将联合用户关联与资源分配问题分解为三个子问题,设计了一种高效的多阶段算法以在满足能耗和时延约束下最大化系统效用。

Xingqiu He, Chaoqun You, Zihan Chen, Yao Sun, Dongzhu Liu, Tony Q. S. Quek, Yue Gao2026-03-10💻 cs

Deepfake Generation and Detection: A Benchmark and Survey

本文全面综述了深度伪造生成与检测领域的最新进展,统一了任务定义、数据集与评估指标,系统分析了换脸、表情重演、说话人脸生成、面部属性编辑及伪造检测等四个代表性方向,并通过基准测试评估了主流方法,最后探讨了该领域面临的挑战与未来研究方向。

Gan Pei, Jiangning Zhang, Menghan Hu, Zhenyu Zhang, Chengjie Wang, Yunsheng Wu, Guangtao Zhai, Jian Yang, Dacheng Tao2026-03-10💻 cs