UniBYD: A Unified Framework for Learning Robotic Manipulation Across Embodiments Beyond Imitation of Human Demonstrations

本文提出了 UniBYD 统一框架,通过结合统一形态表示、动态 PPO 算法及混合马尔可夫影子引擎,实现了从模仿人类演示到适应多样化机器人形态的强化学习策略探索,并在首个跨本体操作基准 UniManip 上取得了显著性能提升。

Tingyu Yuan, Biaoliang Guan, Wen Ye, Ziyan Tian, Yi Yang, Weijie Zhou, Zhaowen Li, Yan Huang, Peng Wang, Chaoyang Zhao, Jinqiao WangWed, 11 Ma💻 cs

Taming Preference Mode Collapse via Directional Decoupling Alignment in Diffusion Reinforcement Learning

该论文针对扩散模型强化学习中的偏好模式崩溃问题,提出了 DivGenBench 基准测试并设计了方向解耦对齐(D²-Align)框架,通过方向性修正奖励信号在保持生成多样性的同时实现了更优的人类偏好对齐。

Chubin Chen, Sujie Hu, Jiashu Zhu, Meiqi Wu, Jintao Chen, Yanxun Li, Nisha Huang, Chengyu Fang, Jiahong Wu, Xiangxiang Chu, Xiu LiWed, 11 Ma💻 cs

A Tale of 1001 LoC: Potential Runtime Error-Guided Specification Synthesis for Verifying Large-Scale Programs

本文提出了名为 Preguss 的模块化细粒度框架,通过结合静态分析与大语言模型,利用潜在运行时错误引导验证单元构建与优先级排序,成功实现了对千行代码级大规模程序的高度自动化形式化验证,显著降低了人工验证成本。

Zhongyi Wang, Tengjie Lin, Mingshuai Chen, Haokun Li, Mingqi Yang, Xiao Yi, Shengchao Qin, Yixing Luo, Xiaofeng Li, Bin Gu, Liqiang Lu, Jianwei YinWed, 11 Ma💻 cs

CovertComBench: A First Domain-Specific Testbed for LLMs in Wireless Covert Communication

本文提出了首个面向无线隐蔽通信的专用基准测试 CovertComBench,旨在评估大语言模型在该领域的能力,研究发现尽管模型在概念理解和代码生成方面表现优异,但在满足严格安全约束的数学推导上存在显著不足,表明当前大模型更适合作为辅助工具而非自主解决安全约束优化问题的方案。

Zhaozhi Liu, Jiaxin Chen, Yuanai Xie, Yuna Jiang, Minrui Xu, Xiao Zhang, Pan Lai, Zan ZhouWed, 11 Ma💻 cs

Optimal conversion from Rényi Differential Privacy to ff-Differential Privacy

本文证明了将 Rényi 差分隐私(RDP)转换为 ff-差分隐私的最优规则,即通过取所有单阶 RDP 隐私区域交点所确定的逐点最大贸易函数,该规则在所有 RDP 配置和 Type I 错误水平下均具有最优性,且无法被任何其他黑盒转换方法在 Blackwell 意义上统一超越。

Anneliese Riess, Juan Felipe Gomez, Flavio du Pin Calmon, Julia Anne Schnabel, Georgios KaissisWed, 11 Ma💻 cs

Pathwise Test-Time Correction for Autoregressive Long Video Generation

该论文提出了一种无需训练的测试时校正(TTC)方法,通过利用初始帧作为稳定参考锚点来校准自回归蒸馏模型在长视频生成过程中的随机状态,从而有效解决了误差累积问题,在几乎不增加开销的情况下实现了长达 30 秒的高质量视频生成。

Xunzhi Xiang, Zixuan Duan, Guiyu Zhang, Haiyu Zhang, Zhe Gao, Junta Wu, Shaofeng Zhang, Tengfei Wang, Qi Fan, Chunchao GuoWed, 11 Ma💻 cs

Queer NLP: A Critical Survey on Literature Gaps, Biases and Trends

这篇论文系统综述了 ACL 文献中关于 LGBTQIA+ 群体与自然语言处理(NLP)技术关系的研究,指出当前工作多侧重于被动识别偏见而非主动构建解决方案,并呼吁未来在利益相关者参与、交叉性、跨学科合作及非英语语言研究等方面采取行动,以推动更公正包容的 NLP 技术发展。

Sabine Weber, Angelina Wang, Ankush Gupta, Arjun Subramonian, Dennis Ulmer, Eshaan Tanwar, Geetanjali Aich, Hannah Devinney, Jacob Hobbs, Jennifer Mickel, Joshua Tint, Mae Sosto, Ray Groshan, Simone Astarita, Vagrant Gautam, Verena Blaschke, William Agnew, Wilson Y Lee, Yanan LongWed, 11 Ma💻 cs