The Radio-Frequency Transformer for Signal Separation

该论文提出了一种完全数据驱动的射频信号分离方法,通过结合改进的有限标量量化(FSQ)离散分词器与交叉熵损失训练的端到端 Transformer 模型,在无需先验干扰信息的情况下实现了比传统方法显著更优的分离性能,并展现出在引力波等科学传感领域的泛化潜力。

Egor Lifar, Semyon Savkin, Rachana Madhukara, Tejas Jayashankar, Yury Polyanskiy, Gregory W. Wornell2026-03-11🤖 cs.LG

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

本文提出了一种名为 RQRE-OVI 的乐观值迭代算法,用于在大规模或连续状态空间下通过线性函数近似计算风险敏感量化响应均衡(RQRE),该算法不仅具有理论上的收敛保证和样本复杂度分析,还通过引入理性与风险敏感参数在性能与鲁棒性之间建立了可调节的帕累托前沿,从而在跨博弈场景中展现出比传统纳什均衡方法更优越的稳定性与泛化能力。

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. Ratliff2026-03-11🤖 cs.LG

Beyond Test-Time Training: Learning to Reason via Hardware-Efficient Optimal Control

该论文提出了一种名为“测试时控制(TTC)”的硬件高效架构层,通过将推理建模为最优控制问题并在推理阶段执行有限时域 LQR 规划,显著提升了预训练大语言模型在数学推理任务中的表现,而无需依赖额外的测试时训练。

Peihao Wang, Shan Yang, Xijun Wang, Tesi Xiao, Xin Liu, Changlong Yu, Yu Lou, Pan Li, Zhangyang Wang, Ming Lin, René Vidal2026-03-11🤖 cs.LG

Transductive Generalization via Optimal Transport and Its Application to Graph Node Classification

该论文提出了一种基于最优传输的分布无关转导泛化界,通过计算编码特征分布间的 Wasserstein 距离,不仅提供了高效可计算且与图节点分类实证泛化性能强相关的理论界,还揭示了 GNN 聚合过程如何通过深度依赖的表征分布变换来解释深度与泛化误差之间的非单调关系。

MoonJeong Park, Seungbeom Lee, Kyungmin Kim, Jaeseung Heo, Seunghyuk Cho, Shouheng Li, Sangdon Park, Dongwoo Kim2026-03-11🤖 cs.LG