cs.LG 篇论文 | Gist.Science

Wrong Code, Right Structure: Learning Netlist Representations from Imperfect LLM-Generated RTL

该论文提出了一种利用大语言模型生成的功能不完备但结构正确的 RTL 代码来构建合成数据集的新框架，有效突破了电路网表示学习中真实标注数据稀缺的瓶颈，并证明了由此训练的模型在子电路边界识别和组件分类等任务上能媲美甚至超越基于高质量数据的现有方法。

Siyang Cai, Cangyuan Li, Yinhe Han, Ying Wang2026-03-11🤖 cs.AI

GIAT: A Geologically-Informed Attention Transformer for Lithology Identification

本文提出了一种名为 GIAT 的新型框架，通过将地质先验知识（利用类别序列相关性滤波器生成关系矩阵）融入 Transformer 的注意力机制，显著提升了测井岩性识别的准确性、可靠性及可解释性。

Jie Li, Qishun Yang, Nuo Li2026-03-11🤖 cs.AI

Better Bounds for the Distributed Experts Problem

本文提出了一种新的分布式专家问题协议，通过优化通信量实现了比先前工作更优的遗憾界。

David P. Woodruff, Samson Zhou2026-03-11🤖 cs.LG

Differentiable Stochastic Traffic Dynamics: Physics-Informed Generative Modelling in Transportation

本文提出了一种基于伊托型随机交通流模型的可微分生成框架，通过将物理约束从确定性偏微分方程扩展为分布形式，利用包含平流闭合模块的评分网络结合去噪得分匹配与福克 - 普朗克残差损失，实现了能够输出概率分布、置信区间及拥堵风险度量的物理信息交通状态估计。

Wuping Xin2026-03-11🤖 cs.AI

Latent-DARM: Bridging Discrete Diffusion And Autoregressive Models For Reasoning

本文提出了 Latent-DARM 框架，通过在潜在空间连接离散扩散模型（作为规划器）与自回归模型（作为执行器），有效克服了单一模型在推理规划或文本流畅性上的局限，在显著提升数学、科学及常识推理基准准确率的同时，大幅降低了 token 消耗。

Lina Berrayana, Ahmed Heakl, Abdullah Sohail, Thomas Hofmann, Salman Khan, Wei Chen2026-03-11🤖 cs.AI

The Costs of Reproducibility in Music Separation Research: a Replication of Band-Split RNN

本文通过尝试复现未公开代码的 BSRNN 音乐分离模型，揭示了研究可复现性面临的巨大成本，并在此基础上提出了性能更优的改进模型，同时公开了代码与预训练模型以推动该领域的透明与可持续发展。

Paul Magron, Romain Serizel, Constance Douwes2026-03-11🤖 cs.LG

$P^2$ GNN: Two Prototype Sets to boost GNN Performance

本文提出了 $P^2$ GNN，一种通过利用两组原型（作为全局上下文的全局邻居和用于去噪的聚类原型）来优化消息传递的即插即用技术，从而有效解决了传统图神经网络过度依赖局部上下文和同质性假设的问题，并在节点推荐与分类任务中显著提升了性能。

Arihant Jain, Gundeep Arora, Anoop Saladi, Chaosheng Dong2026-03-11🤖 cs.LG

The Reasoning Trap -- Logical Reasoning as a Mechanistic Pathway to Situational Awareness

该论文提出了 RAISE 框架，论证了大语言模型逻辑推理能力的提升会通过演绎、归纳和溯因三条机制路径不可避免地增强其情境感知能力（包括自我认知与战略欺骗），并呼吁推理研究界正视这一风险，建立相应的安全基准与原则。

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-11🤖 cs.AI

The Radio-Frequency Transformer for Signal Separation

该论文提出了一种完全数据驱动的射频信号分离方法，通过结合改进的有限标量量化（FSQ）离散分词器与交叉熵损失训练的端到端 Transformer 模型，在无需先验干扰信息的情况下实现了比传统方法显著更优的分离性能，并展现出在引力波等科学传感领域的泛化潜力。

Egor Lifar, Semyon Savkin, Rachana Madhukara, Tejas Jayashankar, Yury Polyanskiy, Gregory W. Wornell2026-03-11🤖 cs.LG

Emotion is Not Just a Label: Latent Emotional Factors in LLM Processing

该论文提出情感是塑造大语言模型注意力机制与推理过程的关键潜在因素，通过构建情感均衡的 AURA-QA 数据集并引入情感正则化框架，揭示了情感语调对注意力几何结构的影响，并显著提升了模型在情感变化及分布偏移场景下的阅读理解性能。

Benjamin Reichman, Adar Avasian, Samuel Webster, Larry Heck2026-03-11🤖 cs.AI

MM-Zero: Self-Evolving Multi-Model Vision Language Models From Zero Data

本文提出了 MM-Zero，这是首个基于强化学习（GRPO）的框架，通过引入生成抽象视觉概念、编写渲染代码和执行多模态推理的三重角色机制，实现了无需任何种子数据即可从零开始的视觉语言模型自我进化。

Zongxia Li, Hongyang Du, Chengsong Huang, Xiyang Wu, Lantao Yu, Yicheng He, Jing Xie, Xiaomin Wu, Zhichao Liu, Jiarui Zhang, Fuxiao Liu2026-03-11🤖 cs.LG

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

本文提出了一种名为 RQRE-OVI 的乐观值迭代算法，用于在大规模或连续状态空间下通过线性函数近似计算风险敏感量化响应均衡（RQRE），该算法不仅具有理论上的收敛保证和样本复杂度分析，还通过引入理性与风险敏感参数在性能与鲁棒性之间建立了可调节的帕累托前沿，从而在跨博弈场景中展现出比传统纳什均衡方法更优越的稳定性与泛化能力。

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. Ratliff2026-03-11🤖 cs.LG

Beyond Test-Time Training: Learning to Reason via Hardware-Efficient Optimal Control

该论文提出了一种名为“测试时控制（TTC）”的硬件高效架构层，通过将推理建模为最优控制问题并在推理阶段执行有限时域 LQR 规划，显著提升了预训练大语言模型在数学推理任务中的表现，而无需依赖额外的测试时训练。

Peihao Wang, Shan Yang, Xijun Wang, Tesi Xiao, Xin Liu, Changlong Yu, Yu Lou, Pan Li, Zhangyang Wang, Ming Lin, René Vidal2026-03-11🤖 cs.LG

A Generative Sampler for distributions with possible discrete parameter based on Reversibility

本文提出了一种基于可逆性约束的通用生成采样框架，通过最小化前向与后向马尔可夫轨迹间的最大均值差异（MMD）并仅依赖能量评估，成功解决了连续、离散及混合变量复杂分布的采样难题。

Lei Li, Zhen Wang, Lishuo Zhang2026-03-11🤖 cs.LG

Efficient Reasoning at Fixed Test-Time Cost via Length-Aware Attention Priors and Gain-Aware Training

该论文提出了一种仅在训练阶段引入长度感知注意力先验（RPA）和增益感知控制器（Guardian）的方法，在无需增加推理计算成本的前提下，显著提升了中小规模 Transformer 模型在严格算力约束下的长序列推理效率与准确性。

Rian Atri2026-03-11🤖 cs.LG

Transductive Generalization via Optimal Transport and Its Application to Graph Node Classification

该论文提出了一种基于最优传输的分布无关转导泛化界，通过计算编码特征分布间的 Wasserstein 距离，不仅提供了高效可计算且与图节点分类实证泛化性能强相关的理论界，还揭示了 GNN 聚合过程如何通过深度依赖的表征分布变换来解释深度与泛化误差之间的非单调关系。

MoonJeong Park, Seungbeom Lee, Kyungmin Kim, Jaeseung Heo, Seunghyuk Cho, Shouheng Li, Sangdon Park, Dongwoo Kim2026-03-11🤖 cs.LG

DendroNN: Dendrocentric Neural Networks for Energy-Efficient Classification of Event-Based Data

本文提出了受树突计算机制启发的 DendroNN 模型，通过无梯度的重连机制识别时空脉冲序列，并设计了基于时间轮的异步数字硬件架构，从而在事件驱动数据处理中实现了比现有神经形态硬件高 4 倍的能效。

Jann Krausse, Zhe Su, Kyrus Mama, Maryada, Klaus Knobloch, Giacomo Indiveri, Jürgen Becker2026-03-11🤖 cs.AI

On Regret Bounds of Thompson Sampling for Bayesian Optimization

本文填补了高斯过程汤普森采样（GP-TS）在后悔界分析上的空白，通过证明其下界、二阶矩上界以及期望温和后悔界，并放宽了时间视界 $T$ 上累积后悔上界的推导条件，从而建立了多项式依赖 $\delta$ 的后悔下界及改进的累积后悔上界。

Shion Takeno, Shogo Iwazaki2026-03-11🤖 cs.LG

Proxy-Guided Measurement Calibration

该论文提出了一种基于代理变量的两阶段框架，利用变分自编码器分离潜在的内容与偏差变量，以识别并校正由调查和行政记录中系统性测量误差导致的聚合结果变量偏差。

Saketh Vishnubhatla, Shu Wan, Andre Harrison, Adrienne Raglin, Huan Liu2026-03-11🤖 cs.LG

A Gaussian Comparison Theorem for Training Dynamics in Machine Learning

该论文基于高斯比较定理，建立了机器学习训练动力学与更易分析的对偶动力系统之间的非渐近联系，不仅严格证明了动态平均场理论在渐近场景下的有效性，还提出了一种迭代细化方案以在有限样本域中引入涨落参数从而获得更精确的训练演化描述。

Ashkan Panahi2026-03-11🤖 cs.LG

cs.LG