cs.LG 篇论文 | Gist.Science

$P^2$ GNN: Two Prototype Sets to boost GNN Performance

本文提出了 $P^2$ GNN，一种通过利用两组原型（作为全局上下文的全局邻居和用于去噪的聚类原型）来优化消息传递的即插即用技术，从而有效解决了传统图神经网络过度依赖局部上下文和同质性假设的问题，并在节点推荐与分类任务中显著提升了性能。

Arihant Jain, Gundeep Arora, Anoop Saladi, Chaosheng Dong2026-03-11🤖 cs.LG

The Reasoning Trap -- Logical Reasoning as a Mechanistic Pathway to Situational Awareness

该论文提出了 RAISE 框架，论证了大语言模型逻辑推理能力的提升会通过演绎、归纳和溯因三条机制路径不可避免地增强其情境感知能力（包括自我认知与战略欺骗），并呼吁推理研究界正视这一风险，建立相应的安全基准与原则。

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-11🤖 cs.AI

The Radio-Frequency Transformer for Signal Separation

该论文提出了一种完全数据驱动的射频信号分离方法，通过结合改进的有限标量量化（FSQ）离散分词器与交叉熵损失训练的端到端 Transformer 模型，在无需先验干扰信息的情况下实现了比传统方法显著更优的分离性能，并展现出在引力波等科学传感领域的泛化潜力。

Egor Lifar, Semyon Savkin, Rachana Madhukara, Tejas Jayashankar, Yury Polyanskiy, Gregory W. Wornell2026-03-11🤖 cs.LG

Emotion is Not Just a Label: Latent Emotional Factors in LLM Processing

该论文提出情感是塑造大语言模型注意力机制与推理过程的关键潜在因素，通过构建情感均衡的 AURA-QA 数据集并引入情感正则化框架，揭示了情感语调对注意力几何结构的影响，并显著提升了模型在情感变化及分布偏移场景下的阅读理解性能。

Benjamin Reichman, Adar Avasian, Samuel Webster, Larry Heck2026-03-11🤖 cs.AI

MM-Zero: Self-Evolving Multi-Model Vision Language Models From Zero Data

本文提出了 MM-Zero，这是首个基于强化学习（GRPO）的框架，通过引入生成抽象视觉概念、编写渲染代码和执行多模态推理的三重角色机制，实现了无需任何种子数据即可从零开始的视觉语言模型自我进化。

Zongxia Li, Hongyang Du, Chengsong Huang, Xiyang Wu, Lantao Yu, Yicheng He, Jing Xie, Xiaomin Wu, Zhichao Liu, Jiarui Zhang, Fuxiao Liu2026-03-11🤖 cs.LG

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

本文提出了一种名为 RQRE-OVI 的乐观值迭代算法，用于在大规模或连续状态空间下通过线性函数近似计算风险敏感量化响应均衡（RQRE），该算法不仅具有理论上的收敛保证和样本复杂度分析，还通过引入理性与风险敏感参数在性能与鲁棒性之间建立了可调节的帕累托前沿，从而在跨博弈场景中展现出比传统纳什均衡方法更优越的稳定性与泛化能力。

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. Ratliff2026-03-11🤖 cs.LG

Beyond Test-Time Training: Learning to Reason via Hardware-Efficient Optimal Control

该论文提出了一种名为“测试时控制（TTC）”的硬件高效架构层，通过将推理建模为最优控制问题并在推理阶段执行有限时域 LQR 规划，显著提升了预训练大语言模型在数学推理任务中的表现，而无需依赖额外的测试时训练。

Peihao Wang, Shan Yang, Xijun Wang, Tesi Xiao, Xin Liu, Changlong Yu, Yu Lou, Pan Li, Zhangyang Wang, Ming Lin, René Vidal2026-03-11🤖 cs.LG

A Generative Sampler for distributions with possible discrete parameter based on Reversibility

本文提出了一种基于可逆性约束的通用生成采样框架，通过最小化前向与后向马尔可夫轨迹间的最大均值差异（MMD）并仅依赖能量评估，成功解决了连续、离散及混合变量复杂分布的采样难题。

Lei Li, Zhen Wang, Lishuo Zhang2026-03-11🤖 cs.LG

Efficient Reasoning at Fixed Test-Time Cost via Length-Aware Attention Priors and Gain-Aware Training

该论文提出了一种仅在训练阶段引入长度感知注意力先验（RPA）和增益感知控制器（Guardian）的方法，在无需增加推理计算成本的前提下，显著提升了中小规模 Transformer 模型在严格算力约束下的长序列推理效率与准确性。

Rian Atri2026-03-11🤖 cs.LG

Transductive Generalization via Optimal Transport and Its Application to Graph Node Classification

该论文提出了一种基于最优传输的分布无关转导泛化界，通过计算编码特征分布间的 Wasserstein 距离，不仅提供了高效可计算且与图节点分类实证泛化性能强相关的理论界，还揭示了 GNN 聚合过程如何通过深度依赖的表征分布变换来解释深度与泛化误差之间的非单调关系。

MoonJeong Park, Seungbeom Lee, Kyungmin Kim, Jaeseung Heo, Seunghyuk Cho, Shouheng Li, Sangdon Park, Dongwoo Kim2026-03-11🤖 cs.LG

DendroNN: Dendrocentric Neural Networks for Energy-Efficient Classification of Event-Based Data

本文提出了受树突计算机制启发的 DendroNN 模型，通过无梯度的重连机制识别时空脉冲序列，并设计了基于时间轮的异步数字硬件架构，从而在事件驱动数据处理中实现了比现有神经形态硬件高 4 倍的能效。

Jann Krausse, Zhe Su, Kyrus Mama, Maryada, Klaus Knobloch, Giacomo Indiveri, Jürgen Becker2026-03-11🤖 cs.AI

On Regret Bounds of Thompson Sampling for Bayesian Optimization

本文填补了高斯过程汤普森采样（GP-TS）在后悔界分析上的空白，通过证明其下界、二阶矩上界以及期望温和后悔界，并放宽了时间视界 $T$ 上累积后悔上界的推导条件，从而建立了多项式依赖 $\delta$ 的后悔下界及改进的累积后悔上界。

Shion Takeno, Shogo Iwazaki2026-03-11🤖 cs.LG

Proxy-Guided Measurement Calibration

该论文提出了一种基于代理变量的两阶段框架，利用变分自编码器分离潜在的内容与偏差变量，以识别并校正由调查和行政记录中系统性测量误差导致的聚合结果变量偏差。

Saketh Vishnubhatla, Shu Wan, Andre Harrison, Adrienne Raglin, Huan Liu2026-03-11🤖 cs.LG

A Gaussian Comparison Theorem for Training Dynamics in Machine Learning

该论文基于高斯比较定理，建立了机器学习训练动力学与更易分析的对偶动力系统之间的非渐近联系，不仅严格证明了动态平均场理论在渐近场景下的有效性，还提出了一种迭代细化方案以在有限样本域中引入涨落参数从而获得更精确的训练演化描述。

Ashkan Panahi2026-03-11🤖 cs.LG

CLoE: Expert Consistency Learning for Missing Modality Segmentation

本文提出了 CLoE 框架，通过引入模态专家与区域专家的双重一致性学习目标及可靠性感知特征重校准机制，有效解决了多模态医学图像分割中因模态缺失导致的专家分歧与融合不稳定问题，显著提升了模型在缺失模态场景下的性能及临床关键结构的鲁棒性。

Xinyu Tong, Meihua Zhou, Bowu Fan, Haitao Li2026-03-11🤖 cs.AI

Reward-Zero: Language Embedding Driven Implicit Reward Mechanisms for Reinforcement Learning

该论文提出了 Reward-Zero，一种利用语言嵌入将自然语言任务描述转化为密集语义进展信号的通用隐式奖励机制，旨在无需特定任务工程的情况下加速强化学习训练、提升泛化能力并解决复杂任务。

Heng Zhang, Haddy Alchaer, Arash Ajoudani, Yu She2026-03-11🤖 cs.LG

TA-GGAD: Testing-time Adaptive Graph Model for Generalist Graph Anomaly Detection

该论文针对图异常检测中的跨域泛化难题，提出了一种名为 TA-GGAD 的测试时自适应图基础模型，通过定义并建模“异常异配性”（Anomaly Disassortativity）特征失配问题，实现了仅需单次训练即可在多个不同领域图上达到最先进的检测精度。

Xiong Zhang, Hong Peng, Changlong Fu, Xin Jin, Yun Yang, Cheng Xie2026-03-11🤖 cs.AI

Interactive 3D visualization of surface roughness predictions in additive manufacturing: A data-driven framework

本文提出了一种数据驱动框架，通过结合多层感知机回归器与条件生成对抗网络来预测材料挤出增材制造中的表面粗糙度，并开发了交互式 3D 可视化决策支持系统，以在制造前直观评估不同工艺参数和朝向对零件表面质量的影响。

Engin Deniz Erkan, Elif Surer, Ulas Yaman2026-03-11🤖 cs.LG

Democratising Clinical AI through Dataset Condensation for Classical Clinical Models

该论文提出了一种结合差分隐私的零阶优化框架，将数据集压缩技术扩展至决策树和 Cox 回归等非可微临床模型，从而在保护患者隐私的同时实现了模型无关的临床数据共享。

Anshul Thakur, Soheila Molaei, Pafue Christy Nganjimi, Joshua Fieggen, Andrew A. S. Soltan, Danielle Belgrave, Lei Clifton, David A. Clifton2026-03-11🤖 cs.AI

From Representation to Clusters: A Contrastive Learning Approach for Attributed Hypergraph Clustering

本文提出了一种名为 CAHC 的端到端对比学习方法，通过结合节点与超边级别的对比学习目标以及聚类导向的联合优化，实现了属性超图嵌入学习与聚类结果的同步获取，从而在八个数据集上取得了优于现有基线的性能。

Li Ni, Shuaikang Zeng, Lin Mu, Longlong Lin2026-03-11🤖 cs.LG

cs.LG

P2P^2P2GNN: Two Prototype Sets to boost GNN Performance