cs.LG 篇论文 | Gist.Science

HDLxGraph: Bridging Large Language Models and HDL Repositories via HDL Graph Databases

该论文提出了首个将硬件描述语言（HDL）固有图特征（如抽象语法树和数据流图）与检索增强生成（RAG）相结合的 HDLxGraph 框架，并发布了基于真实项目的 HDLSearch 基准数据集，有效解决了现有 RAG 在处理复杂 HDL 项目时面临的结构性与词汇性不匹配问题，显著提升了搜索、调试和代码补全的准确率。

Pingqing Zheng (Katie), Jiayin Qin (Katie), Fuqi Zhang (Katie), Niraj Chitla (Katie), Zishen Wan (Katie), Shang Wu (Katie), Yu Cao (Katie), Caiwen Ding (Katie), Yang (Katie), Zhao2026-03-10🤖 cs.LG

WikiDBGraph: A Data Management Benchmark Suite for Collaborative Learning over Database Silos

针对现有协同学习基准忽视真实世界数据孤岛中表连接与对齐等端到端数据管理流程的不足，本文构建了基于 10 万个真实关系数据库的 WikiDBGraph 基准套件，以评估并揭示现有方法在复杂异构数据环境下的局限性及改进方向。

Zhaomin Wu, Ziyang Wang, Bingsheng He2026-03-10🤖 cs.LG

The Cell Must Go On: Agar.io for Continual Reinforcement Learning

本文提出了基于非回合制游戏 Agar.io 的持续强化学习研究平台 AgarCL，该平台通过高维、随机且动态演化的环境为智能体提供了渐进式行为发展的测试场，并通过对多种算法的评估揭示了 AgarCL 所面临的挑战超越了传统的稳定性 - 可塑性困境。

Mohamed A. Mohamed, Kateryna Nekhomiazh, Vedant Vyas, Marcos M. Jose, Andrew Patterson, Marlos C. Machado2026-03-10🤖 cs.LG

X-MethaneWet: A Cross-scale Global Wetland Methane Emission Benchmark Dataset for Advancing Science Discovery with AI

本文提出了首个跨尺度全球湿地甲烷排放基准数据集 X-MethaneWet，该数据集融合了物理模型模拟与实地观测数据，并通过评估深度学习模型及迁移学习策略，为利用人工智能提升全球甲烷通量建模精度与科学发现提供了新途径。

Yiming Sun, Shuo Chen, Shengyu Chen, Chonghao Qiu, Licheng Liu, Youmi Oh, Sparkle L. Malone, Gavin McNicol, Qianlai Zhuang, Chris Smith, Yiqun Xie, Xiaowei Jia2026-03-10🤖 cs.LG

Maximum Principle of Optimal Probability Density Control

该论文建立了一个针对无限维概率分布空间的最优控制最大原理与哈密顿 - 雅可比 - 贝尔曼方程的通用理论框架，并提出了结合深度神经网络的扩展数值算法，以有效解决包含障碍物和智能体交互的大规模多智能体控制问题。

Nathan Gaby, Xiaojing Ye2026-03-10🤖 cs.LG

VISTA: Vision-Language Inference for Training-Free Stock Time-Series Analysis

本文提出了名为 VISTA 的免训练框架，通过结合文本与图表多模态信息并利用思维链提示引导视觉语言模型，在零样本设置下实现了显著优于传统统计模型及单模态方法的股票价格预测性能。

Tina Khezresmaeilzadeh, Parsa Razmara, Seyedarmin Azizi, Mohammad Erfan Sadeghi, Erfan Baghaei Potraghloo2026-03-10🤖 cs.LG

Stronger Enforcement of Instruction Hierarchy via Augmented Intermediate Representations

该论文提出了一种通过向大语言模型的中间层表示注入可训练嵌入来增强指令层级信号的新方法，从而显著降低了提示注入攻击的成功率，同时保持了模型的实用性。

Sanjay Kariyappa, G. Edward Suh2026-03-10🤖 cs.LG

OCN: Effectively Utilizing Higher-Order Common Neighbors for Better Link Prediction

该论文针对高阶共同邻居中存在的冗余和过平滑问题，提出了通过正交化和归一化技术消除重复并缓解过平滑的“正交共同邻居（OCN）”方法，在多个链接预测基准测试中显著优于现有最先进模型。

Juntong Wang, Xiyuan Wang, Muhan Zhang2026-03-10🤖 cs.LG

ViTaPEs: Visuotactile Position Encodings for Cross-Modal Alignment in Multimodal Transformers

本文提出了名为 ViTaPEs 的基于 Transformer 的架构，通过引入包含模态内局部编码与跨模态全局编码的两阶段位置注入机制，实现了任务无关的视触觉表征学习，在多项真实世界数据集的识别任务及机器人抓取场景中均展现出超越现有最先进方法的性能与零样本泛化能力。

Fotios Lygerakis, Ozan Özdenizci, Elmar Rückert2026-03-10🤖 cs.LG

LoFT: Low-Rank Adaptation That Behaves Like Full Fine-Tuning

本文提出了 LoFT 方法，通过将优化器的一阶和二阶动量投影到低秩子空间以对齐全量微调的动态，从而在不增加推理成本或额外超参数调优的情况下，显著缩小了参数高效微调与全量微调之间的性能差距。

Nurbek Tastan, Stefanos Laskaridis, Martin Takac, Karthik Nandakumar, Samuel Horvath2026-03-10🤖 cs.LG

Rethinking Continual Learning with Progressive Neural Collapse

该论文提出了名为“渐进式神经坍缩”（ProNC）的新框架，通过动态扩展等角紧帧（ETF）目标而非依赖固定全局 ETF，有效缓解了持续学习中的灾难性遗忘问题，并在实验中展现出优于现有基线的性能与灵活性。

Zheng Wang, Wanhao Yu, Li Yang, Sen Lin2026-03-10🤖 cs.LG

Adaptive Correction for Ensuring Conservation Laws in Neural Operators

该论文提出了一种即插即用的自适应校正方法，通过引入轻量级可学习算子，在保持神经算子表达能力的同时灵活且严格地确保质量、动量等物理守恒定律，从而显著提升了模型在求解偏微分方程时的精度、稳定性及整体性能。

Chaoyu Liu, Yangming Li, Zhongying Deng, Chris Budd, Carola-Bibiane Schönlieb2026-03-10🤖 cs.LG

ActivePusher: Active Learning and Planning with Residual Physics for Nonprehensile Manipulation

本文提出了 ActivePusher 框架，通过结合残差物理建模与基于不确定性的主动学习，优化非抓取操作中的数据收集与规划过程，从而显著提升了数据效率及在仿真和真实环境中的规划成功率。

Zhuoyun Zhong, Seyedali Golestaneh, Constantinos Chamzas2026-03-10🤖 cs.LG

MMTU: A Massive Multi-Task Table Understanding and Reasoning Benchmark

本文提出了 MMTU，一个包含 28,000 多个问题和 25 项真实世界任务的大规模基准测试，旨在全面评估大语言模型在专家级表格理解、推理及操作方面的能力，并揭示了当前顶尖模型在此领域仍存在显著不足。

Junjie Xing, Yeye He, Mengyu Zhou, Haoyu Dong, Shi Han, Lingjiao Chen, Dongmei Zhang, Surajit Chaudhuri, H. V. Jagadish2026-03-10🤖 cs.LG

Leveraging chaotic transients in the training of artificial neural networks

该论文表明，通过利用大学习率下梯度下降优化产生的瞬态混沌动力学（即处于探索与利用平衡的临界混沌状态），可以显著加速人工神经网络在多种监督学习任务中的训练过程。

Pedro Jiménez-González, Miguel C. Soriano, Lucas Lacasa2026-03-10🤖 cs.LG

EROICA: Online Performance Troubleshooting for Large-scale Model Training

本文介绍了 EROICA，这是首个面向大规模模型训练的在线性能故障诊断系统，它通过在线剖析和差异可观测性技术，在几乎不影响生产环境的前提下，实现了对涵盖约 10 万张 GPU 集群中软硬件混合故障的细粒度、全覆盖诊断，并在实际部署中取得了 97.5% 的成功率。

Yu Guan, Zhiyu Yin, Haoyu Chen, Sheng Cheng, Chaojie Yang, Kun Qian, Tianyin Xu, Pengcheng Zhang, Yang Zhang, Hanyu Zhao, Yong Li, Wei Lin, Dennis Cai, Ennan Zhai2026-03-10🤖 cs.LG

BemaGANv2: Discriminator Combination Strategies for GAN-based Vocoders in Long-Term Audio Generation

本文提出了 BemaGANv2，一种通过引入 AMP 生成模块和 MED 判别器，并系统评估多种判别器组合策略，以实现高保真、长时程音频生成（如文本转音乐/音频）的先进 GAN 语音合成器。

Taesoo Park, Mungwi Jeong, Mingyu Park, Narae Kim, Junyoung Kim, Mujung Kim, Jisang Yoo, Hoyun Lee, Sanghoon Kim, Soonchul Kwon2026-03-10🤖 cs.LG

Co-LoRA: Collaborative Model Personalization on Heterogeneous Multi-Modal Clients

本文针对现实场景中数据与模型异构的挑战，提出了任务相关性感知的聚合策略及维度不变模块 Co-LoRA，并构建了涵盖 40 个任务的多模态基准，显著提升了个性化联邦学习在异构环境下的性能。

Minhyuk Seo, Taeheon Kim, Hankook Lee, Jonghyun Choi, Tinne Tuytelaars2026-03-10🤖 cs.LG

Efficient Algorithms for Logistic Contextual Slate Bandits with Bandit Feedback

该论文提出了两种高效算法（Slate-GLM-OFU 和 Slate-GLM-TS）来解决具有指数级候选集和逻辑回归奖励的上下文石板多臂老虎机问题，通过局部规划实现低计算复杂度并保证 $\tilde{O}(\sqrt{T})$ 的累积遗憾，且在合成实验与大语言模型提示工程应用中均优于现有基准。

Tanmay Goyal, Gaurav Sinha2026-03-10🤖 cs.LG

Sharpness-Aware Machine Unlearning

该论文通过揭示锐度感知最小化（SAM）在机器遗忘中因拟合遗忘集而丧失去噪特性的机制，提出了将模型拆分并分别利用 SAM 学习保留信号与锐度最大化消除遗忘信号的“锐度极小极大（Sharp MinMax）”方法，从而在降低保留数据需求的同时显著提升了遗忘效果并增强了模型安全性。

Haoran Tang, Rajiv Khanna2026-03-10🤖 cs.LG