cs.LG 篇论文 | Gist.Science

CauKer: Classification Time Series Foundation Models Can Be Pretrained on Synthetic Data

本文提出了 CauKer 算法，通过结合高斯过程核组合与结构因果模型生成具有因果一致性的合成时间序列数据，实现了时间序列基础模型的高效预训练，并揭示了其在数据规模与模型容量上呈现的清晰缩放规律。

Shifeng Xie, Vasilii Feofanov, Ambroise Odonnat, Lei Zan, Marius Alonso, Jianfeng Zhang, Themis Palpanas, Lujia Pan, Keli Zhang, Ievgen Redko2026-03-10🤖 cs.LG

GraphProp: Training the Graph Foundation Models using Graph Properties

本文提出了 GraphProp 方法，通过分两阶段训练（先利用图不变量预测构建结构基础模型，再将其作为位置编码融合节点属性），有效解决了图基础模型在跨域结构泛化上的不足，显著提升了其在图分类等任务中的表现，特别是在处理无节点属性图时的优势。

Ziheng Sun, Qi Feng, Lehao Lin, Chris Ding, Jicong Fan2026-03-10🤖 cs.LG

Time-Scale Coupling Between States and Parameters in Recurrent Neural Networks

该论文揭示了循环神经网络中的门控机制通过状态与参数的时间尺度耦合，充当数据驱动的优化预条件器，从而产生滞后依赖和方向依赖的有效学习率，并解释了门控架构在训练鲁棒性方面的优势。

Lorenzo Livi2026-03-10🤖 cs.LG

ECHO: Frequency-aware Hierarchical Encoding for Variable-length Signals

本文提出了名为 ECHO 的新型基础模型，通过融合频带分割架构与频率位置编码，实现了对任意采样率和可变长度机器信号（如声学、振动及工业传感器数据）的高效建模，并在异常检测与故障分类任务中取得了领先性能。

Yucong Zhang, Juan Liu, Ming Li2026-03-10🤖 cs.LG

Constraint Learning in Multi-Agent Dynamic Games from Demonstrations of Local Nash Interactions

该论文提出了一种基于逆动态博弈的算法，通过混合整数线性规划编码局部纳什均衡的 KKT 条件，从多智能体交互演示中准确学习参数化约束（包括凸与非凸约束），并据此生成满足底层安全约束的鲁棒运动规划。

Zhouyu Zhang, Chih-Yuan Chiu, Glen Chou2026-03-10🤖 cs.LG

CbLDM: A Diffusion Model for recovering nanostructure from atomic pair distribution function

该论文提出了一种基于条件的潜在扩散模型（CbLDM），利用拉普拉斯矩阵和条件先验，成功解决了从原子对分布函数（PDF）反演单金属纳米颗粒三维结构的病态逆问题，生成了既符合观测数据又具有物理意义的纳米结构。

Jiarui Cao, Zhiyang Zhang, Heming Wang, Jun Xu, Ling Lan, Simon J. L. Billinge, Ran Gu2026-03-10🔬 cond-mat.mtrl-sci

Entropy-Driven Curriculum for Multi-Task Training in Human Mobility Prediction

该论文提出了一种融合熵驱动课程学习与多任务学习的统一框架，通过基于 Lempel-Ziv 压缩的轨迹可预测性量化实现由简入繁的训练，并联合优化位置、距离及方向预测，从而在 HuMob 挑战赛中实现了状态最先进的人体移动预测性能与显著加速的收敛速度。

Tianye Fang, Xuanshu Luo, Martin Werner2026-03-10🤖 cs.LG

Synthetic data for ratemaking: imputation-based methods vs adversarial networks and autoencoders

该论文通过对比实验发现，基于多重插补（MICE）的方法在生成用于保险费率厘定的高质量合成数据方面，不仅能有效保留原始数据的分布特征和变量间关系，且相比变分自编码器和生成对抗网络等深度生成模型具有更低的实现复杂度。

Yevhen Havrylenko, Meelis Käärik, Artur Tuttar2026-03-10🤖 cs.LG

Faster Gradient Methods for Highly-Smooth Stochastic Bilevel Optimization

本文针对非凸强凸随机双层优化问题，提出了一种利用 $p$ 阶有限差分近似超梯度的 F $^2$ SA- $p$ 算法，将 $O(\epsilon^{-6})$ 的复杂度上界提升至 $\tilde{\mathcal{O}}(p \epsilon^{-4-p/2})$ ，并证明了在高度光滑条件下该上界接近 $\Omega(\epsilon^{-4})$ 的理论下界。

Lesi Chen, Junru Li, El Mahdi Chayti, Jingzhao Zhang2026-03-10🤖 cs.LG

Behavioral Inference at Scale: The Fundamental Asymmetry Between Motivations and Belief Systems

该研究通过大规模实验揭示了行为推断中的根本不对称性：动机推断准确率高达 98-100%，而信念系统推断受限于架构和信息理论瓶颈（LSTM 仅 24%，Transformer 最高 49%），导致在复杂行为序列中难以准确区分代理的内在信念。

Jason Starace, Terence Soule2026-03-10🤖 cs.LG

Synthetic Homes: An Accessible Multimodal Pipeline for Producing Residential Building Data with Generative AI

本文提出了一种基于生成式人工智能的模块化多模态框架，利用公开图像和住宅信息合成逼真的建筑参数数据，从而解决建筑能耗研究中数据获取成本高、隐私受限等问题，并支持从单体建筑到区域尺度的能源模拟研究。

Jackson Eshbaugh, Chetan Tiwari, Jorge Silveyra2026-03-10🤖 cs.LG

Physics-Aware Neural Operators for Direct Inversion in 3D Photoacoustic Tomography

该论文提出了一种名为 PANO 的物理感知神经算子，通过端到端直接学习从原始传感器测量到 3D 体积图像的逆映射，在无需重新训练的情况下实现了稀疏采样设置下的高质量、实时 3D 光声层析成像重建，显著优于传统算法并推动了该技术的临床转化。

Jiayun Wang, Yousuf Aborahama, Arya Khokhar, Yang Zhang, Chuwei Wang, Karteekeya Sastry, Julius Berner, Yilin Luo, Boris Bonev, Zongyi Li, Kamyar Azizzadenesheli, Lihong V. Wang, Anima Anandkumar2026-03-10🤖 cs.LG

Fast reconstruction of degenerate populations of conductance-based neuron models from spike times

该论文提出了一种结合深度学习与动态输入电导（DICs）框架的新方法，能够仅从尖峰时间数据中快速、鲁棒地重建具有简并性的电导基神经元模型种群，从而在毫秒级时间内实现从实验观测到机制模型的可靠推断。

Julien Brandoit, Damien Ernst, Guillaume Drion, Arthur Fyon2026-03-10🤖 cs.LG

MICA: Multi-Agent Industrial Coordination Assistant

本文提出了 MICA（多智能体工业协调助手），这是一个在受限计算与隐私约束下运行的感知驱动、语音交互系统，它通过五个角色专用智能体与自适应步骤融合技术，为工业装配、故障排查等任务提供实时、安全且可靠的指导，并建立了相应的评估基准以验证其优越性。

Di Wen, Kunyu Peng, Junwei Zheng, Yufan Chen, Yitian Shi, Jiale Wei, Ruiping Liu, Kailun Yang, Rainer Stiefelhagen2026-03-10🤖 cs.LG

ORIC: Benchmarking Object Recognition under Contextual Incongruity in Large Vision-Language Models

该论文提出了 ORIC 框架，通过构建上下文不协调的物体识别基准（ORIC-Bench）揭示了大视觉语言模型在此类场景下的性能退化与幻觉问题，并验证了基于该框架数据的视觉强化微调能有效提升模型的可靠性。

Zhaoyang Li, Zhan Ling, Yuchen Zhou, Litian Gong, Erdem Bıyık, Hao Su2026-03-10🤖 cs.LG

ORN-CBF: Learning Observation-conditioned Residual Neural Control Barrier Functions via Hypernetworks

本文提出了一种基于哈密顿 - 雅可比可达性分析的观测条件残差神经控制障碍函数（ORN-CBF）方法，利用超网络架构确保预测安全集不与观测到的失效集相交，从而在部分可观测环境中近似恢复最大安全集，并通过仿真与硬件实验验证了其在提升地面机器人与四旋翼飞行器安全性及泛化能力方面的有效性。

Bojan Derajic, Sebastian Bernhard, Wolfgang Hönig2026-03-10🤖 cs.LG

Empirical PAC-Bayes bounds for Markov chains

本文提出了一种针对马尔可夫链的全新 PAC-Bayes 界，通过在有穷状态空间下对伪谱间隙提供经验上界，实现了首个完全经验化的 PAC-Bayes 泛化界。

Vahe Karagulyan, Pierre Alquier2026-03-10🤖 cs.LG

Linear probes rely on textual evidence: Results from leakage mitigation studies in language models

该研究发现，线性探针严重依赖文本证据（如系统提示或思维链），一旦过滤掉这些表面文本信息，其在检测沙袋行为、阿谀奉承和偏见等潜在有害行为时的性能会显著下降，表明此类探针在识别非表层模式时存在脆弱性。

Gerard Boxo, Aman Neelappa, Shivam Raval2026-03-10🤖 cs.LG

AEGIS: Authentic Edge Growth In Sparsity for Link Prediction in Edge-Sparse Bipartite Knowledge Graphs

本文提出了 AEGIS 框架，通过仅对现有训练边进行重采样（包括基于语义 KNN 的增强）而非生成虚假节点，有效解决了边缘稀疏二分知识图谱中的链接预测难题，并在多个基准测试中证明了其在提升预测性能与校准度方面的有效性。

Hugh Xuechen Liu, Kıvanç Tatar2026-03-10🤖 cs.LG

Aurora: Towards Universal Generative Multimodal Time Series Forecasting

本文提出了 Aurora，一种支持多模态输入和零样本推理的通用生成式多模态时间序列基础模型，它通过自适应提取文本或图像中的领域知识来指导时序建模，并利用原型引导的流匹配实现跨域泛化能力卓越的生成式概率预测。

Xingjian Wu, Jianxin Jin, Wanghui Qiu + 4 more2026-03-10🤖 cs.LG