From Tokenizer Bias to Backbone Capability: A Controlled Study of LLMs for Time Series Forecasting

该论文通过构建三种具有不同预训练策略的模型进行受控研究,揭示了在时间序列预测中,小数据集上的 Tokenizer 过拟合会掩盖大语言模型(LLM)的真实潜力,而即便采用大规模预训练消除偏差,LLM 骨干网络的性能仍有限,且未能一致超越专为大规模时间序列数据训练的专用模型。

Xinyu Zhang, Shanshan Feng, Xutao Li, Kenghong Lin, Fan Li, Pengfei Jia2026-03-09🤖 cs.AI

FourierSpecNet: Neural Collision Operator Approximation Inspired by the Fourier Spectral Method for Solving the Boltzmann Equation

本文提出了一种名为 FourierSpecNet 的混合框架,通过将傅里叶谱方法与深度学习相结合来高效近似玻尔兹曼方程中的碰撞算子,该方法不仅具备分辨率不变性和零样本超分辨率能力,还证明了在离散化细化时收敛于谱解,从而在保持高精度的同时显著降低了弹性与非弹性碰撞场景下的计算成本。

Jae Yong Lee, Gwang Jae Jung, Byung Chan Lim, Hyung Ju Hwang2026-03-09🤖 cs.AI

Scalable Multi-Task Learning for Particle Collision Event Reconstruction with Heterogeneous Graph Neural Networks

本文提出了一种基于异构图神经网络的多任务学习框架,通过集成图剪枝层和加权消息传递机制,在模拟 LHCb 实验环境中显著提升了高亮度对撞机下 beauty 强子的重建性能,同时实现了粒子顶点关联与图剪枝的协同优化及推理效率的扩展。

William Sutcliffe, Marta Calvi, Simone Capelli + 5 more2026-03-09⚛️ hep-ex

ESGenius: Benchmarking LLMs on Environmental, Social, and Governance (ESG) and Sustainability Knowledge

本文提出了首个全面评估大语言模型在环境、社会和治理(ESG)及可持续发展领域知识掌握程度的基准ESGenius,该基准包含经专家验证的问答数据集与权威语料库,并通过零样本和检索增强生成(RAG)两种评估模式揭示了当前模型在该专业领域的知识缺口,同时证明了RAG技术在显著提升模型表现方面的关键作用。

Chaoyue He, Xin Zhou, Yi Wu + 9 more2026-03-09💬 cs.CL

Sysformer: Safeguarding Frozen Large Language Models with Adaptive System Prompts

该论文提出了名为 Sysformer 的新方法,通过训练一个轻量级 Transformer 模型在输入嵌入空间中动态自适应地优化系统提示,从而在不微调冻结大语言模型参数的前提下,显著提升了模型对有害提示的拒绝率以及对安全提示的遵循度,并有效抵御了复杂的越狱攻击。

Kartik Sharma, Yiqiao Jin, Vineeth Rakesh, Yingtong Dou, Menghai Pan, Mahashweta Das, Srijan Kumar2026-03-09🤖 cs.AI

Temporal Misalignment Attacks against Multimodal Perception in Autonomous Driving

该论文提出了名为 DejaVu 的攻击方法,通过利用车载网络制造摄像头与 LiDAR 数据间的细微时间错位,揭示了多模态感知系统对时序同步的脆弱性,并证实此类攻击可导致目标检测与跟踪性能大幅下降,进而引发自动驾驶车辆碰撞或幽灵刹车等严重安全事故。

Md Hasan Shahriar, Md Mohaimin Al Barat, Harshavardhan Sundar, Ning Zhang, Naren Ramakrishnan, Y. Thomas Hou, Wenjing Lou2026-03-09🤖 cs.LG

Diverse and Adaptive Behavior Curriculum for Autonomous Driving: A Student-Teacher Framework with Multi-Agent RL

该论文提出了一种基于师生框架的自动课程学习新方法,利用图结构多智能体强化学习作为教师自适应生成涵盖从常规到关键场景的多样化交通行为,从而有效训练出在复杂真实交通环境中更具鲁棒性、平衡性和进取性的自动驾驶智能体。

Ahmed Abouelazm, Johannes Ratz, Philip Schörner, J. Marius Zöllner2026-03-09🤖 cs.LG

Multivariate Fields of Experts for Convergent Image Reconstruction

本文提出了一种基于\ell_\infty-范数 Moreau 包络构建多元势函数的“多元专家场”新框架,用于图像先验学习,该模型在图像去噪、去模糊及压缩感知 MRI 等多种逆问题中,不仅性能优于传统单变量模型并接近深度学习正则化方法,还兼具训练数据需求少、参数少、速度快、可解释性强以及拥有理论收敛保证等优势。

Stanislas Ducotterd, Michael Unser2026-03-09🤖 cs.LG

Kernel VICReg for Self-Supervised Learning in Reproducing Kernel Hilbert Space

本文提出了 Kernel VICReg,一种将 VICReg 自监督学习目标引入再生核希尔伯特空间(RKHS)的新框架,通过核化损失函数中的方差、不变性和协方差项,在无需显式映射的情况下实现非线性特征学习,从而在非线性结构显著或样本有限的场景下有效缓解表征坍塌并提升性能。

M. Hadi Sepanj, Benyamin Ghojogh, Saed Moradi, Paul Fieguth2026-03-09🤖 cs.LG