cs.AI 篇论文 | Gist.Science

BACE-RUL: A Bi-directional Adversarial Network with Covariate Encoding for Machine Remaining Useful Life Prediction

本文提出了一种名为 BACE-RUL 的双向对抗网络模型，该模型仅利用当前生命周期内的传感器测量数据，通过协变量编码和条件生成机制来预测机械设备的剩余使用寿命，并在多个真实数据集上展现出优于现有方法的性能。

Zekai Zhang, Dan Li, Shunyu Wu + 4 more2026-03-06💻 cs

Safety Mirage: How Spurious Correlations Undermine VLM Safety Fine-Tuning and Can Be Mitigated by Machine Unlearning

该论文揭示了监督微调在视觉语言模型安全对齐中因强化虚假相关性而导致的“安全幻象”缺陷，并提出利用机器遗忘技术替代传统微调，从而在显著降低攻击成功率的同时大幅减少误拒现象。

Yiwei Chen, Yuguang Yao, Yihua Zhang + 3 more2026-03-06💻 cs

Advancing Problem-Based Learning in Biomedical Engineering in the Era of Generative AI

该研究通过佐治亚理工学院与埃默里大学联合项目为期三年的案例，展示了一种针对生物医学人工智能优化的进阶问题式学习（PBL）框架，有效克服了学生背景差异、资源限制及数据隐私等挑战，显著提升了学生的批判性思维、科研产出及解决真实生物医学问题的能力。

Micky C. Nnamdi, J. Ben Tamo, Benoit Marteau + 2 more2026-03-06💻 cs

Assessing the Impact of Code Changes on the Fault Localizability of Large Language Models

本文提出了首个大规模实证评估框架，通过向真实程序注入未见过的故障并应用语义保持变异来测试大语言模型的故障定位鲁棒性，发现模型在 78% 的情况下因过度依赖与语义无关的语法特征而失效，从而揭示了当前 LLM 在程序逻辑推理方面的根本局限。

Sabaat Haroon, Ahmad Faraz Khan, Ahmad Humayun + 5 more2026-03-06💻 cs

ms-Mamba: Multi-scale Mamba for Time-Series Forecasting

本文提出了多尺度 Mamba（ms-Mamba）架构，通过集成具有不同采样率的多个 Mamba 块来捕捉多时间尺度信息，在多个基准测试中实现了优于现有 Transformer 及 Mamba 模型的性能，同时显著降低了参数量、显存占用和计算开销。

Yusuf Meric Karadag, Ismail Talaz, Ipek Gursel Dino + 1 more2026-03-06💻 cs

Enhancing multimodal analogical reasoning with Logic Augmented Generation

本文提出了一种逻辑增强生成（LAG）框架，通过结合语义知识图谱与提示启发式方法，有效提升了大语言模型在跨模态数据上的类比推理能力，并在隐喻检测与理解任务中展现出超越基线模型及人类的表现，同时揭示了当前隐喻理解与评估中存在的局限性。

Anna Sofia Lippolis, Andrea Giovanni Nuzzolese, Aldo Gangemi2026-03-06💻 cs

Foam-Agent: Towards Automated Intelligent CFD Workflows

本文提出了 Foam-Agent，这是一个利用大语言模型和检索增强生成技术、通过多智能体协作实现从网格生成到后处理全流程自动化的计算流体力学（CFD）框架，在无需专家干预的情况下将 110 个模拟任务的执行成功率提升至 88.2%。

Ling Yue, Nithin Somasekharan, Tingwen Zhang + 4 more2026-03-06💻 cs

ReactDance: Hierarchical Representation for High-Fidelity and Coherent Long-Form Reactive Dance Generation

ReactDance 是一种基于扩散框架的舞蹈生成方法，通过引入分层有限标量量化（HFSQ）实现精细的空间控制，并利用分块局部上下文（BLC）策略高效生成具有长期时间一致性的高质量长序列反应式舞蹈。

Jingzhong Lin, Xinru Li, Yuanyuan Qi + 8 more2026-03-06💻 cs

Balancing Progress and Safety: A Novel Risk-Aware Objective for RL in Autonomous Driving

本文提出了一种基于层次化目标、归一化设计及融合责任敏感安全（RSS）概念与二维椭球函数的新型风险感知奖励函数，旨在解决强化学习在自动驾驶中奖励设计不足的问题，并在无信号交叉口实验中显著降低了碰撞率，同时提升了行驶效率与安全性。

Ahmed Abouelazm, Jonas Michel, Helen Gremmelmaier + 3 more2026-03-06💻 cs

Boundary-Guided Trajectory Prediction for Road Aware and Physically Feasible Autonomous Driving

本文提出了一种受边界引导的轨迹预测框架，通过结合高清地图定义合法行驶边界并预测符合运动学约束的加速度剖面，在保持基准精度的同时显著消除了非可行轨迹并大幅提升了模型在对抗攻击及未见场景下的鲁棒性。

Ahmed Abouelazm, Mianzhi Liu, Christian Hubschneider + 3 more2026-03-06💻 cs

Automatic Curriculum Learning for Driving Scenarios: Towards Robust and Efficient Reinforcement Learning

本文提出了一种基于智能体能力自适应生成驾驶场景的自动课程学习框架，通过消除专家偏见并动态筛选训练难度，显著提升了强化学习驱动自动驾驶智能体的训练效率、收敛速度及在复杂交通环境下的泛化能力。

Ahmed Abouelazm, Tim Weinstein, Tim Joseph + 2 more2026-03-06💻 cs

Ice Cream Doesn't Cause Drowning: Benchmarking LLMs Against Statistical Pitfalls in Causal Inference

本文提出了名为 CausalPitfalls 的综合基准，旨在通过结构化挑战和双重评估协议，系统性地评估大语言模型在克服辛普森悖论等统计陷阱方面的因果推理能力，并揭示了当前模型在此领域的显著局限性。

Jin Du, Li Chen, Xun Xian + 6 more2026-03-06💻 cs

ShIOEnv: A Command Evaluation Environment for Grammar-Constrained Synthesis and Execution Behavior Modeling

本文提出了 ShIOEnv，这是一个基于 Gymnasium 的 Bash 环境，通过语法约束合成和自监督不可约性信号来捕捉系统相关的执行行为，并发布了 210 万条输入输出对，显著提升了模型对用户命令执行行为的建模精度。

Jarrod Ragsdale, Rajendra Boppana2026-03-06💻 cs

VTool-R1: VLMs Learn to Think with Images via Reinforcement Learning on Multimodal Tool Use

本文提出了 VTool-R1 框架，通过强化学习微调使视觉语言模型能够结合 Python 视觉编辑工具，在无需过程监督的情况下自主生成包含中间视觉步骤的多模态思维链，从而显著提升其在图表和表格等结构化视觉问答任务中的推理能力。

Mingyuan Wu, Jingcheng Yang, Jize Jiang + 6 more2026-03-06💻 cs

SealQA: Raising the Bar for Reasoning in Search-Augmented Language Models

本文提出了名为 SealQA 的新基准，旨在评估搜索增强型语言模型在应对网络搜索冲突、噪声及长文档干扰时的推理能力，并揭示了当前前沿模型（包括 o3 等）在此类高难度事实性问答任务中表现普遍不佳且增加推理计算量难以带来显著提升的局限性。

Thinh Pham, Nguyen Nguyen, Pratibha Zunjare + 3 more2026-03-06💻 cs

RoboPARA: Dual-Arm Robot Planning with Parallel Allocation and Recomposition Across Tasks

本文提出了 RoboPARA，一种由大语言模型驱动的双臂机器人任务规划框架，通过基于依赖图的规划候选生成与图重遍历并行规划两阶段策略，有效提升了复杂多任务场景下的并行协作效率，并发布了首个跨场景双臂并行任务数据集（X-DAPT）以验证其优越性。

Shiying Duan, Pei Ren, Nanxiang Jiang + 5 more2026-03-06💻 cs

A Signal Contract for Online Language Grounding and Discovery in Decision-Making

本文提出了名为 LUCIFER 的推理型中间件，通过“信号契约”将在线自然语言更新解耦为策略先验、奖励势、可行约束及遥测动作预测等控制信号，从而在保持决策器语言无关性的同时，显著提升了自主系统在动态环境中的安全性与信息收集效率。

Dimitris Panagopoulos, Adolfo Perrusquia, Weisi Guo2026-03-06💻 cs

HSG-12M: A Large-Scale Benchmark of Spatial Multigraphs from the Energy Spectra of Non-Hermitian Crystals

本文提出了名为 Poly2Graph 的高效开源工具，构建了包含 1700 万张空间多重图的 HSG-12M 数据集，首次将非厄米晶体能谱自动转化为几何图数据，填补了现有图基准缺乏空间几何信息的空白，并为凝聚态物理的数据驱动发现及几何感知图学习开辟了新途径。

Xianquan Yan, Hakan Akgün, Kenji Kawaguchi + 2 more2026-03-06🔬 cond-mat.mes-hall

InterActHuman: Multi-Concept Human Animation with Layout-Aligned Audio Conditions

本文提出了 InterActHuman 框架，通过引入布局对齐的音频条件及掩码预测器，实现了多概念（包括多人与物体）在视频中的精确区域绑定与高质量交互动画生成，有效解决了现有方法无法处理多主体复杂交互的局限。

Zhenzhi Wang, Jiaqi Yang, Jianwen Jiang + 7 more2026-03-06💻 cs

Bures-Wasserstein Flow Matching for Graph Generation

本文针对现有图生成模型因独立插值导致路径不光滑的问题，提出了一种基于 Bures-Wasserstein 流匹配的 BWFlow 框架，通过马尔可夫随机场建模节点与边的联合演化，构建了平滑的概率路径，从而显著提升了训练收敛性、采样效率及生成性能。

Keyue Jiang, Jiahao Cui, Xiaowen Dong + 1 more2026-03-06💻 cs