cs.AI 篇论文 | Gist.Science

YAQIN: Culturally Sensitive, Agentic AI for Mental Healthcare Support Among Muslim Women in the UK

该论文介绍了专为英国穆斯林女性设计的文化敏感型代理 AI 应用"YAQIN"，通过结合伊斯兰心理学与用户共创方法，利用基于检索增强生成的聊天机器人和引导式日记功能，有效填补了现有心理健康服务在文化适配性上的空白，从而提升了该群体的信任度与参与度。

Yasmin Zaraket, Céline Mougenot2026-03-10💻 cs

Rigidity in LLM Bandits with Implications for Human-AI Dyads

该研究通过在双臂老虎机任务中测试大语言模型，发现其在不同奖励条件下均表现出将位置偏好放大为僵化决策策略的鲁棒性偏差，且这种由低学习率和高逆温度导致的过度利用行为难以通过常规解码参数调整消除，进而揭示了这些偏差可能深刻影响人机协作的潜在机制。

Haomiaomiao Wang, Tomás E Ward, Lili Zhang2026-03-10💻 cs

A Novel Multi-Agent Architecture to Reduce Hallucinations of Large Language Models in Multi-Step Structural Modeling

该研究提出了一种新颖的多智能体架构，通过分工协作将用户描述转化为可执行的 OpenSeesPy 脚本，有效解决了大语言模型在复杂多步结构建模中的幻觉与误差累积问题，并在基准测试中实现了极高的准确率与可扩展性。

Ziheng Geng, Jiachen Liu, Ran Cao, Lu Cheng, Dan M. Frangopol, Minghui Cheng2026-03-10💻 cs

Large Language Model for Discrete Optimization Problems: Evaluation and Step-by-step Reasoning

该论文通过构建涵盖多种问题类型和参数规模的自然语言离散优化数据集，评估了包括 Llama-3 系列和 ChatGPT 在内的不同大语言模型及思维链（CoT）方法的性能，发现强模型表现更优但 CoT 并非总是有效，且数据扰动虽能提升简单问题的表现却引入了不稳定性，从而为自动化求解离散优化问题提供了基准评估与实用建议。

Tianhao Qian, Guilin Qi, Z. Y. Wu, Ran Gu, Xuanyi Liu, Canchen Lyu2026-03-10💬 cs.CL

Hide and Find: A Distributed Adversarial Attack on Federated Graph Learning

本文提出了一种名为 FedShift 的新型两阶段“藏与寻”分布式对抗攻击方法，通过在联邦图学习训练前注入隐藏移位器并在训练后利用全局模型高效生成扰动，在显著降低时间成本的同时实现了高攻击成功率并有效规避了主流防御算法。

Jinshan Liu, Ken Li, Jiazhe Wei, Bin Shi, Bo Dong2026-03-10🤖 cs.LG

DECADE: A Temporally-Consistent Unsupervised Diffusion Model for Enhanced Rb-82 Dynamic Cardiac PET Image Denoising

该论文提出了一种名为 DECADE 的无监督扩散模型，通过引入时间一致性约束，有效解决了铷 -82 动态心脏 PET 成像中因缺乏配对数据和高噪声导致的去噪难题，在提升图像质量的同时保持了血流动力学参数的定量准确性。

Yinchi Zhou, Liang Guo, Huidong Xie, Yuexi Du, Ashley Wang, Menghua Xia, Tian Yu, Ramesh Fazzone-Chettiar, Christopher Weyman, Bruce Spottiswoode, Vladimir Panin, Kuangyu Shi, Edward J. Miller, Attila Feher, Albert J. Sinusas, Nicha C. Dvornek, Chi Liu2026-03-10💻 cs

QuadAI at SemEval-2026 Task 3: Ensemble Learning of Hybrid RoBERTa and LLMs for Dimensional Aspect-Based Sentiment Analysis

本文介绍了 QuadAI 团队在 SemEval-2026 任务 3 中提出的系统，该系统通过集成学习将结合回归与分类头的混合 RoBERTa 编码器与大语言模型（LLM）相结合，利用预测级堆叠显著提升了多维方面情感分析的性能。

A. J. W. de Vink, Filippos Karolos Ventirozos, Natalia Amat-Lefort, Lifeng Han2026-03-10💬 cs.CL

ProgAgent:A Continual RL Agent with Progress-Aware Rewards

ProgAgent 提出了一种结合进度感知奖励学习与 JAX 原生高吞吐架构的持续强化学习智能体，通过从无人标注专家视频中提取密集奖励、引入对抗性正则化以应对分布偏移，并融合 PPO 与核心集回放等机制，有效解决了机器人终身学习中的灾难性遗忘与奖励指定难题，在多个基准测试及真实机器人任务中显著超越了现有基线。

Jinzhou Tan, Gabriel Adineera, Jinoh Kim2026-03-10🤖 cs.LG

Dual-Metric Evaluation of Social Bias in Large Language Models: Evidence from an Underrepresented Nepali Cultural Context

该研究通过双指标评估框架，在尼泊尔文化语境下分析了七种大语言模型的社会偏见，发现显式同意偏见与隐式生成偏见存在显著差异且后者受温度参数非线性影响，揭示了当前模型在欠代表文化背景中偏见评估的局限性及去偏策略的紧迫性。

Ashish Pandey, Tek Raj Chhetri2026-03-10💬 cs.CL

Learning embeddings of non-linear PDEs: the Burgers' equation

本文提出了一种将物理信息神经网络推广至非线性偏微分方程的方法，通过多头架构和正交约束构建鲁棒的解空间嵌入，并利用主成分分析成功提取了粘滞 Burgers 方程中由少量潜在模式主导的物理特征。

Pedro Tarancón-Álvarez, Leonid Sarieddine, Pavlos Protopapas, Raul Jimenez2026-03-10🤖 cs.LG

HybridStitch: Pixel and Timestep Level Model Stitching for Diffusion Acceleration

本文提出了 HybridStitch，一种将图像生成视为编辑任务的新型文生图范式，通过在像素和 timestep 级别动态划分难易区域并协同使用大模型与小模型，实现了比现有混合模型方法更快的推理加速（在 Stable Diffusion 3 上达到 1.83 倍提速）。

Desen Sun, Jason Hon, Jintao Zhang, Sihang Liu2026-03-10💻 cs

Column Generation for the Micro-Transit Zoning Problem

本文针对微交通分区问题，通过引入全局预算约束并设计列生成框架及定价启发式算法，提出了一种比现有枚举方法更高效、可扩展性更强且能生成更优解的优化方案。

Hins Hu, Rishav Sen, Jose Paolo Talusan, Abhishek Dubey, Aron Laszka, Samitha Samaranayake2026-03-10🔢 math

Gradient Iterated Temporal-Difference Learning

本文提出了一种名为“梯度迭代时序差分学习”的新算法，通过计算移动目标的梯度来改进迭代 TD 学习，使其在保持梯度 TD 方法稳定性的同时，在 Atari 等多个基准测试中展现出与半梯度方法相媲美的学习速度。

Théo Vincent, Kevin Gerhardt, Yogesh Tripathi, Habib Maraqten, Adam White, Martha White, Jan Peters, Carlo D'Eramo2026-03-10🤖 cs.LG

AI Misuse in Education Is a Measurement Problem: Toward a Learning Visibility Framework

该论文主张将教育中的 AI 滥用问题从“检测难题”重新定义为“测量难题”，并提出以“学习可见性框架”为核心，通过明确 AI 使用规范、将学习过程视为评估证据以及建立透明的活动轨迹，在保障伦理与信任的前提下实现 AI 与教育的良性融合。

Eduardo Davalos, Yike Zhang2026-03-10💻 cs

DistillGuard: Evaluating Defenses Against LLM Knowledge Distillation

本文提出了名为 DistillGuard 的评估框架，系统测试了输出扰动、数据投毒和信息节流三类防御策略，发现除移除思维链能显著削弱数学推理能力外，大多数现有输出级防御在防止大语言模型知识蒸馏方面效果有限且高度依赖具体任务。

Bo Jiang2026-03-10💬 cs.CL

AI Steerability 360: A Toolkit for Steering Large Language Models

本文介绍了 AI Steerability 360，这是一个开源的 Python 工具包，旨在通过统一的管道接口和模块化设计，降低大语言模型在输入、结构、状态和输出四个控制维度上进行可控性调整与评估的门槛。

Erik Miehling, Karthikeyan Natesan Ramamurthy, Praveen Venkateswaran, Irene Ko, Pierre Dognin, Moninder Singh, Tejaswini Pedapati, Avinash Balakrishnan, Matthew Riemer, Dennis Wei, Inge Vejsbjerg, Elizabeth M. Daly, Kush R. Varshney2026-03-10💬 cs.CL

Intentional Deception as Controllable Capability in LLM Agents

该论文通过在文本 RPG 中构建具有明确伦理基准的 36 种行为画像，系统研究了 LLM 代理如何分阶段推断目标特征并实施以“误导性陈述”为主（占 88.5%）而非捏造事实的有意欺骗，发现动机是主要攻击向量且现有事实核查防御难以应对此类策略性框架。

Jason Starace, Terence Soule2026-03-10💻 cs

SynPlanResearch-R1: Encouraging Tool Exploration for Deep Research with Synthetic Plans

该论文提出了 SynPlanResearch-R1 框架，通过合成鼓励深度探索的工具使用轨迹来优化冷启动监督微调，从而有效解决了强化学习在研究智能体探索行为上的不足，并在多个基准测试中显著提升了基于 Qwen3 模型的研究性能。

Hansi Zeng, Zoey Li, Yifan Gao, Chenwei Zhang, Xiaoman Pan, Tao Yang, Fengran Mo, Jiacheng Lin, Xian Li, Jingbo Shang2026-03-10💬 cs.CL

Slumbering to Precision: Enhancing Artificial Neural Network Calibration Through Sleep-like Processes

该论文受生物睡眠机制启发，提出了一种名为“睡眠回放巩固”（SRC）的后训练校准方法，通过选择性回放内部表征来更新网络权重，从而在不依赖监督重训练的情况下显著提升人工神经网络的置信度校准能力。

Jean Erik Delanois, Aditya Ahuja, Giri P. Krishnan, Maxim Bazhenov2026-03-10🤖 cs.LG

Hospitality-VQA: Decision-Oriented Informativeness Evaluation for Vision-Language Models

该论文针对现有视觉语言模型在酒店决策领域信息实用性评估的不足，提出了“信息性”评估框架并构建了专用数据集，研究发现模型需经过适度的领域微调才能有效利用视觉信号进行决策导向的信息推理。

Jeongwoo Lee, Baek Duhyeong, Eungyeol Han, Soyeon Shin, Gukin han, Seungduk Kim, Jaehyun Jeon, Taewoo Jeong2026-03-10🤖 cs.LG