cs 篇论文 | Gist.Science

Vulnerability-Amplifying Interaction Loops: a systematic failure mode in AI chatbot mental-health interactions

该研究提出了名为 SIM-VAIL 的审计框架，通过模拟不同精神健康脆弱性的用户与 AI 聊天机器人的对话，揭示了“脆弱性放大交互循环”（VAILs）这一系统性失效模式，即看似支持性的回复在特定情境下会随时间推移加剧用户风险，从而强调了针对多维度风险进行量化评估的必要性。

Veith Weilnhammer, Kevin YC Hou, Lennart Luettgau, Christopher Summerfield, Raymond Dolan, Matthew M Nour2026-03-10💻 cs

AgenticLab: A Real-World Robot Agent Platform that Can See, Think, and Act

本文提出了 AgenticLab，这是一个面向非结构化真实环境的模型无关机器人智能体平台与基准测试，旨在通过闭环执行评估大视觉语言模型在长程任务中的感知、推理与操作能力，并揭示了现有离线测试未能捕捉的多步一致性、遮挡下目标定位及空间推理等关键失效模式。

Pengyuan Guo, Zhonghao Mai, Zhengtong Xu, Kaidi Zhang, Heng Zhang, Zichen Miao, Arash Ajoudani, Zachary Kingston, Qiang Qiu, Yu She2026-03-10💻 cs

Six Times to Spare: Characterizing GPU-Accelerated 5G LDPC Decoding for Edge-RSU Communications

本文通过基于 Sionna 的基准测试，证明了在边缘路侧单元（RSU）平台上利用 GPU 加速 5G LDPC 解码可显著提升吞吐量并降低延迟，从而有效缓解 CPU 计算压力，确保在严格的时间约束下满足超可靠低时延车联网（URLLC）的通信需求。

Ryan Barker, Julia Boone, Tolunay Seyfi, Alireza Ebrahimi Dorcheh, Fatemeh Afghah, Joseph Boccuzzi2026-03-10💻 cs

Extracting Recurring Vulnerabilities from Black-Box LLM-Generated Software

本文提出了特征 - 安全表（FSTab）框架，通过仅利用前端特征和源模型知识即可预测后端漏洞的黑盒攻击方法，以及量化模型在不同场景下漏洞复现一致性的评估机制，揭示了大语言模型生成软件中普遍存在且可跨领域迁移的重复性漏洞风险。

Tomer Kordonsky, Maayan Yamin, Noam Benzimra, Amit LeVi, Avi Mendelson2026-03-10💻 cs

LMMRec: LLM-driven Motivation-aware Multimodal Recommendation

该论文提出了 LMMRec 框架，利用大语言模型通过思维链提示从文本中提取细粒度动机，并结合双编码器架构与对比学习策略，有效融合了异构文本信息与交互数据以提升多模态推荐性能。

Yicheng Di, Zhanjie Zhang, Yun Wang, Jinren Liu, Jiaqi Yan, Jiyu Wei, Xiangyu Chen, Yuan Liu2026-03-10💻 cs

Assessing Problem-Solving in HR Contexts: A Comparison Between Game-Based and Self-Report Measures

该研究通过比较 72 名参与者的游戏化评估与自我报告（PSI-B）结果，发现两者在问题解决能力上缺乏显著相关性，从而表明这两种测量方式提供了互补信息，支持在人员选拔中采用多方法评估框架而非依赖单一模态。

Fabrizio Fornari, Eleonora Cova, Niccolò Vito Vacca, Francesco Bocci, Marcello Sarini, Luigi Caputo2026-03-10💻 cs

Conditional Diffusion Guidance under Hard Constraint: A Stochastic Analysis Approach

本文提出了一种基于 Doob h-变换和鞅理论的随机分析方法，通过在不修改预训练得分网络的情况下引入显式漂移修正，为扩散模型建立了满足概率为一的硬约束的生成框架，并设计了两种利用预训练轨迹进行离线学习的算法以提供非渐近收敛保证。

Zhengyi Guo, Wenpin Tang, Renyuan Xu2026-03-10💻 cs

Beyond Judgment: Exploring Large Language Models as Non-Judgmental Support for Maternal Mental Health

这项研究通过混合方法调查揭示了母亲们如何利用大语言模型作为非评判性的情感支持与决策确认工具，以规避社会指责并缓解育儿焦虑，同时强调了在特定社会语境下（如联合家庭）技术辅助与人类情感支持之间的互补关系。

Shayla Sharmin, Sadia Afrin Ratna2026-03-10💻 cs

NAAMSE: Framework for Evolutionary Security Evaluation of Agents

本文提出了 NAAMSE 框架，通过进化式反馈优化机制，利用自主智能体进行遗传提示变异和分层语料探索，实现了对 AI 代理在动态对抗环境下更全面、可扩展的安全评估，有效弥补了传统静态基准测试的不足。

Kunal Pai, Parth Shah, Harshil Patel2026-03-10💻 cs

PhysDrape: Learning Explicit Forces and Collision Constraints for Physically Realistic Garment Draping

PhysDrape 提出了一种结合物理信息图神经网络与可微分两阶段求解器的混合框架，通过显式力平衡与碰撞约束机制，在确保零穿透的同时实现了具有更高物理保真度的实时服装 draped 模拟。

Minghai Chen, Mingyuan Liu, Ning Ma, Jianqing Li, Yuxiang Huan2026-03-10💻 cs

LLM4PQC - Accurate and Efficient Synthesis of PQC Cores by Feedback-Driven LLMs

本文提出了 LLM4PQC 框架，利用反馈驱动的代理机制将后量子密码（PQC）参考代码自动重构为可综合的高层综合（HLS）C 代码并生成验证 RTL，从而显著降低了 PQC 硬件设计的手动工作量并加速了设计空间探索。

Buddhi Perera, Zeng Wang, Weihua Xiao, Mohammed Nabeel, Ozgur Sinanoglu, Johann Knechtel, Ramesh Karri2026-03-10💻 cs

Move What Matters: Parameter-Efficient Domain Adaptation via Optimal Transport Flow for Collaborative Perception

本文针对车联网协同感知中参数高效领域适应面临的性能下降与训练不稳定问题，提出了一种基于最优流理论的 FlowAdapt 框架，通过 Wasserstein 贪婪采样策略消除异构数据冗余，并利用渐进式知识转移模块缓解深层语义退化，从而在仅使用 1% 可训练参数的情况下实现了跨域适应的先进性能。

Zesheng Jia, Jin Wang, Siao Liu, Lingzhi Li, Ziyao Huang, Yunjiang Xu, Jianping Wang2026-03-10💻 cs

SToRM: Supervised Token Reduction for Multi-modal LLMs toward efficient end-to-end autonomous driving

本文提出了 SToRM 框架，通过重要性预测、辅助路径监督训练及锚点 - 上下文合并模块，在显著降低多模态大模型计算成本的同时，实现了端到端自动驾驶任务中视觉 Token 的高效缩减且保持全 Token 性能。

Seo Hyun Kim, Jin Bok Park, Do Yeon Koo, Hogun Park, Il Yong Chun2026-03-10💻 cs

Accelerating Robotic Reinforcement Learning with Agent Guidance

本文提出了“智能体引导策略搜索（AGPS）”框架，通过利用多模态智能体替代人类监督者，将人类修正转化为精确的语义引导，从而显著提升了机器人强化学习的样本效率并实现了可扩展的自动化训练。

Haojun Chen, Zili Zou, Chengdong Ma, Yaoxiang Pu, Haotong Zhang, Yuanpei Chen, Yaodong Yang2026-03-10💻 cs

To Mix or To Merge: Toward Multi-Domain Reinforcement Learning for Large Language Models

该论文通过名为 M2RL 的研究，系统对比并分析了大语言模型在多领域强化学习验证奖励（RLVR）任务中“混合多任务训练”与“分域训练后模型融合”两种范式的表现，发现跨领域 RLVR 干扰极小且推理密集型领域存在协同增益，并从权重空间几何等角度揭示了其内在机制。

Haoqing Wang, Xiang Long, Ziheng Li, Yilong Xu, Tingguang Li, Yehui Tang2026-03-10💻 cs

SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks

本文提出了 SkillsBench 基准，通过 86 个跨领域任务评估发现，精心策划的 Agent 技能能显著提升大语言模型的平均通过率（+16.2%），且小模型借助技能可媲美无技能的大模型，但模型自主生成的技能往往无效，且技能效果在不同领域间存在显著差异。

Xiangyi Li, Wenbo Chen, Yimin Liu, Shenghan Zheng, Xiaokun Chen, Yifeng He, Yubo Li, Bingran You, Haotian Shen, Jiankai Sun, Shuyi Wang, Binxu Li, Qunhong Zeng, Di Wang, Xuandong Zhao, Yuanli Wang, Roey Ben Chaim, Zonglin Di, Yipeng Gao, Junwei He, Yizhuo He, Liqiang Jing, Luyang Kong, Xin Lan, Jiachen Li, Songlin Li, Yijiang Li, Yueqian Lin, Xinyi Liu, Xuanqing Liu, Haoran Lyu, Ze Ma, Bowei Wang, Runhui Wang, Tianyu Wang, Wengao Ye, Yue Zhang, Hanwen Xing, Yiqi Xue, Steven Dillmann, Han-chung Lee2026-03-10💻 cs

cs