cs.AI 篇论文 | Gist.Science

Do Schwartz Higher-Order Values Help Sentence-Level Human Value Detection? A Study of Hierarchical Gating and Calibration

该研究表明，在句子级人类价值观检测任务中，施瓦茨高阶价值观结构更适合作为归纳偏置而非刚性路由规则，且通过阈值调整和集成等校准方法比层级门控或独立使用紧凑大语言模型能带来更显著的性能提升。

Víctor Yeste, Paolo Rosso2026-03-10🤖 cs.LG

Thickening-to-Thinning: Reward Shaping via Human-Inspired Learning Dynamics for LLM Reasoning

该论文提出了受人类学习过程启发的 T2T（由厚变薄）动态奖励框架，通过在不正确尝试时鼓励“增厚”以扩展搜索空间、在正确后转为“变薄”以抑制冗余，有效解决了强化学习中的熵崩溃与过度冗长问题，显著提升了大语言模型在数学推理任务上的性能。

Wenze Lin, Zhen Yang, Xitai Jiang, Pony Ma, Gao Huang2026-03-10🤖 cs.LG

Extracting Recurring Vulnerabilities from Black-Box LLM-Generated Software

本文提出了特征 - 安全表（FSTab）框架，通过仅利用前端特征和源模型知识即可预测后端漏洞的黑盒攻击方法，以及量化模型在不同场景下漏洞复现一致性的评估机制，揭示了大语言模型生成软件中普遍存在且可跨领域迁移的重复性漏洞风险。

Tomer Kordonsky, Maayan Yamin, Noam Benzimra, Amit LeVi, Avi Mendelson2026-03-10💻 cs

Semantic Search over 9 Million Mathematical Theorems

该论文介绍了针对从 arXiv 等来源提取的 920 万条数学定理构建的大规模语义检索系统，通过系统分析表示上下文、语言模型及提示策略等因素，在专业数学家构建的评估集上显著提升了定理级和论文级的检索效果，证明了在 Web 规模下实现有效语义定理搜索的可行性。

Luke Alexander, Eric Leonen, Sophie Szeto, Artemii Remizov, Ignacio Tejeda, Jarod Alper, Giovanni Inchiostro, Vasily Ilin2026-03-10🔢 math

LMMRec: LLM-driven Motivation-aware Multimodal Recommendation

该论文提出了 LMMRec 框架，利用大语言模型通过思维链提示从文本中提取细粒度动机，并结合双编码器架构与对比学习策略，有效融合了异构文本信息与交互数据以提升多模态推荐性能。

Yicheng Di, Zhanjie Zhang, Yun Wang, Jinren Liu, Jiaqi Yan, Jiyu Wei, Xiangyu Chen, Yuan Liu2026-03-10💻 cs

Conditional Diffusion Guidance under Hard Constraint: A Stochastic Analysis Approach

本文提出了一种基于 Doob h-变换和鞅理论的随机分析方法，通过在不修改预训练得分网络的情况下引入显式漂移修正，为扩散模型建立了满足概率为一的硬约束的生成框架，并设计了两种利用预训练轨迹进行离线学习的算法以提供非渐近收敛保证。

Zhengyi Guo, Wenpin Tang, Renyuan Xu2026-03-10💻 cs

NAAMSE: Framework for Evolutionary Security Evaluation of Agents

本文提出了 NAAMSE 框架，通过进化式反馈优化机制，利用自主智能体进行遗传提示变异和分层语料探索，实现了对 AI 代理在动态对抗环境下更全面、可扩展的安全评估，有效弥补了传统静态基准测试的不足。

Kunal Pai, Parth Shah, Harshil Patel2026-03-10💻 cs

Diffusion-Guided Pretraining for Brain Graph Foundation Models

该论文提出了一种统一的扩散引导预训练框架，通过利用扩散模型指导结构感知的掩码与丢弃策略以及拓扑感知的全局重建，有效解决了现有脑图基础模型在预训练中破坏语义连接模式及缺乏全局结构信息的局限，并在大规模神经影像数据上验证了其性能优势。

Xinxu Wei, Rong Zhou, Lifang He, Yu Zhang2026-03-10🤖 cs.LG

Listen to the Layers: Mitigating Hallucinations with Inter-Layer Disagreement

该论文提出了一种名为 CoCoA 的免训练解码算法，通过利用大语言模型中间层表征的不一致性信号来识别并抑制幻觉，从而在不重新训练模型的情况下显著提升其在问答、摘要、推理及代码生成等任务中的事实准确性。

Koduvayur Subbalakshmi, Sabbir Hossain Ujjal, Venkata Krishna Teja Mangichetty, Nastaran Jamalipour Soofi2026-03-10💬 cs.CL

SToRM: Supervised Token Reduction for Multi-modal LLMs toward efficient end-to-end autonomous driving

本文提出了 SToRM 框架，通过重要性预测、辅助路径监督训练及锚点 - 上下文合并模块，在显著降低多模态大模型计算成本的同时，实现了端到端自动驾驶任务中视觉 Token 的高效缩减且保持全 Token 性能。

Seo Hyun Kim, Jin Bok Park, Do Yeon Koo, Hogun Park, Il Yong Chun2026-03-10💻 cs

Accelerating Robotic Reinforcement Learning with Agent Guidance

本文提出了“智能体引导策略搜索（AGPS）”框架，通过利用多模态智能体替代人类监督者，将人类修正转化为精确的语义引导，从而显著提升了机器人强化学习的样本效率并实现了可扩展的自动化训练。

Haojun Chen, Zili Zou, Chengdong Ma, Yaoxiang Pu, Haotong Zhang, Yuanpei Chen, Yaodong Yang2026-03-10💻 cs

To Mix or To Merge: Toward Multi-Domain Reinforcement Learning for Large Language Models

该论文通过名为 M2RL 的研究，系统对比并分析了大语言模型在多领域强化学习验证奖励（RLVR）任务中“混合多任务训练”与“分域训练后模型融合”两种范式的表现，发现跨领域 RLVR 干扰极小且推理密集型领域存在协同增益，并从权重空间几何等角度揭示了其内在机制。

Haoqing Wang, Xiang Long, Ziheng Li, Yilong Xu, Tingguang Li, Yehui Tang2026-03-10💻 cs

SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks

本文提出了 SkillsBench 基准，通过 86 个跨领域任务评估发现，精心策划的 Agent 技能能显著提升大语言模型的平均通过率（+16.2%），且小模型借助技能可媲美无技能的大模型，但模型自主生成的技能往往无效，且技能效果在不同领域间存在显著差异。

Xiangyi Li, Wenbo Chen, Yimin Liu, Shenghan Zheng, Xiaokun Chen, Yifeng He, Yubo Li, Bingran You, Haotian Shen, Jiankai Sun, Shuyi Wang, Binxu Li, Qunhong Zeng, Di Wang, Xuandong Zhao, Yuanli Wang, Roey Ben Chaim, Zonglin Di, Yipeng Gao, Junwei He, Yizhuo He, Liqiang Jing, Luyang Kong, Xin Lan, Jiachen Li, Songlin Li, Yijiang Li, Yueqian Lin, Xinyi Liu, Xuanqing Liu, Haoran Lyu, Ze Ma, Bowei Wang, Runhui Wang, Tianyu Wang, Wengao Ye, Yue Zhang, Hanwen Xing, Yiqi Xue, Steven Dillmann, Han-chung Lee2026-03-10💻 cs

cs.AI

Do Schwartz Higher-Order Values Help Sentence-Level Human Value Detection? A Study of Hierarchical Gating and Calibration

Thickening-to-Thinning: Reward Shaping via Human-Inspired Learning Dynamics for LLM Reasoning

Extracting Recurring Vulnerabilities from Black-Box LLM-Generated Software

Semantic Search over 9 Million Mathematical Theorems

LMMRec: LLM-driven Motivation-aware Multimodal Recommendation

Conditional Diffusion Guidance under Hard Constraint: A Stochastic Analysis Approach

NAAMSE: Framework for Evolutionary Security Evaluation of Agents

Diffusion-Guided Pretraining for Brain Graph Foundation Models

Listen to the Layers: Mitigating Hallucinations with Inter-Layer Disagreement

SToRM: Supervised Token Reduction for Multi-modal LLMs toward efficient end-to-end autonomous driving

Accelerating Robotic Reinforcement Learning with Agent Guidance

To Mix or To Merge: Toward Multi-Domain Reinforcement Learning for Large Language Models

SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks

A Geometric Taxonomy of Hallucinations in LLMs

TrasMuon: Trust-Region Adaptive Scaling for Orthogonalized Momentum Optimizers

Can a Lightweight Automated AI Pipeline Solve Research-Level Mathematical Problems?

Mean Flow Policy with Instantaneous Velocity Constraint for One-step Action Generation

Pawsterior: Variational Flow Matching for Structured Simulation-Based Inference

Explainable Token-level Noise Filtering for LLM Fine-tuning Datasets

LongAudio-RAG: Event-Grounded Question Answering over Multi-Hour Long Audio