cs.AI 篇论文 | Gist.Science

Supervised Metric Regularization Through Alternating Optimization for Multi-Regime Physics-Informed Neural Networks

本文提出了一种名为 TAPINN 的拓扑感知物理信息神经网络，通过监督度量正则化构建潜在空间并采用交替优化策略，有效解决了参数化动力学系统中因谱偏差导致的模态崩溃问题，在显著降低物理残差和梯度方差的同时，以比超网络方案少 5 倍的参数量实现了更稳定的收敛。

Enzo Nicolas Spotorno, Josafat Ribeiro Leal, Antonio Augusto Frohlich2026-03-06🔬 physics

Empirical Stability Analysis of Kolmogorov-Arnold Networks in Hard-Constrained Recurrent Physics-Informed Discovery

本文实证研究了将 Kolmogorov-Arnold 网络（KAN）集成到硬约束循环物理信息架构中，发现尽管 KAN 在处理单变量多项式残差时具有一定竞争力，但其在深层配置中表现出严重的超参数脆弱性和不稳定性，且在处理乘法项（如范德波尔系统）时表现不如标准 MLP，揭示了原始 KAN 公式中加法归纳偏置在状态耦合方面的局限性。

Enzo Nicolas Spotorno, Josafat Leal Filho, Antonio Augusto Medeiros Frohlich2026-03-06🔬 physics

Learning to Select Like Humans: Explainable Active Learning for Medical Imaging

该论文提出了一种将分类不确定性与注意力图对齐相结合的双准则主动学习框架，通过筛选既具信息量又聚焦于错误特征（即与专家标注区域不匹配）的样本，显著提升了医学影像模型在有限标注数据下的预测性能与临床可解释性。

Ifrat Ikhtear Uddin, Longwei Wang, Xiao Qin + 2 more2026-03-06💻 cs

Pailitao-VL: Unified Embedding and Reranker for Real-Time Multi-Modal Industrial Search

本文提出了 Pailitao-VL，一种专为高精度实时工业搜索设计的统一多模态检索系统，通过引入基于绝对 ID 识别的嵌入范式及对比校准的列表式重排序策略，有效解决了现有方案在检索粒度、环境噪声鲁棒性及效率性能平衡方面的关键挑战，并在阿里巴巴电商平台上实现了业界领先的性能与显著的业务价值。

Lei Chen, Chen Ju, Xu Chen + 13 more2026-03-06💻 cs

Zombie Agents: Persistent Control of Self-Evolving LLM Agents via Self-Reinforcing Injections

该论文提出了一种针对具备自我进化能力的 LLM 智能体的“僵尸代理”攻击框架，通过利用长期记忆机制将恶意载荷隐蔽植入并跨会话持久化，证明了仅依赖单会话提示过滤的防御手段无法有效抵御此类通过间接内容注入实现的持续性控制风险。

Xianglin Yang, Yufei He, Shuo Ji, Bryan Hooi, Jin Song Dong2026-03-06🔒 cs.CR

SubQuad: Near-Quadratic-Free Structure Inference with Distribution-Balanced Objectives in Adaptive Receptor framework

SubQuad 是一个端到端流程，通过结合抗原感知的近次二次方检索、GPU 加速亲和力核、多模态融合及公平性约束聚类，有效解决了大规模适应性免疫库分析中计算成本高和数据不平衡的瓶颈，实现了可扩展且无偏倚的谱系挖掘。

Rong Fu, Zijian Zhang, Kun Liu + 3 more2026-03-06💻 cs

Curriculum Learning for Efficient Chain-of-Thought Distillation via Structure-Aware Masking and GRPO

本文提出了一种结合结构感知掩码与 GRPO 优化的三阶段课程学习框架，通过渐进式技能习得解决大模型思维链蒸馏中的容量不匹配问题，使 Qwen2.5-3B 模型在 GSM8K 数据集上实现了准确率提升 11.29% 且输出长度缩短 27.4% 的显著效果。

Bowen Yu, Maolin Wang, Sheng Zhang + 7 more2026-03-06💻 cs

The Convergence of Schema-Guided Dialogue Systems and the Model Context Protocol

本文揭示了模式引导对话（SGD）与模型上下文协议（MCP）在确定性、可审计的 LLM 代理交互范式上的根本融合，通过提炼五项核心设计原则，解决了两者在失败模式与工具关系处理上的空白，并确立了模式驱动治理作为无需专有系统检查即可实现 AI 系统监管的可扩展机制。

Andreas Schlapbach2026-03-06💻 cs

Give Users the Wheel: Towards Promptable Recommendation Paradigm

本文提出了模型无关的解耦可提示序列推荐框架（DPR），通过直接调制检索空间中的用户潜在表示，在保留传统协同过滤效率的同时，使推荐系统能够利用自然语言提示动态响应用户的即时意图。

Fuyuan Lyu, Chenglin Luo, Qiyuan Zhang + 6 more2026-03-06💻 cs

Assessing Risks of Large Language Models in Mental Health Support: A Framework for Automated Clinical AI Red Teaming

该论文提出了一种结合动态认知情感模型与临床风险本体的自动化红队测试框架，通过大规模模拟实验揭示了当前大语言模型在心理健康支持中存在验证患者妄想及未能有效干预自杀风险等严重安全隐患，并验证了该框架在帮助多方利益相关者审计 AI 心理治疗“黑箱”方面的有效性。

Ian Steenstra, Paola Pedrelli, Weiyan Shi + 2 more2026-03-06💻 cs

On Imbalanced Regression with Hoeffding Trees

本文通过将核密度估计扩展为流式 telescoping 形式并将层次收缩集成到增量决策树中，研究了不平衡回归问题，实验表明前者能显著提升流数据早期性能，而后者增益有限。

Pantia-Marina Alchirch, Dimitrios I. Diochnos2026-03-06💻 cs

Zatom-1: A Multimodal Flow Foundation Model for 3D Molecules and Materials

Zatom-1 是首个端到端开源的基础模型，通过多模态流匹配目标统一了 3D 分子与材料的生成及预测任务，实现了跨化学领域的知识迁移，并在保持预测精度的同时显著提升了生成效率。

Alex Morehead, Miruna Cretu, Antonia Panescu + 14 more2026-03-06🔬 cond-mat.mtrl-sci

Interpretable Multimodal Gesture Recognition for Drone and Mobile Robot Teleoperation via Log-Likelihood Ratio Fusion

本文提出了一种结合 Apple Watch 惯性数据与定制手套电容信号的基于对数似然比融合的可解释多模态手势识别框架，并发布了包含 20 种手势的新数据集，该方案在保持与视觉基线相当性能的同时，显著降低了计算成本与模型规模，有效提升了无人机和移动机器人在危险环境下的遥操作鲁棒性。

Seungyeol Baek, Jaspreet Singh, Lala Shakti Swarup Ray + 3 more2026-03-06💻 cs

Pessimistic Auxiliary Policy for Offline Reinforcement Learning

本文提出了一种通过最大化 Q 函数下界来构建的悲观辅助策略，旨在为离线强化学习采样高价值且低不确定性的可靠动作，从而减少近似误差积累并提升现有算法的性能。

Fan Zhang, Baoru Huang, Xin Zhang2026-03-06💻 cs

Jailbreak Foundry: From Papers to Runnable Attacks for Reproducible Benchmarking

本文提出了名为 JAILBREAK FOUNDRY (JBF) 的系统，通过多智能体工作流将大语言模型越狱论文自动转化为可执行模块，从而解决了因基准漂移导致的评估滞后与不可比问题，并实现了高保真度、高代码复用率的标准化安全基准测试。

Zhicheng Fang, Jingjie Zheng, Chenxu Fu, Wei Xu2026-03-06🔒 cs.CR

DiffusionHarmonizer: Bridging Neural Reconstruction and Photorealistic Simulation with Online Diffusion Enhancer

DiffusionHarmonizer 是一种基于单步在线扩散模型的增强框架，通过专门构建的合成 - 真实数据对进行训练，有效解决了神经重建场景中的渲染伪影与动态物体融合问题，从而在单 GPU 上实现了高保真且时序一致的自动驾驶仿真。

Yuxuan Zhang, Katarína Tóthová, Zian Wang + 7 more2026-03-06💻 cs

Dr. Seg: Revisiting GRPO Training for Visual Large Language Models through Perception-Oriented Design

本文针对将 GRPO 从语言推理迁移至视觉感知任务时存在的假设误区，提出了无需架构修改的 Dr. Seg 框架，通过引入“观察确认”机制和分布排序奖励模块，有效解决了输出空间不足与奖励细粒度不稳定问题，显著提升了视觉大语言模型在复杂场景下的表现。

Haoxiang Sun, Tao Wang, Chenwei Tang + 2 more2026-03-06💻 cs

AlignVAR: Towards Globally Consistent Visual Autoregression for Image Super-Resolution

本文提出了 AlignVAR 框架，通过引入空间一致性自回归（SCA）和分层一致性约束（HCC）两大核心组件，有效解决了视觉自回归模型在图像超分辨率任务中面临的局部偏差与误差累积问题，在显著提升全局一致性与感知质量的同时，实现了比主流扩散方法快 10 倍且参数量减少近 50% 的高效推理。

Cencen Liu, Dongyang Zhang, Wen Yin + 6 more2026-03-06💻 cs

Improving Text-to-Image Generation with Intrinsic Self-Confidence Rewards

本文提出了名为 SOLACE 的无监督后训练框架，通过利用模型在自去噪过程中恢复注入噪声的内在自置信度信号作为奖励，无需外部标注或奖励模型即可显著提升文生图模型在组合生成、文本渲染及图文对齐等方面的表现，并能与外部奖励互补以减轻奖励黑客现象。

Seungwook Kim, Minsu Cho2026-03-06💻 cs

AutoSkill: Experience-Driven Lifelong Learning via Skill Self-Evolution

AutoSkill 是一个模型无关的插件框架，它通过将对话交互经验自动提炼为可复用、可进化且动态注入的技能，使大语言智能体能够在不重新训练模型的情况下实现个性化的终身学习。

Yutao Yang, Junsong Li, Qianjun Pan + 9 more2026-03-06💻 cs