cs.AI 篇论文 | Gist.Science

Machine Learning for Stress Testing: Uncertainty Decomposition in Causal Panel Prediction

该论文提出了一种用于压力测试的机器学习框架，通过迭代回归、有界混淆下的因果集识别、递归 rollout 误差界及重要性加权共形校准，将预测不确定性分解为估计不确定性和混淆不确定性，从而在无需控制组的情况下实现透明且稳健的政策路径反事实推断。

Yu Wang, Xiangchen Liu, Siguang Li2026-03-10💻 cs

HLER: Human-in-the-Loop Economic Research via Multi-Agent Pipelines for Empirical Discovery

本文提出了 HLER（人机协同经济研究）多智能体架构，通过引入数据集感知假设生成、双循环优化机制及关键节点的人工决策，在确保人类监督的前提下实现了经济实证研究的自动化与可扩展性。

Chen Zhu, Xiaolu Wang2026-03-10💻 cs

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

本文提出了 Dial，一种基于知识的地域特定 NL2SQL 系统，通过引入方言感知逻辑查询规划、分层意图知识基以及执行驱动的调试验证循环，有效解决了现有方法在处理异构数据库方言时语义正确性与可执行性不足的问题，并在新构建的 DS-NL2SQL 基准测试中显著提升了翻译准确率与方言特性覆盖率。

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

Backdoor4Good: Benchmarking Beneficial Uses of Backdoors in LLMs

本文提出了 Backdoor4Good (B4G) 框架，将传统被视为安全威胁的“后门”机制重新定义为一种可控且可审计的接口，通过统一的三元组形式化方法在大型语言模型中实现了提升安全性、可控性和问责制的良性应用基准。

Yige Li, Wei Zhao, Zhe Li, Nay Myat Min, Hanxun Huang, Yunhan Zhao, Xingjun Ma, Yu-Gang Jiang, Jun Sun2026-03-10💻 cs

Image Generation Models: A Technical History

本文全面综述了过去十年图像生成领域的技术演进，系统梳理了从变分自编码器、生成对抗网络到扩散模型等主流架构的原理、优化与局限，并进一步探讨了视频生成、模型鲁棒性及负责任部署等关键议题。

Rouzbeh Shirvani2026-03-10💬 cs.CL

"Better Ask for Forgiveness than Permission": Practices and Policies of AI Disclosure in Freelance Work

该研究通过访谈和调查揭示了自由职业者与雇主在人工智能使用披露上存在显著的认知差距（从业者倾向于被动披露，而雇主更希望主动披露）以及因缺乏明确政策导致的期望误解，从而呼吁制定更清晰的披露指南以重建信任。

Angel Hsing-Chi Hwang, Senya Wong, Baixiao Chen, Jessica He, Hyo Jin Do2026-03-10💻 cs

Where Do LLM-based Systems Break? A System-Level Security Framework for Risk Assessment and Treatment

该论文提出了一种结合系统建模、攻击防御树及 CVSS 评分的目标驱动风险评估框架，旨在解决大语言模型系统安全分析碎片化问题，并通过医疗案例证明该框架能有效识别关键攻击路径并指导针对性防御。

Neha Nagaraja, Hayretdin Bahsi2026-03-10💻 cs

The Dual-Stream Transformer: Channelized Architecture for Interpretable Language Modeling

本文提出了双流 Transformer 架构，通过将残差流解耦为分别由注意力机制和前馈网络更新的双流结构，并引入可调节的混合策略，在仅造成极小性能损失（推荐策略为 2.5%）的同时显著提升了语言模型的内部可解释性。

J. Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Do Machines Fail Like Humans? A Human-Centred Out-of-Distribution Spectrum for Mapping Error Alignment

该论文提出了一种以人类感知难度为核心的分布外（OOD）谱系框架，通过量化刺激偏离程度来重新定义挑战等级，从而在不同难度区间内更精准地评估了各类深度学习模型（如 CNN、ViT 及视觉 - 语言模型）与人类在错误模式上的一致性。

Binxia Xu, Xiaoliang Luo, Luke Dickens, Robert M. Mok2026-03-10💻 cs

Towards Lightweight Adaptation of Speech Enhancement Models in Real-World Environments

该论文提出了一种通过自监督训练更新低秩适配器来微调冻结骨干网络的轻量级框架，仅需更新不到 1% 的参数即可在动态声学场景中实现高效的语音增强模型自适应，显著提升了模型在复杂噪声环境下的鲁棒性与感知质量。

Longbiao Cheng, Shih-Chii Liu2026-03-10🤖 cs.LG

Contact-Guided 3D Genome Structure Generation of E. coli via Diffusion Transformers

该研究提出了一种基于条件扩散变换器的框架，利用 Hi-C 接触图谱引导生成具有高度构象多样性的*大肠杆菌*三维基因组结构集合，从而解决了传统方法仅能产生单一确定性结构的局限性。

Mingxin Zhang, Xiaofeng Dai, Yu Yao, Ziqi Yin2026-03-10🤖 cs.LG

Give Them an Inch and They Will Take a Mile:Understanding and Measuring Caller Identity Confusion in MCP-Based AI Systems

该论文通过大规模实证分析揭示了基于模型上下文协议（MCP）的 AI 系统因缺乏调用者身份验证及细粒度授权机制，导致“一次授权、永久信任”的架构存在严重安全隐患，使得攻击者可能利用身份混淆绕过安全控制。

Yuhang Huang, Boyang Ma, Biwei Yan, Xuelong Dai, Yechao Zhang, Minghui Xu, Kaidi Xu, Yue Zhang2026-03-10💻 cs

cs.AI

Machine Learning for Stress Testing: Uncertainty Decomposition in Causal Panel Prediction

HLER: Human-in-the-Loop Economic Research via Multi-Agent Pipelines for Empirical Discovery

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

Backdoor4Good: Benchmarking Beneficial Uses of Backdoors in LLMs

Image Generation Models: A Technical History

"Better Ask for Forgiveness than Permission": Practices and Policies of AI Disclosure in Freelance Work

Where Do LLM-based Systems Break? A System-Level Security Framework for Risk Assessment and Treatment

The Dual-Stream Transformer: Channelized Architecture for Interpretable Language Modeling

Do Machines Fail Like Humans? A Human-Centred Out-of-Distribution Spectrum for Mapping Error Alignment

Towards Lightweight Adaptation of Speech Enhancement Models in Real-World Environments

Contact-Guided 3D Genome Structure Generation of E. coli via Diffusion Transformers

Give Them an Inch and They Will Take a Mile:Understanding and Measuring Caller Identity Confusion in MCP-Based AI Systems

Cross-Modal Taxonomic Generalization in (Vision-) Language Models

Interpretable-by-Design Transformers via Architectural Stream Independence

A Joint Neural Baseline for Concept, Assertion, and Relation Extraction from Clinical Text

From Thinker to Society: Security in Hierarchical Autonomy Evolution of AI Agents

SeDa: A Unified System for Dataset Discovery and Multi-Entity Augmented Semantic Exploration

A Unified View of Drifting and Score-Based Models

InterReal: A Unified Physics-Based Imitation Framework for Learning Human-Object Interaction Skills

SketchGraphNet: A Memory-Efficient Hybrid Graph Transformer for Large-Scale Sketch Corpora Recognition