cs.AI 篇论文 | Gist.Science

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

本文针对低资源场景下的英译印地语机器翻译，通过对比提示策略并引入结合低秩适应与回归头的中间层微调框架（ALOPE 及其扩展 LoRMA），显著提升了医疗、法律等高风险领域句子级质量估计的鲁棒性，并公开了相关代码与数据集。

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

Scheduling Parallel Optical Circuit Switches for AI Training

针对并行光电路交换在 AI 训练流量调度中面临的非零重配置延迟挑战，本文提出了名为 Spectra 的算法，通过分解、负载均衡分配及受控置换分割三步策略，在多种 AI 工作负载和基准测试中显著缩短了调度时间并逼近理论下界。

Kevin Liang, Litao Qiao, Isaac Keslassy, Bill Lin2026-03-10💻 cs

SoK: Agentic Retrieval-Augmented Generation (RAG): Taxonomy, Architectures, Evaluation, and Research Directions

这篇论文首次提出了一个统一框架，将代理式检索增强生成（Agentic RAG）系统形式化为序贯决策过程，并据此构建了涵盖分类体系、模块化架构、评估局限、系统性风险及未来研究方向的全面综述。

Saroj Mishra, Suman Niroula, Umesh Yadav, Dilip Thakur, Srijan Gyawali, Shiva Gaire2026-03-10💬 cs.CL

Sparsity and Out-of-Distribution Generalization

该论文提出了一种基于特征区分性、稀疏性（奥卡姆剃刀）及分布重叠性的原则性框架，通过形式化定理证明了稀疏假设在训练与测试分布仅部分重叠时仍能实现泛化，并将该理论推广至子空间联合分类器。

Scott Aaronson, Lin Lin Lee, Jiawei Li2026-03-10🤖 cs.LG

AQuA: Toward Strategic Response Generation for Ambiguous Visual Questions

该论文提出了名为 AQuA 的细粒度数据集，通过将模糊视觉问答按模糊程度分类并定义最优响应策略，训练视觉语言模型使其能够识别模糊性并自适应地选择直接回答、推断意图、列举替代方案或请求澄清等策略，从而在模糊场景下显著优于现有基线模型。

Jihyoung Jang, Hyounghun Kim2026-03-10💬 cs.CL

Adaptive Capacity Allocation for Vision Language Action Fine-tuning

本文提出了 LoRA-SP（Select-Prune）方法，通过引入基于能量目标的秩自适应机制，使视觉语言动作模型（VLA）能够根据输入和层级动态调整微调容量，从而在显著减少可训练参数的同时，有效解决多任务场景下的跨任务干扰问题并提升泛化性能。

Donghoon Kim, Minji Bae, Unghui Nam, Gyeonghun Kim, Suyun Lee, Kyuhong Shim, Byonghyo Shim2026-03-10💻 cs

UnSCAR: Universal, Scalable, Controllable, and Adaptable Image Restoration

该论文针对现有通用图像恢复模型在扩展多退化任务时面临的训练不稳定、模型臃肿及性能下降等局限，提出了一种基于多分支混合专家架构的统一推理流程，通过解耦退化知识实现了可扩展、可控制且具备强泛化能力的通用图像恢复。

Debabrata Mandal, Soumitri Chattopadhyay, Yujie Wang, Marc Niethammer, Praneeth Chakravarthula2026-03-10💻 cs

Machine Learning for the Internet of Underwater Things: From Fundamentals to Implementation

本文综述了机器学习在解决水声通信延迟、能耗及动态拓扑等挑战中的关键作用，通过涵盖从物理层到应用层的分层分析，展示了其在提升定位、路由、数据压缩及整体网络性能方面的显著成效，并指出了当前部署面临的局限与未来发展方向。

Kenechi Omeke, Attai Abubakar, Michael Mollel, Lei Zhang, Qammer H. Abbasi, Muhammad Ali Imran2026-03-10💻 cs

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

该论文提出了“上下文信道容量”这一信息论框架，证明了零遗忘要求上下文信号与生成参数间存在足够的互信息，揭示了传统状态型持续学习方法的“不可能三角”局限，并指出通过架构设计（如超网络）重构参数为函数值而非状态是实现零遗忘的关键。

Ran Cheng2026-03-10🤖 cs.LG

Dynamic Vehicle Routing Problem with Prompt Confirmation of Advance Requests

本文针对公共交通微循环中“即时确认预约请求”与“持续优化已确认路线”难以兼顾的痛点，提出了一种结合快速插入搜索、随时优化算法及强化学习非短视目标函数的新型动态车辆路由框架，并在真实数据集上验证了其在提升服务请求数量方面的显著优势。

Amutheezan Sivagnanam, Ayan Mukhopadhyay, Samitha Samaranayake, Abhishek Dubey, Aron Laszka2026-03-10💻 cs

AutoControl Arena: Synthesizing Executable Test Environments for Frontier AI Risk Evaluation

本文提出了基于逻辑与叙事解耦原则的 AutoControl Arena 框架，通过结合可执行代码与生成式大模型，在高效合成测试环境的同时显著降低了幻觉问题，并借此揭示了前沿 AI 模型在压力与诱惑下存在的对齐幻觉、场景特异性安全缩放及差异化失控模式等关键风险。

Changyi Li, Pengfei Lu, Xudong Pan, Fazl Barez, Min Yang2026-03-10💻 cs

OrthoFormer: Instrumental Variable Estimation in Transformer Hidden States via Neural Control Functions

本文提出了名为 OrthoFormer 的因果驱动架构，通过将工具变量估计嵌入 Transformer 隐藏状态并利用神经控制函数，有效解决了传统模型因混淆静态背景与动态因果流而导致的分布外泛化失败问题，实现了从相关性学习到因果推断的范式转变。

Charles Luo2026-03-10🤖 cs.LG

Machine Learning for Stress Testing: Uncertainty Decomposition in Causal Panel Prediction

该论文提出了一种用于压力测试的机器学习框架，通过迭代回归、有界混淆下的因果集识别、递归 rollout 误差界及重要性加权共形校准，将预测不确定性分解为估计不确定性和混淆不确定性，从而在无需控制组的情况下实现透明且稳健的政策路径反事实推断。

Yu Wang, Xiangchen Liu, Siguang Li2026-03-10💻 cs

HLER: Human-in-the-Loop Economic Research via Multi-Agent Pipelines for Empirical Discovery

本文提出了 HLER（人机协同经济研究）多智能体架构，通过引入数据集感知假设生成、双循环优化机制及关键节点的人工决策，在确保人类监督的前提下实现了经济实证研究的自动化与可扩展性。

Chen Zhu, Xiaolu Wang2026-03-10💻 cs

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

本文提出了 Dial，一种基于知识的地域特定 NL2SQL 系统，通过引入方言感知逻辑查询规划、分层意图知识基以及执行驱动的调试验证循环，有效解决了现有方法在处理异构数据库方言时语义正确性与可执行性不足的问题，并在新构建的 DS-NL2SQL 基准测试中显著提升了翻译准确率与方言特性覆盖率。

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

Backdoor4Good: Benchmarking Beneficial Uses of Backdoors in LLMs

本文提出了 Backdoor4Good (B4G) 框架，将传统被视为安全威胁的“后门”机制重新定义为一种可控且可审计的接口，通过统一的三元组形式化方法在大型语言模型中实现了提升安全性、可控性和问责制的良性应用基准。

Yige Li, Wei Zhao, Zhe Li, Nay Myat Min, Hanxun Huang, Yunhan Zhao, Xingjun Ma, Yu-Gang Jiang, Jun Sun2026-03-10💻 cs

Image Generation Models: A Technical History

本文全面综述了过去十年图像生成领域的技术演进，系统梳理了从变分自编码器、生成对抗网络到扩散模型等主流架构的原理、优化与局限，并进一步探讨了视频生成、模型鲁棒性及负责任部署等关键议题。

Rouzbeh Shirvani2026-03-10💬 cs.CL

"Better Ask for Forgiveness than Permission": Practices and Policies of AI Disclosure in Freelance Work

该研究通过访谈和调查揭示了自由职业者与雇主在人工智能使用披露上存在显著的认知差距（从业者倾向于被动披露，而雇主更希望主动披露）以及因缺乏明确政策导致的期望误解，从而呼吁制定更清晰的披露指南以重建信任。

Angel Hsing-Chi Hwang, Senya Wong, Baixiao Chen, Jessica He, Hyo Jin Do2026-03-10💻 cs

Where Do LLM-based Systems Break? A System-Level Security Framework for Risk Assessment and Treatment

该论文提出了一种结合系统建模、攻击防御树及 CVSS 评分的目标驱动风险评估框架，旨在解决大语言模型系统安全分析碎片化问题，并通过医疗案例证明该框架能有效识别关键攻击路径并指导针对性防御。

Neha Nagaraja, Hayretdin Bahsi2026-03-10💻 cs

The Dual-Stream Transformer: Channelized Architecture for Interpretable Language Modeling

本文提出了双流 Transformer 架构，通过将残差流解耦为分别由注意力机制和前馈网络更新的双流结构，并引入可调节的混合策略，在仅造成极小性能损失（推荐策略为 2.5%）的同时显著提升了语言模型的内部可解释性。

J. Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG