cs.LG 篇论文 | Gist.Science

Coverage-Aware Web Crawling for Domain-Specific Supplier Discovery via a Web--Knowledge--Web Pipeline

该论文提出了一种“网络—知识—网络”（W→K→W）迭代管道，结合领域自适应的少样本大语言模型提示与基于生态学原理的覆盖率估计框架，通过利用知识图谱的拓扑结构引导爬虫定向探索，从而在显著减少页面抓取量的同时，高效且精准地发现了半导体设备制造业中传统数据库遗漏的中小供应商。

Yijiashun Qi, Yijiazhen Qi, Tanmay Wagh2026-03-09🤖 cs.LG

Weight Updates as Activation Shifts: A Principled Framework for Steering

该论文通过建立激活空间干预与权重更新之间的一阶等价性，提出了一个 principled 的激活导向框架，确定了后块输出为最佳干预位置，并引入联合适应新范式，在仅训练 0.04% 参数的情况下实现了接近全参数微调的性能，显著优于现有的激活导向和参数高效微调方法。

Dyah Adila, John Cooper, Alexander Yun, Avi Trost, Frederic Sala2026-03-09🤖 cs.LG

Reparameterized Tensor Ring Functional Decomposition for Multi-Dimensional Data Recovery

该论文提出了一种基于隐式神经表示和重参数化策略的张量环函数分解方法，通过引入可学习潜张量与固定基的混合结构来优化频谱特性并改善训练动态，从而在图像修复、去噪、超分辨率及点云恢复等多维数据恢复任务中实现了优于现有方法的性能。

Yangyang Xu, Junbo Ke, You-Wei Wen, Chao Wang2026-03-09🤖 cs.AI

LMU-Based Sequential Learning and Posterior Ensemble Fusion for Cross-Domain Infant Cry Classification

该论文提出了一种结合多分支 CNN 特征提取与增强型 Legendre 记忆单元（LMU）的紧凑声学框架，并引入基于熵门控的校准后验集成融合策略，有效解决了跨域婴儿哭声分类中信号非平稳、标注稀缺及域偏移等挑战，显著提升了模型的泛化能力与实时部署性能。

Niloofar Jazaeri, Hilmi R. Dajani, Marco Janeczek, Martin Bouchard2026-03-09🤖 cs.LG

Whisper-RIR-Mega: A Paired Clean-Reverberant Speech Benchmark for ASR Robustness to Room Acoustics

本文介绍了名为 Whisper-RIR-Mega 的配对清洁与混响语音基准数据集，该数据集通过将 LibriSpeech 语料与 RIR-Mega 真实房间脉冲响应结合，并针对混响时间和直达声混响比进行分层划分，用于评估不同规模 Whisper 模型在房间声学条件下的自动语音识别鲁棒性。

Mandip Goswami2026-03-09🤖 cs.AI

Rigidity-Aware Geometric Pretraining for Protein Design and Conformational Ensembles

本文提出了名为 RigidSSL 的几何预训练框架，通过结合刚性感知流匹配目标与大规模结构扰动及分子动力学数据，有效解决了现有蛋白质生成模型在几何联合学习、全局刚性理解及动态构象建模方面的局限，显著提升了蛋白质设计的可设计性、新颖性及构象系综的物理真实性。

Zhanghan Ni, Yanjing Li, Zeju Qiu, Bernhard Schölkopf, Hongyu Guo, Weiyang Liu, Shengchao Liu2026-03-09🤖 cs.AI

mlx-vis: GPU-Accelerated Dimensionality Reduction and Visualization on Apple Silicon

mlx-vis 是一款基于 Apple Silicon 的 Python 库，它利用 MLX 框架在 Metal GPU 上实现了六种降维方法及 KNN 图算法，并集成了无需 Matplotlib 的 GPU 加速圆形点渲染器，从而能在 M3 Ultra 等芯片上极速完成从数据嵌入到视频生成的全流程可视化。

Han Xiao2026-03-09🤖 cs.LG

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents

该论文提出了“遍历即策略”（Traversal-as-Policy）框架，通过将沙盒执行日志蒸馏为可执行的门控行为树（GBT），将控制策略从隐式生成转变为显式遍历，从而在 OpenHands 基准测试中显著提升了智能体的任务成功率、安全性并降低了成本。

Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong Tu2026-03-09🤖 cs.AI

Information-Theoretic Privacy Control for Sequential Multi-Agent LLM Systems

该论文针对顺序多智能体大语言模型系统中局部隐私约束无法防止级联泄露的问题，通过形式化互信息泄露并推导理论界，提出了一种隐私正则化训练框架，证明了必须将隐私视为系统级属性以在训练和部署阶段实现有效的隐私 - 效用权衡。

Sadia Asif, Mohammad Mohammadi Amiri2026-03-09🤖 cs.LG

RoboLayout: Differentiable 3D Scene Generation for Embodied Agents

RoboLayout 通过引入可微分的可达性约束和局部细化优化机制，扩展了 LayoutVLM 框架，使其能够生成既符合语义逻辑又适应不同具身智能体物理交互能力的 3D 室内场景布局。

Ali Shamsaddinlou2026-03-09🤖 cs.AI

Clinical-Injection Transformer with Domain-Adapted MAE for Lupus Nephritis Prognosis Prediction

本文提出了一种结合临床特征注入 Transformer 与领域自适应掩码自编码器的多模态计算病理框架，仅利用常规 PAS 染色活检和临床数据，在儿童狼疮性肾炎预后预测中实现了高达 90.1% 的三类准确率。

Yuewen Huang, Zhitao Ye, Guangnan Feng, Fudan Zheng, Xia Gao, Yutong Lu2026-03-09🤖 cs.LG

JAWS: Enhancing Long-term Rollout of Neural Operators via Spatially-Adaptive Jacobian Regularization

本文提出了名为 JAWS 的基于空间自适应雅可比正则化的概率正则化策略，通过根据局部物理复杂度动态调整正则化强度，在抑制高频不稳定性与保留奇异特征梯度之间取得平衡，从而显著提升了神经算子在长时程推演中的稳定性、激波保真度及泛化能力，同时降低了训练计算成本。

Fengxiang Nie, Yasuhiro Suzuki2026-03-09🤖 cs.AI

VDCook:DIY video data cook your MLLMs

本文介绍了 VDCook，一个基于自然语言查询和 MCP 协议实现自动检索与合成、支持持续演进与多维元数据标注的自进化视频数据操作系统，旨在降低构建垂直领域多模态大模型训练数据集的门槛。

Chengwei Wu2026-03-09🤖 cs.AI

Attention Meets Reachability: Structural Equivalence and Efficiency in Grammar-Constrained LLM Decoding

该论文通过引入结构歧义成本（SAC）和证明引擎无关的下界，揭示了语法等价性并不保证解码效率，并提出了基于可达性预言机的语法约束解码理论框架，以优化大语言模型在上下文无关语法约束下的解码性能与成本。

Faruk Alpay, Bilge Senturk2026-03-09🤖 cs.LG

An intuitive rearranging of the Yates covariance decomposition for probabilistic verification of forecasts with the Brier score

该论文提出了一种对 Brier 分数中 Yates 协方差分解的直观代数重排，将其转化为方差失配、相关度不足和大尺度校准三个非负项，从而清晰揭示了完美概率预报需同时满足方差匹配、完全正相关及均值匹配的最优条件。

Bruno Hebling Vieira (Methods of Plasticity Research, Department of Psychology, University of Zurich, Zurich, Switzerland)2026-03-09🤖 cs.LG

cs.LG