cs.LG 篇论文 | Gist.Science

Slumbering to Precision: Enhancing Artificial Neural Network Calibration Through Sleep-like Processes

该论文受生物睡眠机制启发，提出了一种名为“睡眠回放巩固”（SRC）的后训练校准方法，通过选择性回放内部表征来更新网络权重，从而在不依赖监督重训练的情况下显著提升人工神经网络的置信度校准能力。

Jean Erik Delanois, Aditya Ahuja, Giri P. Krishnan, Maxim Bazhenov2026-03-10🤖 cs.LG

Hospitality-VQA: Decision-Oriented Informativeness Evaluation for Vision-Language Models

该论文针对现有视觉语言模型在酒店决策领域信息实用性评估的不足，提出了“信息性”评估框架并构建了专用数据集，研究发现模型需经过适度的领域微调才能有效利用视觉信号进行决策导向的信息推理。

Jeongwoo Lee, Baek Duhyeong, Eungyeol Han, Soyeon Shin, Gukin han, Seungduk Kim, Jaehyun Jeon, Taewoo Jeong2026-03-10🤖 cs.LG

Toward Unified Multimodal Representation Learning for Autonomous Driving

该论文提出了一种对比张量预训练（CTP）框架，通过将传统的成对余弦相似度扩展为多模态相似性张量并引入张量损失，实现了视觉、文本和点云等多模态数据在统一嵌入空间中的联合对齐，从而显著提升了自动驾驶场景下的端到端性能。

Ximeng Tao, Dimitar Filev, Gaurav Pandey2026-03-10🤖 cs.LG

Reject, Resample, Repeat: Understanding Parallel Reasoning in Language Model Inference

本文通过粒子滤波（如序贯蒙特卡洛）的视角，为语言模型推理中的并行采样方法建立了理论框架，揭示了采样误差与奖励评估次数之间的非渐近关系，并指出了该方法在理论保证与最终准确率之间的根本局限。

Noah Golowich, Fan Chen, Dhruv Rohatgi, Raghav Singhal, Carles Domingo-Enrich, Dylan J. Foster, Akshay Krishnamurthy2026-03-10🤖 cs.LG

VLM-SubtleBench: How Far Are VLMs from Human-Level Subtle Comparative Reasoning?

本文提出了 VLM-SubtleBench 基准，旨在通过涵盖工业、医疗和航拍等多领域及十种细微差异类型的配对图像与问题，评估视觉语言模型在细微对比推理方面与人类水平的差距，并揭示了现有模型在复杂场景下的系统性不足。

Minkyu Kim, Sangheon Lee, Dongmin Park2026-03-10🤖 cs.LG

Designing probabilistic AI monsoon forecasts to inform agricultural decision-making

该论文提出了一种基于决策理论的框架，通过融合人工智能天气预测模型与动态农民期望统计模型，成功开发了更精准的印度季风预报系统，并于 2025 年向 3800 万印度农民提供了有效的季节性降雨 onset 预报以辅助农业决策。

Colin Aitken, Rajat Masiwal, Adam Marchakitus, Katherine Kowal, Mayank Gupta, Tyler Yang, Amir Jina, Pedram Hassanzadeh, William R. Boos, Michael Kremer2026-03-10🤖 cs.LG

SMGI: A Structural Theory of General Artificial Intelligence

该论文提出了名为 SMGI 的结构化通用人工智能理论，通过形式化一个包含动态组件的元模型，将学习问题重新定义为学习接口本身的受控演化，并证明了经典机器学习范式均为该理论的结构受限特例。

Aomar Osmani2026-03-10🤖 cs.LG

LeJOT-AutoML: LLM-Driven Feature Engineering for Job Execution Time Prediction in Databricks Cost Optimization

本文提出了 LeJOT-AutoML 框架，利用大语言模型代理结合检索增强生成与工具链，自动化完成 Databricks 作业执行时间预测的特征工程，将特征构建周期从数周缩短至 20-30 分钟，并通过优化任务编排实现了 19.01% 的云成本节约。

Lizhi Ma, Yi-Xiang Hu, Yihui Ren, Feng Wu, Xiang-Yang Li2026-03-10🤖 cs.LG

Revisiting Unknowns: Towards Effective and Efficient Open-Set Active Learning

本文提出了 E²OAL，一种无需独立检测器的统一开放集主动学习框架，它通过利用标签引导聚类挖掘未知类潜在结构并结合狄利克雷校准辅助头，有效提升了已知类判别能力与查询精度，在多个基准测试中显著优于现有最先进方法。

Chen-Chen Zong, Yu-Qi Chi, Xie-Yang Wang, Yan Cui, Sheng-Jun Huang2026-03-10🤖 cs.LG

Bayesian Transformer for Probabilistic Load Forecasting in Smart Grids

该论文提出了一种集成蒙特卡洛 Dropout、变分前馈层及随机注意力机制的贝叶斯 Transformer 框架，通过多分位数预测与校准技术，在多个电网数据集上实现了优于现有深度集成和确定性模型的负荷概率预测性能，特别是在极端天气下能提供更准确且校准良好的不确定性估计。

Sajib Debnath, Md. Uzzal Mia2026-03-10🤖 cs.LG

NaviDriveVLM: Decoupling High-Level Reasoning and Motion Planning for Autonomous Driving

NaviDriveVLM 提出了一种将大规模导航器（负责推理）与轻量级驾驶员（负责动作生成）解耦的框架，在保留大模型语义推理能力的同时降低了训练成本，并在 nuScenes 基准测试中实现了优于现有大模型基线的端到端运动规划性能。

Ximeng Tao, Pardis Taghavi, Dimitar Filev, Reza Langari, Gaurav Pandey2026-03-10🤖 cs.LG

DyQ-VLA: Temporal-Dynamic-Aware Quantization for Embodied Vision-Language-Action Models

本文提出了 DyQ-VLA 框架，通过利用实时运动学代理进行感知敏感的位宽切换与动态分配，解决了具身视觉 - 语言 - 动作模型在静态量化中面临的时序动态敏感性与实时分配难题，在显著降低内存占用的同时保持了高性能并提升了推理速度。

Zihao Zheng, Hangyu Cao, Sicheng Tian, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG

Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases

本文针对关系数据库中实体分类任务存在的类别不平衡问题，提出了关系中心的小样本合成过采样图神经网络模型 Rel-MOSS，通过设计关系门控控制器和关系引导合成器来增强少数类信息表达与一致性，显著提升了模型在平衡准确率和几何平均数上的性能。

Jun Yin, Peng Huo, Bangguo Zhu, Hao Yan, Senzhang Wang, Shirui Pan, Chengqi Zhang2026-03-10🤖 cs.LG

Robust Transfer Learning with Side Information

本文提出了一种利用源域侧信息（如特征矩界、分布距离和密度比）构建估计中心不确定性集的转移学习框架，通过融合有限目标样本与侧信息来生成更紧致的不确定性集，从而在环境发生显著偏移时有效缓解传统分布鲁棒优化方法的过度保守问题，显著提升了目标域策略的样本效率与性能。

Akram S. Awad, Shihab Ahmed, Yue Wang, George K. Atia2026-03-10🤖 cs.LG

Semantic Risk Scoring of Aggregated Metrics: An AI-Driven Approach for Healthcare Data Governance

该论文提出了一种基于 AI 的模块化框架，通过结合语义与语法特征对 SQL 指标定义进行静态风险评分，从而在无需访问敏感患者数据的情况下，实现对医疗聚合指标隐私泄露风险的预先检测与可解释性治理。

Mohammed Omer Shakeel Ahmed2026-03-10🤖 cs.LG

ELLMob: Event-Driven Human Mobility Generation with Self-Aligned LLM Framework

该论文针对现有大语言模型在生成受重大社会事件影响的人类轨迹时难以平衡习惯模式与事件约束的局限，构建了首个事件标注移动数据集，并提出了基于模糊痕迹理论的自对齐大语言模型框架 ELLMob，通过提取并迭代对齐竞争推理来生成兼具习惯基础与事件响应性的轨迹，实验表明其性能优于现有最先进方法。

Yusong Wang, Chuang Yang, Jiawei Wang, Xiaohang Xu, Jiayi Xu, Dongyuan Li, Chuan Xiao, Renhe Jiang2026-03-10🤖 cs.LG

RL unknotter, hard unknots and unknotting number

该论文提出了一种强化学习流程，通过训练智能体学习雷德迈斯特移动策略，成功简化了极难结图，并验证了复合结 $4_1\#9_{10}$ 的 unknotting number 上界为 3。

Anne Dranowski, Yura Kabkov, Daniel Tubbenhauer2026-03-10🤖 cs.LG

PSTNet: Physically-Structured Turbulence Network

本文提出了一种名为 PSTNet 的轻量级物理结构化网络，通过将湍流物理定律直接嵌入架构（如 Monin-Obukhov 理论和 Kolmogorov 输出层），在仅含 552 个参数且资源受限的机载微控制器上实现了比传统方法更准确、可解释且高效的实时大气湍流强度估计。

Boris Kriuk, Fedor Kriuk2026-03-10🤖 cs.LG

Local Constrained Bayesian Optimization

本文提出了一种名为局部约束贝叶斯优化（LCBO）的新框架，通过利用约束惩罚代理的可微地形在快速局部下降与不确定性驱动的全局探索之间交替，有效解决了高维约束优化中的维度灾难问题，并在理论收敛性和实验表现上均优于现有方法。

Jing Jingzhe, Fan Zheyi, Szu Hui Ng, Qingpei Hu2026-03-10🤖 cs.LG

Scaling Machine Learning Interatomic Potentials with Mixtures of Experts

该论文系统开发了用于机器学习原子间势的混合专家（MoE）架构，通过结合稀疏激活、共享专家及元素级路由策略，不仅显著提升了模型精度并达到基准测试的最先进水平，还揭示了专家网络能够捕捉与元素周期表趋势一致的化学特征。

Yuzhi Liu, Duo Zhang, Anyang Peng, Weinan E, Linfeng Zhang, Han Wang2026-03-10🤖 cs.LG