Reject, Resample, Repeat: Understanding Parallel Reasoning in Language Model Inference

本文通过粒子滤波(如序贯蒙特卡洛)的视角,为语言模型推理中的并行采样方法建立了理论框架,揭示了采样误差与奖励评估次数之间的非渐近关系,并指出了该方法在理论保证与最终准确率之间的根本局限。

Noah Golowich, Fan Chen, Dhruv Rohatgi, Raghav Singhal, Carles Domingo-Enrich, Dylan J. Foster, Akshay Krishnamurthy2026-03-10🤖 cs.LG

Designing probabilistic AI monsoon forecasts to inform agricultural decision-making

该论文提出了一种基于决策理论的框架,通过融合人工智能天气预测模型与动态农民期望统计模型,成功开发了更精准的印度季风预报系统,并于 2025 年向 3800 万印度农民提供了有效的季节性降雨 onset 预报以辅助农业决策。

Colin Aitken, Rajat Masiwal, Adam Marchakitus, Katherine Kowal, Mayank Gupta, Tyler Yang, Amir Jina, Pedram Hassanzadeh, William R. Boos, Michael Kremer2026-03-10🤖 cs.LG

DyQ-VLA: Temporal-Dynamic-Aware Quantization for Embodied Vision-Language-Action Models

本文提出了 DyQ-VLA 框架,通过利用实时运动学代理进行感知敏感的位宽切换与动态分配,解决了具身视觉 - 语言 - 动作模型在静态量化中面临的时序动态敏感性与实时分配难题,在显著降低内存占用的同时保持了高性能并提升了推理速度。

Zihao Zheng, Hangyu Cao, Sicheng Tian, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG

Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases

本文针对关系数据库中实体分类任务存在的类别不平衡问题,提出了关系中心的小样本合成过采样图神经网络模型 Rel-MOSS,通过设计关系门控控制器和关系引导合成器来增强少数类信息表达与一致性,显著提升了模型在平衡准确率和几何平均数上的性能。

Jun Yin, Peng Huo, Bangguo Zhu, Hao Yan, Senzhang Wang, Shirui Pan, Chengqi Zhang2026-03-10🤖 cs.LG

Robust Transfer Learning with Side Information

本文提出了一种利用源域侧信息(如特征矩界、分布距离和密度比)构建估计中心不确定性集的转移学习框架,通过融合有限目标样本与侧信息来生成更紧致的不确定性集,从而在环境发生显著偏移时有效缓解传统分布鲁棒优化方法的过度保守问题,显著提升了目标域策略的样本效率与性能。

Akram S. Awad, Shihab Ahmed, Yue Wang, George K. Atia2026-03-10🤖 cs.LG

ELLMob: Event-Driven Human Mobility Generation with Self-Aligned LLM Framework

该论文针对现有大语言模型在生成受重大社会事件影响的人类轨迹时难以平衡习惯模式与事件约束的局限,构建了首个事件标注移动数据集,并提出了基于模糊痕迹理论的自对齐大语言模型框架 ELLMob,通过提取并迭代对齐竞争推理来生成兼具习惯基础与事件响应性的轨迹,实验表明其性能优于现有最先进方法。

Yusong Wang, Chuang Yang, Jiawei Wang, Xiaohang Xu, Jiayi Xu, Dongyuan Li, Chuan Xiao, Renhe Jiang2026-03-10🤖 cs.LG