Designing probabilistic AI monsoon forecasts to inform agricultural decision-making
该论文提出了一种基于决策理论的框架,通过融合人工智能天气预测模型与动态农民期望统计模型,成功开发了更精准的印度季风预报系统,并于 2025 年向 3800 万印度农民提供了有效的季节性降雨 onset 预报以辅助农业决策。
9724 篇论文
该论文提出了一种基于决策理论的框架,通过融合人工智能天气预测模型与动态农民期望统计模型,成功开发了更精准的印度季风预报系统,并于 2025 年向 3800 万印度农民提供了有效的季节性降雨 onset 预报以辅助农业决策。
该论文提出了名为 SMGI 的结构化通用人工智能理论,通过形式化一个包含动态组件的元模型,将学习问题重新定义为学习接口本身的受控演化,并证明了经典机器学习范式均为该理论的结构受限特例。
本文提出了 LeJOT-AutoML 框架,利用大语言模型代理结合检索增强生成与工具链,自动化完成 Databricks 作业执行时间预测的特征工程,将特征构建周期从数周缩短至 20-30 分钟,并通过优化任务编排实现了 19.01% 的云成本节约。
本文提出了 E²OAL,一种无需独立检测器的统一开放集主动学习框架,它通过利用标签引导聚类挖掘未知类潜在结构并结合狄利克雷校准辅助头,有效提升了已知类判别能力与查询精度,在多个基准测试中显著优于现有最先进方法。
该论文提出了一种集成蒙特卡洛 Dropout、变分前馈层及随机注意力机制的贝叶斯 Transformer 框架,通过多分位数预测与校准技术,在多个电网数据集上实现了优于现有深度集成和确定性模型的负荷概率预测性能,特别是在极端天气下能提供更准确且校准良好的不确定性估计。
NaviDriveVLM 提出了一种将大规模导航器(负责推理)与轻量级驾驶员(负责动作生成)解耦的框架,在保留大模型语义推理能力的同时降低了训练成本,并在 nuScenes 基准测试中实现了优于现有大模型基线的端到端运动规划性能。
本文提出了 DyQ-VLA 框架,通过利用实时运动学代理进行感知敏感的位宽切换与动态分配,解决了具身视觉 - 语言 - 动作模型在静态量化中面临的时序动态敏感性与实时分配难题,在显著降低内存占用的同时保持了高性能并提升了推理速度。
本文针对关系数据库中实体分类任务存在的类别不平衡问题,提出了关系中心的小样本合成过采样图神经网络模型 Rel-MOSS,通过设计关系门控控制器和关系引导合成器来增强少数类信息表达与一致性,显著提升了模型在平衡准确率和几何平均数上的性能。
本文提出了一种利用源域侧信息(如特征矩界、分布距离和密度比)构建估计中心不确定性集的转移学习框架,通过融合有限目标样本与侧信息来生成更紧致的不确定性集,从而在环境发生显著偏移时有效缓解传统分布鲁棒优化方法的过度保守问题,显著提升了目标域策略的样本效率与性能。
该论文提出了一种基于 AI 的模块化框架,通过结合语义与语法特征对 SQL 指标定义进行静态风险评分,从而在无需访问敏感患者数据的情况下,实现对医疗聚合指标隐私泄露风险的预先检测与可解释性治理。
该论文针对现有大语言模型在生成受重大社会事件影响的人类轨迹时难以平衡习惯模式与事件约束的局限,构建了首个事件标注移动数据集,并提出了基于模糊痕迹理论的自对齐大语言模型框架 ELLMob,通过提取并迭代对齐竞争推理来生成兼具习惯基础与事件响应性的轨迹,实验表明其性能优于现有最先进方法。
该论文提出了一种强化学习流程,通过训练智能体学习雷德迈斯特移动策略,成功简化了极难结图,并验证了复合结的 unknotting number 上界为 3。
本文提出了一种名为 PSTNet 的轻量级物理结构化网络,通过将湍流物理定律直接嵌入架构(如 Monin-Obukhov 理论和 Kolmogorov 输出层),在仅含 552 个参数且资源受限的机载微控制器上实现了比传统方法更准确、可解释且高效的实时大气湍流强度估计。
本文提出了一种名为局部约束贝叶斯优化(LCBO)的新框架,通过利用约束惩罚代理的可微地形在快速局部下降与不确定性驱动的全局探索之间交替,有效解决了高维约束优化中的维度灾难问题,并在理论收敛性和实验表现上均优于现有方法。
该论文系统开发了用于机器学习原子间势的混合专家(MoE)架构,通过结合稀疏激活、共享专家及元素级路由策略,不仅显著提升了模型精度并达到基准测试的最先进水平,还揭示了专家网络能够捕捉与元素周期表趋势一致的化学特征。
本文提出了\$OneMillion-Bench,一个涵盖法律、金融、工业、医疗和自然科学五大领域的专家级基准测试,旨在通过评估语言智能体在权威信息检索、矛盾证据处理及专业规则应用等复杂场景中的表现,衡量其从聊天助手向具备专业深度与可靠性的长程智能体迈进的程度。
本文提出了通过结构化视觉验证链和反事实一致性奖励进行强化学习的 MJ1 模型,该模型仅用 30 亿参数便在 MMRB2 基准上超越了 Gemini-3-Pro 等超大模型,证明了基于视觉证据的验证机制能显著提升多模态判断能力而无需增加模型规模。
SmartThinker 提出了一种基于 GRPO 的渐进式思维链长度校准方法,通过动态估计最优长度并调节奖励系数,在显著压缩大语言模型推理长度的同时提升了复杂任务上的准确率。
该论文提出了一种名为“摊销最大内积搜索”的基于学习的方法,通过训练输入凸神经网络(SupportNet)直接建模作为支撑函数的最大内积值,或训练向量值网络(KeyNet)直接回归最优键,从而利用梯度和欧拉定理等数学特性,高效地将固定分布查询与键集的匹配成本摊销化。
该论文提出了 FedMomentum 框架,通过奇异值分解(SVD)在联邦微调中实现数学正确且保留训练动量的 LoRA 聚合,从而解决了现有方法因噪声或结构表达受限导致的收敛慢和性能差问题。