An AI-powered Bayesian Generative Modeling Approach for Arbitrary Conditional Inference
该论文提出了一种名为贝叶斯生成建模(BGM)的统一框架,通过随机迭代贝叶斯更新算法学习生成模型,从而无需重新训练即可实现对任意变量子集的灵活条件推断,并兼具优越的预测性能、不确定性量化能力及理论保证。
2227 篇论文
该论文提出了一种名为贝叶斯生成建模(BGM)的统一框架,通过随机迭代贝叶斯更新算法学习生成模型,从而无需重新训练即可实现对任意变量子集的灵活条件推断,并兼具优越的预测性能、不确定性量化能力及理论保证。
该论文针对卫星巨型星座时代的需求,提出了对齐底层能力原则并开源了名为 SpaceHMchat 的人机协作全闭环航天器电源系统健康管理框架,通过构建硬件级故障注入实验平台及发布首个相关数据集,验证了其在工况识别、异常检测、故障定位及维护决策等任务中的卓越性能。
本文提出了 CLEAR-Mamba 框架,通过引入基于超网络的自适应条件层(HaC)和基于证据不确定性学习的不确定性感知预测方案(RaP),并结合构建的大规模多模态眼底血管造影数据集,显著提升了眼科血管造影图像分类的跨域适应性、准确性及预测可靠性。
该论文提出了一种利用大语言模型驱动的网络研究代理自动生成并解决大规模多样化现实世界预测问题的系统,该系统在生成可验证问题和准确解决方面的表现优于人类策划平台,并成功验证了更智能的模型及问题分解策略能显著提升预测精度。
该论文提出了一种名为 EigenData 的统一框架,通过结合自进化合成数据引擎与基于验证器的强化学习(RL),有效解决了多轮交互式工具使用智能体在数据合成扩展性及训练信号噪声方面的挑战,并在 tau^2-bench 基准测试中取得了媲美或超越前沿模型的性能。
本文提出了 UAT-LITE,一种无需重新训练即可在推理阶段通过蒙特卡洛 Dropout 将自注意力机制不确定性化的框架,通过引入层间方差分解诊断不确定性累积,显著提升了预训练 Transformer 在分布偏移下的校准性能与选择性预测能力。
该论文提出了 WebAccessVL,一种结合违规检测信息的视觉语言模型,通过监督式图像条件程序合成任务,在保持网页原始视觉设计的同时,自动修复 HTML 代码以显著降低 WCAG2 无障碍违规数量。
该论文指出,用户对聊天机器人的信任往往源于利用认知偏差的交互设计而非真正的可信度,因此建议将聊天机器人重新定义为组织目标导向的“高技能销售人员”,以区分心理信任形成与规范性可信度之间的关键差异。
该论文针对现有单目法线估计方法存在的 3D 几何错位问题,提出了一种名为 RoSE 的新范式,通过将法线估计重构为对几何信息更敏感的“阴影序列估计”,利用图像到视频生成模型预测阴影序列并求解最小二乘问题,从而在真实世界基准测试中实现了最先进的性能。
该论文提出了名为"Infusion"的框架,利用可扩展的影响函数近似技术,通过对训练数据施加微小扰动来诱导模型产生目标行为,实验表明该方法在视觉和语言领域均能有效且隐蔽地塑造模型行为,并具备跨架构的迁移能力。
该论文提出了一种面向神经形态视觉的持续学习框架,通过整合经验回放、可学习神经元参数及自适应脉冲调度机制,在满足能量约束的同时有效缓解了灾难性遗忘,并在帧基与事件基数据集上分别实现了精度提升与能耗降低的双重优化。
受非平衡热力学启发的扩散模型虽性能卓越但推理延迟高,而现有蒸馏技术因丢弃中间步骤导致结构信息丢失和离散化误差,为此本文提出了 B-DENSE 框架,通过多分支轨迹对齐机制,让学生模型在扩展通道中同时映射教师轨迹的所有离散中间步骤,从而在训练早期实现密集监督并显著提升生成质量。
该论文通过信息论证明,在复用单一本体状态空间的经典模型中,语境性必然导致不可消除的信息成本,而量子理论通过放弃所有测量统计源于单一经典本体变量的假设成功规避了这一限制。
该研究提出了一种基于课程学习的持续不确定性学习框架,通过将多源不确定性分解为序列任务并结合模型基控制器进行残差学习,有效解决了非线性机械系统鲁棒控制中的样本效率低与灾难性遗忘问题,并成功实现了汽车动力总成主动振动控制的仿真到现实迁移。
本文提出了一种名为 ReDON 的新型架构,通过引入可重构的自调制非线性机制,克服了传统衍射光学神经网络缺乏高效非线性响应和可重编程性的局限,在几乎不增加功耗的情况下显著提升了图像识别与分割任务的准确率。
该论文提出了耦合离散扩散(CoDD)框架,通过引入轻量级概率推理层替代传统的完全因子化输出分布,成功打破了扩散语言模型中并行生成与依赖建模之间的“因子化壁垒”,在显著降低训练成本的同时实现了高质量、低延迟的推理生成。
本文提出了 OrthoAI 框架,通过结合稀疏监督的 3D 牙齿分割、基于本体约束的可行性推理以及多标准治疗评估,实现了在清矫正畸中从几何感知到临床推理的证据驱动型自动化决策支持。
本文提出了一种基于 Grounding DINO 1.5、YOLOv11 和 SAM 2.1 的双流水线框架,通过零-shot 文本提示或轻量级监督微调实现鸟类图像分割,在 CUB-200-2011 数据集上显著超越了传统端到端模型,证明了提示驱动的基础模型在无需重新训练分割主干的情况下即可实现高精度分割。
Pri4R 提出了一种简单有效的训练方法,通过利用特权 4D 信息(3D 点轨迹预测)作为辅助任务,使视觉 - 语言 - 动作(VLA)模型在无需增加推理开销的情况下,隐式地习得世界动力学规律,从而显著提升了其在复杂操作任务中的物理感知与控制能力。
该论文提出了名为 Gome 的 MLE 智能体,通过将诊断推理映射为梯度计算等机制实现基于梯度的优化,实验表明在推理能力较强的模型上,该方法在 MLE-Bench 基准测试中显著超越了传统的树搜索范式。