From Mice to Trains: Amortized Bayesian Inference on Graph Data
该论文提出了一种将 amortized Bayesian inference(ABI)框架适配于图数据的两阶段方法,通过结合置换不变的图编码器与灵活的后验估计网络,实现了对节点、边及图级别参数的高效、无似然贝叶斯推断,并在合成数据及生物和物流领域的真实数据上验证了其参数恢复与校准性能。
6738 篇论文
该论文提出了一种将 amortized Bayesian inference(ABI)框架适配于图数据的两阶段方法,通过结合置换不变的图编码器与灵活的后验估计网络,实现了对节点、边及图级别参数的高效、无似然贝叶斯推断,并在合成数据及生物和物流领域的真实数据上验证了其参数恢复与校准性能。
DevBench 是一个基于真实开发者遥测数据构建的代码生成基准测试,旨在通过涵盖六种语言和六类任务的 1800 个评估实例,在避免训练数据污染的同时,从功能正确性、语义推理及实际效用等多维度对大语言模型进行更具生态效度的评估与诊断。
这篇论文是首篇从组件层面系统综述大语言模型与多臂老虎机双向交互的文献,深入探讨了两者在解决各自关键挑战(如从预训练到个性化)及优化核心决策组件方面的互补优势、现有方法、性能表现及未来研究方向。
本文提出了 ELSA 框架,通过融合行为感知客户端聚类、资源自适应模型分割以及基于计算草图与语义子空间正交扰动的轻量级通信机制,有效解决了资源受限边缘网络中大规模语言模型在数据异构、设备不稳定及隐私风险下的分层联邦微调难题。
该论文提出了一种面向 FPGA 的连续流数据率感知 CNN 推理架构,通过交错低数据率信号、共享硬件单元及优化并行化策略,解决了卷积层和池化层导致的数据率下降问题,从而在实现接近 100% 硬件利用率的同时显著降低了逻辑资源消耗,使得在单块 FPGA 上部署 MobileNet 等复杂网络成为可能。
本文提出了名为 MeanCache 的训练无关缓存框架,通过利用缓存的 Jacobian-向量积构建平均速度以替代瞬时速度,并配合轨迹稳定性调度策略,在 FLUX.1、Qwen-Image 和 HunyuanVideo 等模型上实现了显著加速(最高达 4.56 倍)的同时保持了优于现有基线的生成质量。
PASS 是一种可扩展的成对约束 k-均值聚类框架,它通过将优化集中于小型工作子集并引入基于列表着色的可验证修复机制,有效解决了大规模及量子/混合场景下的约束可行性问题,在降低运行时间的同时保证了聚类质量。
该论文通过系统实证比较,表明在非线性动态系统中,无需系统方程的模型-free 神经状态估计器(特别是状态空间模型)在性能上可媲美强非线性卡尔曼滤波,同时具备更高的推理吞吐量。
TimeSliver 是一种新颖的可解释深度学习框架,它通过联合利用原始时间序列数据及其符号化抽象来构建保持时序结构的表示,从而线性编码每个时间段的贡献并赋予其有意义的评分,在显著提升时序归因解释性的同时保持了与最先进基线相当的预测性能。
该论文提出了一种名为 TGCC 的基于因果不变性的可迁移图数据集压缩方法,通过提取域不变因果特征并结合谱域增强对比学习,有效解决了现有方法在跨任务和跨域场景中泛化能力不足的问题,显著提升了压缩数据集的性能。
FlowSymm 提出了一种融合群作用、图注意力机制与隐式双层优化的新型架构,通过构建保持局部守恒律的对称性保持解空间,实现了在交通、能源和出行等网络中缺失流量的精确恢复。
本文提出了 Mem-T 自主记忆代理及其配套的 MoT-GRPO 树引导强化学习框架,通过构建记忆操作树实现稀疏奖励的稠密化与端到端优化,显著提升了长程记忆管理性能并降低了推理成本。
该论文提出将组合融合分析(CFA)应用于比特币价格预测,通过融合多个模型的评分与排名特征,显著提升了预测精度,实现了 0.19% 的 MAPE 并优于现有模型。
该论文针对现有“运行中”数据 Shapley 方法因依赖 SGD 线性假设而无法适配 Adam 优化器的局限,提出了一种名为"Adam-Aware In-Run Data Shapley"的新方法,通过引入固定状态假设下的效用重定义及线性化幽灵近似技术,在保持接近标准训练吞吐量的同时,实现了对 Adam 优化器下数据贡献的高保真度(相关系数>0.99)且可扩展的精准评估。
该研究表明,在句子级人类价值观检测任务中,施瓦茨高阶价值观结构更适合作为归纳偏置而非刚性路由规则,且通过阈值调整和集成等校准方法比层级门控或独立使用紧凑大语言模型能带来更显著的性能提升。
本文提出了名为 LatentMem 的可学习多智能体记忆框架,通过引入经验库、记忆合成器及 Latent Memory 策略优化(LMPO)技术,有效解决了现有系统中记忆同质化与信息过载问题,实现了无需修改底层框架即可显著提升多智能体系统性能的定制化记忆机制。
该论文提出了受人类学习过程启发的 T2T(由厚变薄)动态奖励框架,通过在不正确尝试时鼓励“增厚”以扩展搜索空间、在正确后转为“变薄”以抑制冗余,有效解决了强化学习中的熵崩溃与过度冗长问题,显著提升了大语言模型在数学推理任务上的性能。
该论文提出了一种无需修改模型权重或控制训练/部署基础设施的新型推理时后门攻击,通过利用大语言模型中处于用户输入与模型处理之间特权位置的恶意聊天模板,成功在多种模型和推理引擎中实现了隐蔽且高效的攻击。
本文提出了将斜向决策树分裂重构为非线性最小二乘问题的“铰链回归树”(HRT)方法,该方法通过等效于阻尼牛顿法的交替拟合过程实现快速稳定收敛,并证明了其作为通用逼近器的理论性质以及在基准测试中优于传统单树基线的性能。
该论文提出了一种名为径向 Müntz-Szász 网络(RMN)的新型神经网络架构,通过引入可学习的径向幂次基函数和极限稳定的对数原函数,有效解决了现有坐标可分离架构难以建模径向奇异场的问题,并在多项基准测试中以极少的参数量实现了远超传统 MLP 和 SIREN 的精度。