Quantum parameter estimation with uncertainty quantification from continuous measurement data using neural network ensembles
该论文表明,利用深度神经网络集成方法不仅能实现量子参数估计,还能有效量化估计不确定性并检测数据漂移,同时兼具比传统贝叶斯推断更快的推理速度,为实验场景下的实时参数估计提供了极具潜力的解决方案。
11364 篇论文
该论文表明,利用深度神经网络集成方法不仅能实现量子参数估计,还能有效量化估计不确定性并检测数据漂移,同时兼具比传统贝叶斯推断更快的推理速度,为实验场景下的实时参数估计提供了极具潜力的解决方案。
该论文提出了名为“先答后查”(Answer-Then-Check)的新型安全对齐方法,通过构建包含 8 万样本的 ReSA 数据集训练模型在生成最终回复前进行推理与安全评估,从而在显著提升抗越狱能力、降低过度拒绝率的同时,保持了模型在通用推理任务上的性能。
本文提出了 VEGA,一种结合物理信息神经算子(PINO)进行车辆参数估计与近端策略优化(PPO)进行充电感知路径规划的电动汽车导航系统,该系统在跨大陆路线上实现了比传统启发式算法快 20 倍以上的推理速度,并展现出对法国和日本路网的零样本泛化能力。
本文提出了张量原子团簇展开(TACE)方法,通过在笛卡尔空间中利用不可约笛卡尔张量分解局部环境,统一了标量与张量建模,实现了无需克莱布希 - 高登系数的频域与空域高效计算,并展示了其在分子、材料、光谱、外场响应及多保真度训练等广泛场景中的高精度、稳定性与通用性。
本文针对联邦持续学习中提示通信导致的类间知识不一致问题,提出了 C²Prompt 方法,通过引入局部类分布补偿机制和类感知提示聚合方案,有效缓解了类内分布差异与类间知识混淆,从而在多个基准测试中实现了最先进的性能。
该论文提出了一种基于自回归 U-Net 和卷积神经网络的深度学习双网络架构,用于高效预测混凝土微观结构在收缩作用下的全场损伤演化及其力学性能,从而为优化混凝土配合比设计以提升耐久性提供新途径。
本文提出了名为 GPHDM 的新方法,通过将高斯过程动力学模型扩展至双曲流形并结合分类学感知归纳偏置,实现了能够同时保留运动层级结构与时间动态、并生成物理一致轨迹的机器人拟人化运动生成。
该论文针对扩散语言模型中规划器导致的训练与推理不匹配问题,提出了理论证明并推导了新的规划证据下界(P-ELBO),进而设计了规划感知路径学习(PAPL)训练方案,通过简单修改损失函数实现了在蛋白质、文本和代码生成等多个领域的显著性能提升。
该论文提出了名为 DAV 的扩散模型对齐框架,将其形式化为交替进行测试时搜索(E 步)与模型微调(M 步)的变分期望最大化过程,从而在优化奖励的同时有效避免了奖励过拟合与模式崩溃,并成功应用于文本生成图像及 DNA 序列设计等连续与离散任务。
本文针对弗里德金 - 约翰森模型中意见内禀值未知的在线场景,提出了一种基于低秩矩阵 bandit 的两阶段算法,通过子空间估计与线性 bandit 相结合,在仅观测标量反馈的情况下有效最小化了极化与分歧,并实现了理论保证的累积遗憾界。
该论文提出了一种名为“自投机掩码扩散”的新型离散数据生成模型,通过引入因果注意力机制和模型集成的投机采样策略,实现了非因子化的联合预测,从而在文本和蛋白质序列生成任务中将所需的网络前向传播次数减少了约一半。
本文提出了一种名为 TCR-EML 的可解释模型层,通过将基于已知 TCR-pMHC 结合机制的氨基酸残基接触原型嵌入蛋白质语言模型骨干,在保持预测竞争力的同时显著提升了 TCR-pMHC 结合预测的可解释性。
该论文系统比较了仅编码器与仅解码器大语言模型在偏微分方程跨模态适应任务中的表现,发现未加改进的仅解码器模型效果远逊于仅编码器模型且无法通过单纯扩展规模提升,为此提出了“并行翻转”和“序列加倍”两种模拟双向性的新方法,成功缩小了两者性能差距并提升了所有任务的表现。
该论文通过引入元评估指标研究发现,现有的语言模型微基准测试方法在评估模型性能差异较小时(如 MMLU-Pro 上相差 3.5 个百分点)往往无法提供可靠的排序,且为了达到与随机采样相当的可靠性,通常需要多达 250 个样本,从而揭示了微基准测试在效率与可靠性之间的严峻权衡。
本文提出了 CanvasMAR,一种通过引入作为非均匀掩码的全局模糊“画布”先验、运动感知采样课程以及组合无分类器引导,从而在极少采样步数下实现高保真视频预测的自回归模型。
该论文通过理论分析与多领域实验证实,引入外部验证器(如人类或更优模型)来指导合成数据重训练,不仅能有效避免模型崩溃并带来短期性能提升,还能在长期将模型参数收敛至验证器的“知识中心”。
该论文提出了一种基于连续时间混合单调性技术的区间可达性分析方法,通过利用同胚性质和几何结构,在神经 ODE 验证中实现了计算效率与紧致性之间的有效权衡,特别适用于高维实时安全关键应用。
本文提出了一种基于改进滑动窗口汉克尔动态模态分解(Hankel-DMD)的实时在线框架,通过奇异值硬阈值去噪和结构低秩一致性投影,从部分含噪数据中构建动态障碍物的非线性预测模型,实现了稳定的方差感知去噪与短期轨迹预测,适用于机器人实时运动规划。
该论文提出了 KLASS(KL 引导自适应稳定采样)方法,通过利用令牌级 KL 散度识别高置信度预测并实现多令牌并行解掩,在无需额外训练的情况下显著加速了掩码扩散模型的推理过程,同时在文本、图像和分子生成等多个领域保持了甚至提升了生成质量。
该论文提出了一种针对分类数据聚类的簇定制自适应距离度量方法(CADM),通过根据各簇属性分布动态更新距离并扩展至混合数据,在多个数据集上取得了优异的聚类性能。