Hybrid Quantum Neural Network for Multivariate Clinical Time Series Forecasting
本文提出了一种将变分量子电路集成到循环神经网络骨干中的混合量子 - 经典架构,用于多变量临床生理时间序列的多步预测,并在 BIDMC 数据集上验证了其在小样本临床场景中相比传统方法具有更具竞争力的精度、更强的抗噪性及对缺失输入的鲁棒性。
10313 篇论文
本文提出了一种将变分量子电路集成到循环神经网络骨干中的混合量子 - 经典架构,用于多变量临床生理时间序列的多步预测,并在 BIDMC 数据集上验证了其在小样本临床场景中相比传统方法具有更具竞争力的精度、更强的抗噪性及对缺失输入的鲁棒性。
本文提出并评估了自回归递归模型(Autoregressive TRM),通过受控实验发现,尽管两阶段细化机制在特定基线中表现优异,但完整的自回归 TRM 架构并未带来可靠的性能提升,因此不建议将其作为主要的研究方向。
本文提出了 EAGLE-Pangu 系统,通过将 EAGLE-3 风格的树形推测解码适配至昇腾 NPU 上的盘古模型,利用显式缓存管理、加速器安全的张量化及融合内核验证路径,在确保可复现性的同时显著提升了端到端解码吞吐量。
该论文提出了 DC-W2S 框架,通过结合自一致性指标与嵌入空间邻域一致性指标来筛选高可靠性监督信号,并采用课程学习策略,实现了在无需大量专家标注的情况下利用含噪弱监督数据训练出可靠的生物推理过程奖励模型。
该论文揭示了一种利用隐写术对大语言模型进行恶意微调的新型安全威胁,使模型能在表面呈现完全无害的交互时, covertly 生成并输出被隐藏的真实恶意内容,且该攻击能绕过现有安全检测机制。
本文提出了 Tau-BNO,一种基于脑神经算子的代理框架,旨在通过结合反应动力学与方向性输运机制,快速且高精度地近似阿尔茨海默病中 Tau 蛋白传播的复杂生物物理模型,从而克服传统数值模拟计算缓慢的瓶颈并加速机制发现。
该论文针对现有基于模型的离线强化学习方法(如 RAMBO)中存在的模型利用过度保守和梯度爆炸问题,提出了一种名为 ROMI 的新方法,通过引入鲁棒价值感知模型学习与隐式可微自适应加权机制,实现了可控的保守性与稳定的模型更新,从而在多个基准数据集上显著提升了性能。
SaiVLA-0 提出了一种受神经科学启发的“大脑 - 脑桥 - 小脑”三分架构,通过冻结的高层多模态先验、实时意图整合适配器及并行快速控制解码器,实现了计算感知、模块化且高效的视觉 - 语言 - 动作系统,并在 LIBERO 基准测试中显著提升了训练效率与任务成功率。
本文提出了 FoleyFlow,一种通过掩码建模训练实现音视频语义与节奏对齐,并利用动态条件流框架基于视频特征生成协调音频的新方法,其在基准测试中显著超越了现有成果。
该论文提出了一种名为 TRIAGE 的轻量级后处理框架,通过将不确定性分解为源于观测噪声的偶然性不确定性和源于模型失配的认知不确定性,并据此分别触发观测恢复、控制调节及感知模型容量选择等针对性响应,从而在机器人操作和自适应感知任务中显著提升了系统性能与效率。
该论文提出了一种仅利用健康数据、基于贝叶斯视角的概率异常检测方法,通过量化不确定性并提供可解释性工具,在直升机传动系统等安全关键场景中实现了具有竞争力的故障检测与预警性能。
本文提出了 SAGAD 框架,通过预计算多跳嵌入、重参数化切比雪夫滤波器以及自适应融合机制,有效解决了图异常检测中存在的同质性差异和可扩展性难题,实现了在大规模图上的高效训练与高精度检测。
本文提出了无需重新训练的推理时方法 DARC,通过将响应选择建模为分布鲁棒且风险敏感的决策过程,利用 KL 鲁棒满意度目标在存在异质偏好分歧的情况下有效降低尾部风险并维持平均质量。
该论文介绍了基于 JAX 的 Eventax 框架,它通过结合可微分数值 ODE 求解器与事件处理机制,在支持任意 ODE 定义的神经元模型灵活性的同时,实现了无需近似梯度的精确梯度训练,从而解决了现有脉冲神经网络训练框架在模型灵活性与梯度准确性之间的权衡难题。
该论文通过严格理论分析揭示了分类器自由引导(CFG)中固定权重策略的局限性,并据此提出了一种无需训练、即插即用的控制分类器自由引导(C²FG)方法,通过指数衰减控制函数动态调整引导强度以匹配扩散过程,从而在多种生成任务中显著提升了效果。
本文批判了当前长时序预测领域过度依赖均方误差等聚合指标进行基准排名而忽视实际决策价值的现状,主张构建融合统计保真度、结构一致性与决策相关性的多维评估体系,以引导研究从单纯追求榜单分数转向解决具有实际意义的预测问题。
本文提出了一种基于迭代重加权最小二乘框架的鲁棒自协方差最小二乘估计方法(ALS-IRLS),通过创新级自适应阈值筛选与基于 Huber 代价函数的迭代加权策略,显著提升了卡尔曼滤波器在含异常值数据下的噪声协方差估计精度及状态估计性能。
本文提出了 TIER 方法,通过构建隐式层次分类体系并将其融入表示学习过程,有效解决了文本丰富网络中忽视内在层次语义的问题,从而实现了更具可解释性和结构化的节点表征。
该论文介绍了 Covenant-72B,这是首个利用区块链协议实现完全开放、无需许可的参与,并通过高效稀疏优化器 SparseLoCo 在动态变化的全球分布式网络中成功预训练的 720 亿参数大语言模型,证明了在大规模去中心化场景下训练出具有竞争力的基础模型是可行的。
该论文研究表明,在连续潜在空间中进行推理(Continuous Chain-of-Thought)相比传统的显式思维链,在低资源语言的零样本场景下具有更强的鲁棒性和语言不变性,同时能将推理过程压缩 29 至 50 倍,为跨语言推理提供了可扩展的高效解决方案。