Diffusion Language Models Are Natively Length-Aware
该论文提出了一种利用潜在提示表示零样本动态裁剪扩散语言模型上下文窗口的机制,从而在保持或提升性能的同时显著减少了推理所需的计算量。
11557 篇论文
该论文提出了一种利用潜在提示表示零样本动态裁剪扩散语言模型上下文窗口的机制,从而在保持或提升性能的同时显著减少了推理所需的计算量。
该论文针对现有时间序列异常检测评估指标在点级覆盖偏差、近漏报不敏感、误报惩罚不足及阈值依赖等方面存在的局限性,提出了一种基于检测语义的分区策略与全阈值谱聚合方法,构建了名为 DQE 的新型评估指标,以实现更稳定、判别力强且可解释的综合评估。
该论文提出了一种名为“部分策略梯度”的新方法,通过优化未来奖励的子集来构建不同复杂度的策略类(如贪婪、K 步前瞻等),从而在 Persona 对齐对话任务中实现更可靠的梯度估计与更优的策略选择。
该论文证明了预测编码图(PCGs)在数学上是前馈人工神经网络(多层感知机)的超集,从而将预测编码网络更紧密地融入现代机器学习框架,并强化了对神经网络拓扑结构的研究。
该研究提出了一种基于输入扰动(如分形 Perlin 噪声)的集成图神经网络方法,用于在无需额外训练成本的情况下,显著提升区域海温概率预报的校准度与不确定性表征能力。
本文提出了 OMEGA,一种仅需在 K=1 上训练即可通过动态细化机制高效处理多 K 值向量搜索的通用模型,在显著降低预处理成本的同时实现了比现有最先进方法更低的延迟和同等召回率。
该论文提出了一种两阶段框架,通过先在标注的人造字母表上训练对比学习教师模型,再利用蒸馏技术引导学生在无监督条件下学习历史文字系统的变形不变嵌入,从而在无需确切演化关系真值的情况下实现脚本相似性学习与聚类。
该论文提出了随机二次型(RQF)模型,通过研究其随机微分方程的不变测度和随机吸引子,揭示了在缺乏自注意力机制的情况下,由共同噪声驱动的深度 Transformer 中令牌仍能产生聚类同步行为的机理。
该研究通过引入拓扑数据分析(TDA)提取步态中足部 clearance 的非线性结构特征,并结合随机森林分类器,显著提升了帕金森综合征(特别是特发性帕金森病与血管性帕金森病)的鉴别诊断准确率。
本文提出了一种名为 FedSCS-XGB 的联邦服务器中心代理 XGBoost 协议,用于基于可穿戴传感器数据的脊柱损伤患者持续健康监测,该协议在保持 XGBoost 核心结构优势的同时实现了分布式训练,其性能在理论分析和实证评估中均能接近集中式训练结果(差距小于 1%)。
本文提出了 DC-Merge 方法,通过平滑奇异值以平衡任务向量的能量分布,并将其投影至共享正交子空间以校正方向几何不一致性,从而在模型合并中有效保留多任务知识,在视觉及视觉语言基准测试中实现了全微调与 LoRA 设置下的最先进性能。
该论文通过解析基于 softmax 的梯度流动力学,揭示了优化过程会内在驱动模型输出趋向低熵解,从而为 Transformer 中注意力集中和巨大激活等实证现象提供了理论解释。
本文提出了一种名为 SPPCSO 的自适应惩罚估计方法,通过结合单参数主成分回归与正则化,有效解决了高维相关数据中的多重共线性问题,在实现变量选择一致性的同时显著提升了模型在强噪声环境下的稳定性与预测精度。
该论文提出了合成监控环境(SMEs),这是一个具有无限连续控制任务、已知最优策略及可精确计算即时后悔值的标准化测试框架,旨在通过解耦环境复杂性因素,将强化学习评估从经验性基准测试转变为严谨的科学分析。
本文提出了一种基于有界非对称弹性网损失函数的鲁棒支持向量机(BAEN-SVM),通过理论证明其几何合理性、噪声鲁棒性及泛化能力,并设计了高效的半二次优化算法,实验表明该方法在含噪数据下的分类性能优于传统及先进的 SVM 模型。
本文提出了一种名为 DeCoST 的两阶段学习框架,通过解耦离散路径选择与连续服务时间分配,在求解带时间窗和可变利润的定向问题(OPTWVP)时,显著提升了求解质量与推理效率。
该研究通过评估 34 个大语言模型在放射学问答任务中的表现,发现引入基于检索的代理推理机制能显著降低模型间的决策离散度并增强跨模型的正确性鲁棒性,表明评估此类系统时不能仅依赖准确率或一致性,还需结合稳定性与潜在临床影响进行综合分析。
本文介绍了一种基于朗之万动力学以避免过拟合的神经网络实现,该网络通过接受多个模糊认知图作为输入来学习因果模式并反演输出节点值,从而提供修改准则以优化决策,并在多个数据集上评估了其性能。
本文提出了名为 Stem 的新型即插即用稀疏模块,通过结合位置衰减策略和输出感知度量来重新思考因果信息流,从而在降低计算复杂度和预填充延迟的同时,显著提升了长上下文大语言模型的准确性。
本文提出了一种名为 GMM-PIELM 的概率自适应采样框架,通过利用加权期望最大化算法学习物理分布以动态调整 PIELM 的核函数中心,从而在无需昂贵梯度优化的情况下,显著提升了刚性偏微分方程(如具有激波和边界层的对流扩散方程)的求解精度与效率。