Jordan-RoPE: Non-Semisimple Relative Positional Encoding via Complex Jordan Blocks
本文介绍了 Jordan-RoPE,这是一种非半单相对位置编码,它利用复若尔当块生成振荡多项式特征以建模距离调制的相位交互,并在某些情境下展现出相较于标准 RoPE 和 ALiBi 基线的结构优势及具体性能提升。
原作者已查阅我们通俗解释的论文。
本页收录的每篇论文,都有至少一位原作者阅读并参与了我们的通俗解释——或是确认其准确无误,或是提出修正意见并由我们随后采纳。作者的确认并不等同于对每一句话的正式背书,但说明该解释已经过论文作者的审视。
607 篇论文已由作者审阅 · 391–400 / 607
本文介绍了 Jordan-RoPE,这是一种非半单相对位置编码,它利用复若尔当块生成振荡多项式特征以建模距离调制的相位交互,并在某些情境下展现出相较于标准 RoPE 和 ALiBi 基线的结构优势及具体性能提升。
本文利用无限 型高斯轨道推导出布洛赫态贝里相位的解析表达式,以建立扎克相位本征值与模对称性之间的对应关系,从而实现对如空间群 等非中心对称晶体材料中拓扑性质的识别。
本文通过显式建模张量运算,提出了一种用于分析和构建深度神经网络的统一理论框架,揭示了架构复杂度与突破性进展之间的历史关联,同时识别并发布了一个包含 3000 多种未探索的高复杂度架构的数据集。
本文通过用相型分布近似停留时间以实现灵活的似然计算,为间歇性观测数据引入了一种实用的半马尔可夫建模框架,并提供了一个新的 R 包"msmbayes",通过贝叶斯或最大似然估计来实现该方法。
本文提出了一种自洽的准线性理论,证明非热幂律分布与太阳日冕的温度反转是相互关联的现象,它们源于电磁驱动的粒子加速和德拜屏蔽,这些机制在多组分动力学等离子体中自然产生普遍的高能尾部以及由速度过滤驱动的加热效应。
本文揭示,对 Llama-3.2 模型中 GLU-MLP 层进行结构化宽度剪枝会形成一种独特的权衡:降低扩展比虽会削弱参数化知识并提升能效,却悖论式地增强了指令遵循能力和真实性,同时保留了多步推理能力。
本文提出了一种新颖的自动化安全设计方法,该方法利用基于多维核的表示从收集的数据中推导出运行设计域(ODD),从而解决安全关键人工智能系统的认证挑战,其有效性已通过蒙特卡洛模拟和真实世界的航空防撞用例得到验证。
本文建立了具有异质节点动力学的空间离散连续时间反应扩散系统局部渐近稳定性的一个简单充分条件,证明即使在没有扩散损耗且无需各斑块动力学相同的情况下,稳定性也可由空间平均雅可比矩阵的对角占优性以及网络代数连通性的下界来保证。
本文表明,超相对论性冻结(UFO)暗物质候选者,尤其是那些通过门户介导的候选者,代表了传统弱相互作用大质量粒子(WIMPs)的一种可行且可探测的替代方案,当前实验如 LZ 和 XENONnT 已对其参数空间施加了约束,而未来的探测器如 SuperCDMS SNOLAB 则有望探索 0.5–10 GeV 质量范围内的显著区域。
本文提出并模拟了一种新颖的气体动力学离子束提取与聚束技术,作为FAIR低温停止腔中射频四极杆的更优替代方案,证明了其在宽质量范围内实现100%离子传输和创纪录发射度值的潜力。