Link Wars: The Semantic Crisis. Is the debate over or is it just beginning?
该论文指出当前互连技术因普遍存在的“仅向前时间”范畴错误而陷入语义危机,导致厂商特定方案碎片化,并主张通过开放原子以太网(OAE)等具备显式排序与完成语义的双边事务原语来重建正确性,从而探讨行业能否在结构性碎片化中实现统一标准。
133 篇论文
该论文指出当前互连技术因普遍存在的“仅向前时间”范畴错误而陷入语义危机,导致厂商特定方案碎片化,并主张通过开放原子以太网(OAE)等具备显式排序与完成语义的双边事务原语来重建正确性,从而探讨行业能否在结构性碎片化中实现统一标准。
本文提出了一种融合大语言模型(LLM)的代理智能驱动框架,通过结合对数线性学习与近似梯度的精确势博弈算法,在宏观链路配置与微观部署优化两个尺度上协同解决无人机网络拓扑优化中的混合整数非凸难题,从而在动态环境下显著提升网络能效、吞吐量并降低时延。
本文提出了 MAS-H2,一种基于分层多智能体系统的云原生自动扩缩容方案,它通过将业务策略转化为全局效用函数并实施端到端的预测性规划与执行,有效解决了传统方案中策略与资源脱节的问题,在降低 CPU 负载峰值、应对突发流量及实现零停机战略迁移方面显著优于原生 Kubernetes 自动扩缩容机制。
本文评估了开源框架 CODECO 在异构边缘云环境中自动化部署多服务应用的能力,实验表明其相较于基础 Kubernetes 工作流能显著减少人工干预,同时保持具有竞争力的运行时性能与资源利用率。
该论文针对现代计算系统中日益严重的内存瓶颈问题,主张将微架构设计从数据无关转向数据驱动和数据感知,通过提出四种结合轻量级机器学习与数据语义特征的机制(如强化学习预取器和感知器预测器),显著提升了系统的性能与能效。
本文介绍了 Megatron Core 中针对混合专家(MoE)模型可扩展训练的系统级协同优化方案,通过整合内存、通信和计算层面的多项创新技术,在 NVIDIA GB300/GB200 集群上实现了 DeepSeek-V3 和 Qwen3 等超大规模模型的高效、生产就绪型训练。
本文提出了一种名为“结构化 gossip"的 DNS 方案,通过利用 DHT 手指表实现被动稳定化,在无需全局协调的情况下,将消息复杂度从降低至,从而有效解决了移动自组织网络和边缘计算中网络分区带来的分布式名称解析挑战。
ArcLight 是一种专为多核 CPU 设计的轻量级大语言模型推理架构,通过集成高效的内存管理、线程调度及细粒度张量并行技术,有效解决了跨 NUMA 节点内存访问开销问题,从而显著提升了推理吞吐量。
本文提出了一种完全驻留 GPU 的无锁多 GPU 架构,通过将段生成流水线迁移至设备端并引入异步工作窃取机制,消除了主机通信瓶颈,在 RTX 5090 等硬件上实现了高达 45.6 倍的加速,仅需 36.5 秒即可验证哥德巴赫猜想至 $10^{12}$。
本文是 CoPPar 树论文的补充文档,旨在提供该架构正确性的详细证明。
SageSched 是一种高效的 LLM 调度器,它通过结合提示内容与历史结果来预测输出长度分布,并综合考虑计算与内存成本,利用不确定性感知策略在需求不确定和混合负载场景下实现了超过 28.7% 的效率提升。
针对现有边缘云协同推理框架在处理视觉语言动作(VLA)模型时易受视觉噪声干扰且忽视任务冗余导致运动不连续的问题,本文提出了名为 RAPID 的新框架,通过冗余感知与兼容性优化实现了最高 1.73 倍的推理加速,同时仅引入 5%~7% 的额外开销。
本文提出了 ZK-ACE,一种面向后量子区块链的身份中心零知识授权层,它通过用身份绑定的零知识授权陈述完全取代交易中的签名对象,在保障安全性的同时实现了共识可见授权数据量数量级的降低。
该论文提出了一种名为 AR-ACE 的轻量级传播协议,通过在中继节点仅转发对象与紧凑证明(而非完整有效性证明),并将最终验证工作移至构建者端,从而在后量子区块链环境中消除了传播路径上的证明开销,实现了比递归 STARK 方案低一个数量级的带宽消耗。
本文提出了 SI-ChainFL 框架,通过结合考虑稀有事件效用、数据多样性、质量及时效性的夏普利值激励机制与基于区块链的去中心化聚合协议,有效解决了高铁数据共享中联邦学习面临的激励不足和单点故障问题,在抵御恶意攻击的同时显著提升了模型聚合的准确性与安全性。
本文提出了 SafarDB,一种通过将 FPGA 加速器卡直接连接至网络并协同设计网络附加复制引擎与 FPGA 驻留网络接口,从而实现冲突自由复制数据类型(CRDTs)和协调复制数据类型(WRDTs)的 FPGA 加速分布式事务系统,该系统在延迟、吞吐量及故障恢复能力上均显著优于现有的基于 RDMA 的实现方案。
该论文介绍了 Covenant-72B,这是首个利用区块链协议实现完全开放、无需许可的参与,并通过高效稀疏优化器 SparseLoCo 在动态变化的全球分布式网络中成功预训练的 720 亿参数大语言模型,证明了在大规模去中心化场景下训练出具有竞争力的基础模型是可行的。
本文提出了一种基于霍奇分解的框架,通过将无服务器平台中的服务运行流分解为局部可修正分量与全局持久谐波模式,揭示了谐波流作为系统结构性特征的本质,并提供了识别潜在架构低效及制定针对性修复策略的系统化方法。
本文提出了一种名为 TA-RNN-Medical-Hybrid 的时间感知与可解释混合深度学习框架,通过整合显式连续时间编码、SNOMED 疾病表示及分层注意力机制,在 MIMIC-III 数据集上实现了对 ICU 患者死亡风险的高精度预测与符合医学知识的有效解释。
本文提出了名为 BladeChain 的基于区块链的系统,通过整合多方共识、自动调度、AI 模型溯源及加密证据绑定,解决了航空发动机叶片维护记录碎片化与易篡改问题,实现了全生命周期不可篡改的可追溯审计。