cs.DC 篇论文 | Gist.Science

Link Wars: The Semantic Crisis. Is the debate over or is it just beginning?

该论文指出当前互连技术因普遍存在的“仅向前时间”范畴错误而陷入语义危机，导致厂商特定方案碎片化，并主张通过开放原子以太网（OAE）等具备显式排序与完成语义的双边事务原语来重建正确性，从而探讨行业能否在结构性碎片化中实现统一标准。

Agentic AI-Driven UAV Network Deployment: A LLM-Enhanced Exact Potential Game Approach

本文提出了一种融合大语言模型（LLM）的代理智能驱动框架，通过结合对数线性学习与近似梯度的精确势博弈算法，在宏观链路配置与微观部署优化两个尺度上协同解决无人机网络拓扑优化中的混合整数非凸难题，从而在动态环境下显著提升网络能效、吞吐量并降低时延。

Xin Tang, Qian Chen, Binhan Liao, Yaqi Zhang, Jianxin Chen, Changyuan Zhao, Junchuan Fan, Junxi Tian, Xiaohuan LiTue, 10 Ma💻 cs

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

本文提出了 MAS-H2，一种基于分层多智能体系统的云原生自动扩缩容方案，它通过将业务策略转化为全局效用函数并实施端到端的预测性规划与执行，有效解决了传统方案中策略与资源脱节的问题，在降低 CPU 负载峰值、应对突发流量及实现零停机战略迁移方面显著优于原生 Kubernetes 自动扩缩容机制。

Hamed Hamzeh, Parisa VahdatianTue, 10 Ma🤖 cs.LG

Performance Evaluation of Automated Multi-Service Deployment in Edge-Cloud Environments with the CODECO Toolkit

本文评估了开源框架 CODECO 在异构边缘云环境中自动化部署多服务应用的能力，实验表明其相较于基础 Kubernetes 工作流能显著减少人工干预，同时保持具有竞争力的运行时性能与资源利用率。

Georgios Koukis, Ioannis Dermentzis, Vassilis Tsaoussidis, Jan Lenke, Fabian Wolk, Daniel Uceda, Guillermo Sanchez, Miguel A. Puentes, Javier Serrano, Panagiotis Karamolegkos, Rute C. SofiaTue, 10 Ma💻 cs

Mitigating the Memory Bottleneck with Machine Learning-Driven and Data-Aware Microarchitectural Techniques

该论文针对现代计算系统中日益严重的内存瓶颈问题，主张将微架构设计从数据无关转向数据驱动和数据感知，通过提出四种结合轻量级机器学习与数据语义特征的机制（如强化学习预取器和感知器预测器），显著提升了系统的性能与能效。

Rahul BeraTue, 10 Ma🤖 cs.LG

Scalable Training of Mixture-of-Experts Models with Megatron Core

本文介绍了 Megatron Core 中针对混合专家（MoE）模型可扩展训练的系统级协同优化方案，通过整合内存、通信和计算层面的多项创新技术，在 NVIDIA GB300/GB200 集群上实现了 DeepSeek-V3 和 Qwen3 等超大规模模型的高效、生产就绪型训练。

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)Tue, 10 Ma🤖 cs.LG

Structured Gossip: A Partition-Resilient DNS for Internet-Scale Dynamic Networks

本文提出了一种名为“结构化 gossip"的 DNS 方案，通过利用 DHT 手指表实现被动稳定化，在无需全局协调的情况下，将消息复杂度从 $O(n)$ 降低至 $O(n/\log n)$ ，从而有效解决了移动自组织网络和边缘计算中网络分区带来的分布式名称解析挑战。

Priyanka Sinha, Dilys ThomasTue, 10 Ma💻 cs

ArcLight: A Lightweight LLM Inference Architecture for Many-Core CPUs

ArcLight 是一种专为多核 CPU 设计的轻量级大语言模型推理架构，通过集成高效的内存管理、线程调度及细粒度张量并行技术，有效解决了跨 NUMA 节点内存访问开销问题，从而显著提升了推理吞吐量。

Yuzhuang Xu, Xu Han, Yuxuan Li, Wanxiang CheTue, 10 Ma💬 cs.CL

A Lock-Free, Fully GPU-Resident Architecture for the Verification of Goldbach's Conjecture

本文提出了一种完全驻留 GPU 的无锁多 GPU 架构，通过将段生成流水线迁移至设备端并引入异步工作窃取机制，消除了主机通信瓶颈，在 RTX 5090 等硬件上实现了高达 45.6 倍的加速，仅需 36.5 秒即可验证哥德巴赫猜想至 $10^{12}$。

Isaac Llorente-SaguerTue, 10 Ma🔢 math

The Consistency Correctness in CoPPar Tree

本文是 CoPPar 树论文的补充文档，旨在提供该架构正确性的详细证明。

Xincheng Yang, Kyle HaleTue, 10 Ma💻 cs

SageSched: Efficient LLM Scheduling Confronting Demand Uncertainty and Hybridity

SageSched 是一种高效的 LLM 调度器，它通过结合提示内容与历史结果来预测输出长度分布，并综合考虑计算与内存成本，利用不确定性感知策略在需求不确定和混合负载场景下实现了超过 28.7% 的效率提升。

Zhenghao Gan, Yichen Bao, Yifei Liu, Chen Chen, Quan Chen, Minyi GuoTue, 10 Ma💻 cs

RAPID: Redundancy-Aware and Compatibility-Optimal Edge-Cloud Partitioned Inference for Diverse VLA models

针对现有边缘云协同推理框架在处理视觉语言动作（VLA）模型时易受视觉噪声干扰且忽视任务冗余导致运动不连续的问题，本文提出了名为 RAPID 的新框架，通过冗余感知与兼容性优化实现了最高 1.73 倍的推理加速，同时仅引入 5%~7% 的额外开销。

Zihao Zheng, Sicheng Tian, Hangyu Cao, Chenyue Li, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Guojie Luo, Xiang ChenTue, 10 Ma💻 cs

ZK-ACE: Identity-Centric Zero-Knowledge Authorization for Post-Quantum Blockchain Systems

本文提出了 ZK-ACE，一种面向后量子区块链的身份中心零知识授权层，它通过用身份绑定的零知识授权陈述完全取代交易中的签名对象，在保障安全性的同时实现了共识可见授权数据量数量级的降低。

Jian Sheng WangTue, 10 Ma💻 cs

ACE-GF-based Attestation Relay for PQC - Lightweight Mempool Propagation Without On-Path Proofs

该论文提出了一种名为 AR-ACE 的轻量级传播协议，通过在中继节点仅转发对象与紧凑证明（而非完整有效性证明），并将最终验证工作移至构建者端，从而在后量子区块链环境中消除了传播路径上的证明开销，实现了比递归 STARK 方案低一个数量级的带宽消耗。

Jian Sheng WangTue, 10 Ma💻 cs

SI-ChainFL: Shapley-Incentivized Secure Federated Learning for High-Speed Rail Data Sharing

本文提出了 SI-ChainFL 框架，通过结合考虑稀有事件效用、数据多样性、质量及时效性的夏普利值激励机制与基于区块链的去中心化聚合协议，有效解决了高铁数据共享中联邦学习面临的激励不足和单点故障问题，在抵御恶意攻击的同时显著提升了模型聚合的准确性与安全性。

Mingjie Zhao, Cheng Dai, Fei Chen, Xin Chen, Kaoru Ota, Mianxiong Dong, Bing GuoTue, 10 Ma💻 cs

SafarDB: FPGA-Accelerated Distributed Transactions via Replicated Data Types

本文提出了 SafarDB，一种通过将 FPGA 加速器卡直接连接至网络并协同设计网络附加复制引擎与 FPGA 驻留网络接口，从而实现冲突自由复制数据类型（CRDTs）和协调复制数据类型（WRDTs）的 FPGA 加速分布式事务系统，该系统在延迟、吞吐量及故障恢复能力上均显著优于现有的基于 RDMA 的实现方案。

Javad Saberlatibari, Prithviraj Yuvaraj, Mohsen Lesani, Philip Brisk, Mohammad SadoghiTue, 10 Ma💻 cs

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

该论文介绍了 Covenant-72B，这是首个利用区块链协议实现完全开放、无需许可的参与，并通过高效稀疏优化器 SparseLoCo 在动态变化的全球分布式网络中成功预训练的 720 亿参数大语言模型，证明了在大规模去中心化场景下训练出具有竞争力的基础模型是可行的。

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel DareTue, 10 Ma🤖 cs.LG

A Hodge-Based Framework for Service Operational Analysis in Serverless Platforms

本文提出了一种基于霍奇分解的框架，通过将无服务器平台中的服务运行流分解为局部可修正分量与全局持久谐波模式，揭示了谐波流作为系统结构性特征的本质，并提供了识别潜在架构低效及制定针对性修复策略的系统化方法。

Gianluca Reali, Mauro FemminellaTue, 10 Ma💻 cs

TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction

本文提出了一种名为 TA-RNN-Medical-Hybrid 的时间感知与可解释混合深度学习框架，通过整合显式连续时间编码、SNOMED 疾病表示及分层注意力机制，在 MIMIC-III 数据集上实现了对 ICU 患者死亡风险的高精度预测与符合医学知识的有效解释。

Zahra Jafari, Azadeh Zamanifar, Amirfarhad FarhadiTue, 10 Ma🤖 cs.LG

A Blockchain-based Traceability System for AI-Driven Engine Blade Inspection

本文提出了名为 BladeChain 的基于区块链的系统，通过整合多方共识、自动调度、AI 模型溯源及加密证据绑定，解决了航空发动机叶片维护记录碎片化与易篡改问题，实现了全生命周期不可篡改的可追溯审计。

Mahmoud Hafez, Eman Ouda, Mohammed A. Mohammed Eltoum, Khaled Salah, Yusra AbdulrahmanTue, 10 Ma💻 cs