Link Wars: The Semantic Crisis. Is the debate over or is it just beginning?

本論文は、NVLink や RDMA などの現代の相互接続技術が「時間・順序・信頼」に関する暗黙の前提に依存する「意味論的危機」に陥っていると指摘し、Open Atomic Ethernet (OAE) のような明示的なトランザクション原語による標準化が、分散システムにおける一貫性とスケーラビリティを両立させる鍵であると論じています。

Paul BorrillTue, 10 Ma💻 cs

Agentic AI-Driven UAV Network Deployment: A LLM-Enhanced Exact Potential Game Approach

本論文は、大規模空間スケールでのリンク構成最適化と小規模スケールでの展開・電力配分最適化をそれぞれ対数線形学習および近似勾配に基づく厳密ポテンシャルゲームで処理し、大規模言語モデル(LLM)を用いてユーティリティ重みを自動生成するアジェンティック AI 駆動の UAV ネットワーク展開フレームワークを提案し、エネルギー消費、遅延、スループットにおいて既存手法を上回る性能を実証したものである。

Xin Tang, Qian Chen, Binhan Liao, Yaqi Zhang, Jianxin Chen, Changyuan Zhao, Junchuan Fan, Junxi Tian, Xiaohuan LiTue, 10 Ma💻 cs

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

本論文は、Kubernetes 環境におけるビジネスポリシーとリソースプロビジョニングの乖離による課題を解決するため、戦略・計画・実行の 3 層構造を持つ階層型マルチエージェントシステム「MAS-H2」を提案し、その実証実験において従来の自動スケーリング手法と比較してリソース効率の大幅な向上とゼロダウンタイム移行を実現したことを報告しています。

Hamed Hamzeh, Parisa VahdatianTue, 10 Ma🤖 cs.LG

Performance Evaluation of Automated Multi-Service Deployment in Edge-Cloud Environments with the CODECO Toolkit

この論文は、エッジ・クラウド環境におけるコンテナオーケストレーションを強化するオープンソースフレームワーク「CODECO」を評価し、Kubernetes ベースのワークフローと比較して、人的介入を大幅に削減しつつ競争力のあるパフォーマンスを維持できることを実証している。

Georgios Koukis, Ioannis Dermentzis, Vassilis Tsaoussidis, Jan Lenke, Fabian Wolk, Daniel Uceda, Guillermo Sanchez, Miguel A. Puentes, Javier Serrano, Panagiotis Karamolegkos, Rute C. SofiaTue, 10 Ma💻 cs

Mitigating the Memory Bottleneck with Machine Learning-Driven and Data-Aware Microarchitectural Techniques

本論文は、アプリケーションやシステムデータを活用した機械学習駆動およびデータ認識型のマイクロアーキテクチャ手法(強化学習に基づくデータプリフェッチや意味的特性の活用など)を提案し、従来のデータ非依存な設計の限界を克服することで、メモリボトルネックを緩和しパフォーマンスとエネルギー効率を大幅に向上させることを示しています。

Rahul BeraTue, 10 Ma🤖 cs.LG

Scalable Training of Mixture-of-Experts Models with Megatron Core

本論文は、メモリー、通信、計算の各側面を横断する統合最適化と並列化手法を導入し、数千の GPU クラスターで数十億から数兆パラメータ規模の混合専門家(MoE)モデルの効率的なトレーニングを可能にする、生産環境対応のオープンソースフレームワーク「Megatron Core」の技術とシステム設計を詳述しています。

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)Tue, 10 Ma🤖 cs.LG

Structured Gossip: A Partition-Resilient DNS for Internet-Scale Dynamic Networks

この論文は、DHT のフィンガーテーブルを活用したパッシブな安定化メカニズムと版数ベクトルを導入することで、グローバルな協調なしに大規模なモバイルアドホックネットワークにおけるネットワーク分断に耐性を持ち、メッセージ複雑度を削減しながら最終的な一貫性を保証する「構造化されたゴシップ DNS」を提案しています。

Priyanka Sinha, Dilys ThomasTue, 10 Ma💻 cs

ArcLight: A Lightweight LLM Inference Architecture for Many-Core CPUs

この論文は、NUMA 間メモリアクセスのオーバーヘッドを軽減し、多数コア CPU プラットフォームにおける LLM 推論のスケーラビリティとスループットを大幅に向上させるため、効率的なメモリ管理とスレッドスケジューリング、および制御されたテンソル並列性を統合した軽量アーキテクチャ「ArcLight」を提案するものです。

Yuzhuang Xu, Xu Han, Yuxuan Li, Wanxiang CheTue, 10 Ma💬 cs.CL

A Lock-Free, Fully GPU-Resident Architecture for the Verification of Goldbach's Conjecture

この論文は、ホストとの通信を排除した完全 GPU 常駐アーキテクチャと非同期ロックフリーのワークステアリングを採用し、ゴールドバッハの予想の検証において前代モデルを 45.6 倍高速化し、単一 RTX 5090 で$10^{12}$までの検証を 36.5 秒で達成する画期的な手法を提案しています。

Isaac Llorente-SaguerTue, 10 Ma🔢 math

SageSched: Efficient LLM Scheduling Confronting Demand Uncertainty and Hybridity

この論文は、LLM 推論における需要の不確実性とハイブリッドなリソース要件を考慮し、軽量かつ高精度な出力長予測とコストモデル、不確実性を意識したスケジューリング方針を組み合わせることで、既存手法を 28.7% 以上上回る効率性を実現する新しいスケジューラー「SageSched」を提案するものである。

Zhenghao Gan, Yichen Bao, Yifei Liu, Chen Chen, Quan Chen, Minyi GuoTue, 10 Ma💻 cs

RAPID: Redundancy-Aware and Compatibility-Optimal Edge-Cloud Partitioned Inference for Diverse VLA models

本論文は、視覚ノイズへの耐性と身体動作の連続性を維持しつつ、VLA モデルのエッジ - クラウド協調推論における冗長性を活用して推論速度を最大 1.73 倍向上させる新しいフレームワーク「RAPID」を提案し、その有効性を示しています。

Zihao Zheng, Sicheng Tian, Hangyu Cao, Chenyue Li, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Guojie Luo, Xiang ChenTue, 10 Ma💻 cs

ZK-ACE: Identity-Centric Zero-Knowledge Authorization for Post-Quantum Blockchain Systems

この論文は、ポスト量子ブロックチェーンにおける署名検証のオーバーヘッドを大幅に削減するため、トランザクションに署名オブジェクトを直接含める代わりに、オンチェーンのアイデンティティコミットメントと一致する権限をゼロ知識証明で示す新しい承認レイヤー「ZK-ACE」を提案し、その安全性とデータ効率性を理論的に証明したものである。

Jian Sheng WangTue, 10 Ma💻 cs

ACE-GF-based Attestation Relay for PQC - Lightweight Mempool Propagation Without On-Path Proofs

この論文は、ポスト量子ブロックチェーン環境において、中継ノードが完全な有効性証明を生成・転送せず、代わりに軽量なアテステーションのみを中継し、最終的なビルダーのみで証明を集約する「AR-ACE」プロトコルを提案することで、伝播経路からの証明オーバーヘッドを排除し、帯域幅を桁違いに削減する手法を提示しています。

Jian Sheng WangTue, 10 Ma💻 cs

SI-ChainFL: Shapley-Incentivized Secure Federated Learning for High-Speed Rail Data Sharing

この論文は、高規格鉄道データ共有における連合学習の課題であるインセンティブ不足と中央集権的な集約の欠陥を解決するため、シャープレー値に基づく貢献度評価とブロックチェーンを用いた分散集約を組み合わせた「SI-ChainFL」という新しいセキュアで効率的なフレームワークを提案し、その有効性と理論的保証を実証したものである。

Mingjie Zhao, Cheng Dai, Fei Chen, Xin Chen, Kaoru Ota, Mianxiong Dong, Bing GuoTue, 10 Ma💻 cs

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

この論文は、ブロックチェーンプロトコルと疎な最適化手法(SparseLoCo)を活用して、許可不要な参加者による大規模な分散学習を実現し、1.1 兆トークンで前処理された 72B パラメータの言語モデル「Covenant-72B」を開発し、その性能が中央集権的なモデルと競合するレベルであることを示したものである。

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel DareTue, 10 Ma🤖 cs.LG

A Hodge-Based Framework for Service Operational Analysis in Serverless Platforms

この論文は、サーバーレスプラットフォームにおけるサービス運用を解析するためにホッジ分解を導入し、局所的に修正可能な成分と構造的な調和モードにフローを分割することで、非効率性の原因を特定し、システムを再構築することなく効果的な対策を導き出す手法を提案しています。

Gianluca Reali, Mauro FemminellaTue, 10 Ma💻 cs

TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction

本論文は、電子カルテの不規則な時間構造と複雑な疾患経過を考慮し、SNOMED 基準の医学概念と階層的注意機構を組み合わせた「TA-RNN-Medical-Hybrid」という新しい深層学習フレームワークを提案し、集中治療室における死亡率予測の精度向上と臨床的に意味のある解釈可能性の両立を実現したことを報告しています。

Zahra Jafari, Azadeh Zamanifar, Amirfarhad FarhadiTue, 10 Ma🤖 cs.LG

A Blockchain-based Traceability System for AI-Driven Engine Blade Inspection

本論文は、航空機エンジンブレードの検査記録の改ざん防止と監査可能性を確保するため、Hyperledger Fabric 基盤のブロックチェーンシステム「BladeChain」を提案し、AI による欠陥検出モデルのトレーサビリティ、自動検査スケジューリング、およびマルチステークホルダー間の改ざん耐性のあるライフサイクル追跡を実現したことを示しています。

Mahmoud Hafez, Eman Ouda, Mohammed A. Mohammed Eltoum, Khaled Salah, Yusra AbdulrahmanTue, 10 Ma💻 cs