Agentic AI-Driven UAV Network Deployment: A LLM-Enhanced Exact Potential Game Approach

Diese Arbeit stellt einen Agentic-AI-gestützten Rahmen vor, der durch die Kombination von exakten Potentialspielen auf verschiedenen räumlichen Skalen und einem Large Language Model zur automatischen Parametrierung die Topologieoptimierung von UAV-Netzwerken hinsichtlich Energieeffizienz, Latenz und Durchsatz verbessert.

Xin Tang, Qian Chen, Binhan Liao, Yaqi Zhang, Jianxin Chen, Changyuan Zhao, Junchuan Fan, Junxi Tian, Xiaohuan LiTue, 10 Ma💻 cs

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

Die Studie stellt MAS-H2 vor, ein hierarchisches Multi-Agenten-System für Kubernetes, das durch die Integration von Geschäftsstrategien, proaktiver Planung und Ausführung die reaktiven Grenzen nativer Autoscaler überwindet und so in dynamischen Szenarien signifikant weniger Ressourcenverschwendung sowie eine höhere Stabilität und Zero-Downtime-Migration ermöglicht.

Hamed Hamzeh, Parisa VahdatianTue, 10 Ma🤖 cs.LG

Performance Evaluation of Automated Multi-Service Deployment in Edge-Cloud Environments with the CODECO Toolkit

Die Studie bewertet das Open-Source-Framework CODECO und zeigt, dass es im Vergleich zu herkömmlichen Kubernetes-Workflows den manuellen Aufwand bei der Bereitstellung von Container-Mikrodiensten in heterogenen Edge-Cloud-Umgebungen erheblich reduziert, ohne dabei die Laufzeitleistung oder Ressourceneffizienz zu beeinträchtigen.

Georgios Koukis, Ioannis Dermentzis, Vassilis Tsaoussidis, Jan Lenke, Fabian Wolk, Daniel Uceda, Guillermo Sanchez, Miguel A. Puentes, Javier Serrano, Panagiotis Karamolegkos, Rute C. SofiaTue, 10 Ma💻 cs

Scalable Training of Mixture-of-Experts Models with Megatron Core

Dieser Bericht stellt das Megatron Core-Framework vor, das durch integrierte Optimierungen in den Bereichen Speicher, Kommunikation und Berechnung sowie Unterstützung für parallele Verfahren und niedrige Präzision das skalierbare Training von Mixture-of-Experts-Modellen auf Tausenden von GPUs ermöglicht und dabei hohe Rechenleistung auf NVIDIA-Hardware erreicht.

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)Tue, 10 Ma🤖 cs.LG

A Lock-Free, Fully GPU-Resident Architecture for the Verification of Goldbach's Conjecture

Die vorgestellte Arbeit stellt eine vollständig GPU-residente, sperrenfreie Multi-GPU-Architektur vor, die durch den vollständigen Umzug des Sieb-Generierungsprozesses auf die GPU und die Einführung eines asynchronen Work-Stealing-Pools die Goldbach-Vermutung bis zu $10^{13}$ mit einer Geschwindigkeit von 133,5 Sekunden auf einem Vier-GPU-System verifiziert und dabei eine algorithmische Beschleunigung von 45,6-fach gegenüber vorherigen Ansätzen erreicht.

Isaac Llorente-SaguerTue, 10 Ma🔢 math

RAPID: Redundancy-Aware and Compatibility-Optimal Edge-Cloud Partitioned Inference for Diverse VLA models

Das Paper stellt RAPID vor, ein redundanzbewusstes und kompatibilitätsoptimiertes Edge-Cloud-Inferenzframework für diverse Vision-Language-Action-Modelle, das durch die Überwindung von visuellen Störungen und die Berücksichtigung redundanter Schritte die Echtzeitfähigkeit verbessert und dabei eine Geschwindigkeitssteigerung von bis zu 1,73-fach bei einem geringen Overhead von 5–7 % erreicht.

Zihao Zheng, Sicheng Tian, Hangyu Cao, Chenyue Li, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Guojie Luo, Xiang ChenTue, 10 Ma💻 cs

SafarDB: FPGA-Accelerated Distributed Transactions via Replicated Data Types

Die Arbeit stellt SafarDB vor, ein FPGA-beschleunigtes verteiltes Transaktionssystem, das durch die direkte Anbindung eines FPGA-Accelerators an das Netzwerk und die Co-Design-Architektur von Replikations-Engine und Netzwerkschnittstelle die Latenz und den Durchsatz für CRDTs und WRDTs im Vergleich zu RDMA-basierten Lösungen erheblich verbessert und gleichzeitig die Fehlertoleranz erhöht.

Javad Saberlatibari, Prithviraj Yuvaraj, Mohsen Lesani, Philip Brisk, Mohammad SadoghiTue, 10 Ma💻 cs

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

Die Arbeit stellt Covenant-72B vor, ein 72-Milliarden-Parameter-Sprachmodell, das durch den bisher größten kollaborativen, global verteilten Pre-Training-Lauf mit erlaubnisfreier Teilnahme über eine Blockchain-Protokoll und den effizienten SparseLoCo-Optimierer trainiert wurde und dabei mit zentralisierten Modellen vergleichbare Leistung erbringt.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel DareTue, 10 Ma🤖 cs.LG

A Blockchain-based Traceability System for AI-Driven Engine Blade Inspection

Die Arbeit stellt BladeChain vor, ein auf Hyperledger Fabric basierendes Blockchain-System, das durch die Integration von KI-Modell-Herkunft, automatisierten Inspektionsauslösungen und einer unveränderlichen, mehrstufigen Ledger-Struktur eine fälschungssichere und vollständig nachvollziehbare Lebenszyklus-Verfolgung für Flugzeugtriebwerksschaufeln ermöglicht.

Mahmoud Hafez, Eman Ouda, Mohammed A. Mohammed Eltoum, Khaled Salah, Yusra AbdulrahmanTue, 10 Ma💻 cs