Agentic AI-Driven UAV Network Deployment: A LLM-Enhanced Exact Potential Game Approach

Questo articolo propone un framework di ottimizzazione della topologia per reti di veicoli aerei senza pilota (UAVN) basato su giochi potenziali esatti potenziati dall'Intelligenza Artificiale Agentic e da un modello linguistico di grandi dimensioni (LLM), che coordina la configurazione dei collegamenti e il dispiegamento degli UAV a diverse scale spaziali per migliorare throughput, latenza ed efficienza energetica in ambienti dinamici.

Xin Tang, Qian Chen, Binhan Liao, Yaqi Zhang, Jianxin Chen, Changyuan Zhao, Junchuan Fan, Junxi Tian, Xiaohuan LiTue, 10 Ma💻 cs

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

Il paper presenta MAS-H2, un sistema multi-agente gerarchico per Kubernetes che risolve il problema del "vuoto strategico" nell'autoscaling cloud-native decomponendo la gestione delle risorse in livelli strategici, di pianificazione e di esecuzione, dimostrando sperimentalmente su GKE una riduzione significativa dello stress CPU e una migrazione a zero downtime rispetto agli strumenti nativi.

Hamed Hamzeh, Parisa VahdatianTue, 10 Ma🤖 cs.LG

Performance Evaluation of Automated Multi-Service Deployment in Edge-Cloud Environments with the CODECO Toolkit

Questo documento valuta il toolkit open-source CODECO, dimostrando che riduce significativamente l'intervento manuale e mantiene prestazioni competitive rispetto ai flussi di lavoro Kubernetes standard nell'orchestrazione di microservizi containerizzati in ambienti Edge-Cloud eterogenei.

Georgios Koukis, Ioannis Dermentzis, Vassilis Tsaoussidis, Jan Lenke, Fabian Wolk, Daniel Uceda, Guillermo Sanchez, Miguel A. Puentes, Javier Serrano, Panagiotis Karamolegkos, Rute C. SofiaTue, 10 Ma💻 cs

Mitigating the Memory Bottleneck with Machine Learning-Driven and Data-Aware Microarchitectural Techniques

Questa tesi dimostra che l'adozione di tecniche microarchitettoniche guidate dai dati e dall'apprendimento automatico, che sfruttano le caratteristiche semantiche delle applicazioni e i comportamenti di esecuzione osservati, supera efficacemente i colli di bottiglia della memoria, migliorando significativamente le prestazioni e l'efficienza energetica rispetto alle soluzioni tradizionali.

Rahul BeraTue, 10 Ma🤖 cs.LG

Scalable Training of Mixture-of-Experts Models with Megatron Core

Questo documento presenta Megatron Core, un framework open-source che risolve le sfide del training scalabile dei modelli Mixture-of-Experts attraverso ottimizzazioni integrate per memoria, comunicazione e calcolo, consentendo addestramenti ad alte prestazioni su cluster di migliaia di GPU.

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)Tue, 10 Ma🤖 cs.LG

A Lock-Free, Fully GPU-Resident Architecture for the Verification of Goldbach's Conjecture

Questo articolo presenta un'architettura completamente residente su GPU e priva di blocchi che, migrando l'intera pipeline di generazione dei segmenti sul dispositivo e introducendo un pool di lavoro asincrono, verifica la congettura di Goldbach fino a $10^{13}$ in 133,5 secondi su un cluster di quattro GPU, ottenendo un'accelerazione di 45,6 volte rispetto alle soluzioni precedenti.

Isaac Llorente-SaguerTue, 10 Ma🔢 math

RAPID: Redundancy-Aware and Compatibility-Optimal Edge-Cloud Partitioned Inference for Diverse VLA models

Il paper presenta RAPID, un nuovo framework di inferenza collaborativa edge-cloud progettato per i modelli VLA che, superando le limitazioni delle soluzioni esistenti legate al rumore visivo e alla ridondanza delle azioni, garantisce una continuità fisica del movimento con un'accelerazione fino a 1,73 volte e un overhead ridotto del 5-7%.

Zihao Zheng, Sicheng Tian, Hangyu Cao, Chenyue Li, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Guojie Luo, Xiang ChenTue, 10 Ma💻 cs

SI-ChainFL: Shapley-Incentivized Secure Federated Learning for High-Speed Rail Data Sharing

Il paper presenta SI-ChainFL, un framework sicuro ed efficiente per l'apprendimento federato nei sistemi ferroviari ad alta velocità che combina una metrica di Shapley per incentivare la qualità dei dati con un'aggregazione decentralizzata basata su blockchain, garantendo robustezza contro gli attacchi malevoli e superando le prestazioni delle soluzioni esistenti.

Mingjie Zhao, Cheng Dai, Fei Chen, Xin Chen, Kaoru Ota, Mianxiong Dong, Bing GuoTue, 10 Ma💻 cs

SafarDB: FPGA-Accelerated Distributed Transactions via Replicated Data Types

Il paper presenta SafarDB, un sistema che accelera le transazioni distribuite e i tipi di dati replicati (CRDT e WRDT) mediante un motore di replica FPGA co-progettato con un'interfaccia di rete dedicata, ottenendo miglioramenti significativi in termini di latenza, throughput e resilienza rispetto alle implementazioni basate su RDMA.

Javad Saberlatibari, Prithviraj Yuvaraj, Mohsen Lesani, Philip Brisk, Mohammad SadoghiTue, 10 Ma💻 cs

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

Il documento presenta Covenant-72B, un modello linguistico su larga scala addestrato in modo collaborativo e globale tramite partecipanti permissionless supportati da un protocollo blockchain, dimostrando che è possibile raggiungere prestazioni competitive con i modelli centralizzati pur consentendo una partecipazione aperta e decentralizzata.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel DareTue, 10 Ma🤖 cs.LG

A Blockchain-based Traceability System for AI-Driven Engine Blade Inspection

Questo articolo presenta BladeChain, un sistema basato su blockchain che garantisce la tracciabilità immutabile delle ispezioni delle pale dei motori aeronautici, integrando l'endorsement multi-stakeholder, la pianificazione automatizzata e la provenienza dei modelli di intelligenza artificiale per migliorare l'auditabilità e la sicurezza nella manutenzione aerea.

Mahmoud Hafez, Eman Ouda, Mohammed A. Mohammed Eltoum, Khaled Salah, Yusra AbdulrahmanTue, 10 Ma💻 cs