Agentic AI-Driven UAV Network Deployment: A LLM-Enhanced Exact Potential Game Approach

Cet article propose un cadre d'optimisation de la topologie des réseaux de drones (UAVN) basé sur des jeux potentiels exacts et enrichi par une intelligence artificielle agentique et des modèles de langage, afin de résoudre efficacement les problèmes complexes de déploiement et de gestion des liens dans des environnements dynamiques.

Xin Tang, Qian Chen, Binhan Liao, Yaqi Zhang, Jianxin Chen, Changyuan Zhao, Junchuan Fan, Junxi Tian, Xiaohuan LiTue, 10 Ma💻 cs

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

Cet article présente MAS-H2, un système multi-agents hiérarchique conçu pour Kubernetes qui résout le problème du vide stratégique en décomposant l'autoscaling en trois couches (stratégique, planification et exécution), permettant ainsi une gestion proactive des ressources qui réduit significativement la charge CPU et les coûts par rapport aux solutions natives.

Hamed Hamzeh, Parisa VahdatianTue, 10 Ma🤖 cs.LG

Performance Evaluation of Automated Multi-Service Deployment in Edge-Cloud Environments with the CODECO Toolkit

Cet article évalue le toolkit open-source CODECO et démontre qu'il réduit significativement l'intervention manuelle nécessaire au déploiement de microservices dans des environnements Edge-Cloud hétérogènes, tout en maintenant des performances compétitives par rapport aux flux de travail Kubernetes standards.

Georgios Koukis, Ioannis Dermentzis, Vassilis Tsaoussidis, Jan Lenke, Fabian Wolk, Daniel Uceda, Guillermo Sanchez, Miguel A. Puentes, Javier Serrano, Panagiotis Karamolegkos, Rute C. SofiaTue, 10 Ma💻 cs

Mitigating the Memory Bottleneck with Machine Learning-Driven and Data-Aware Microarchitectural Techniques

Cette thèse propose de surmonter le goulot d'étranglement de la mémoire en faisant évoluer la conception microarchitecturale d'une approche agnostique des données vers une approche informée par les données, en utilisant des techniques d'apprentissage automatique et l'exploitation des caractéristiques sémantiques pour optimiser significativement les performances et l'efficacité énergétique.

Rahul BeraTue, 10 Ma🤖 cs.LG

Scalable Training of Mixture-of-Experts Models with Megatron Core

Ce rapport présente les optimisations intégrées de Megatron Core pour le entraînement évolutif des modèles à mélange d'experts (MoE), couvrant la mémoire, la communication et le calcul afin d'atteindre des performances élevées sur des clusters massifs tout en offrant une solution open-source prête pour la production.

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)Tue, 10 Ma🤖 cs.LG

A Lock-Free, Fully GPU-Resident Architecture for the Verification of Goldbach's Conjecture

Cet article présente une architecture entièrement résidente sur GPU et sans verrou qui, grâce à une migration complète du pipeline de génération de segments et à un mécanisme de vol de travail asynchrone, permet de vérifier la conjecture de Goldbach jusqu'à 10¹³ en seulement 133,5 secondes sur un cluster de quatre GPU, réalisant ainsi une accélération algorithmique de 45,6 fois par rapport aux méthodes précédentes.

Isaac Llorente-SaguerTue, 10 Ma🔢 math

RAPID: Redundancy-Aware and Compatibility-Optimal Edge-Cloud Partitioned Inference for Diverse VLA models

Le papier propose RAPID, un cadre d'inférence collaboratif edge-cloud innovant conçu pour optimiser le partitionnement des modèles VLA en atténuant les interférences du bruit visuel et en préservant la continuité physique des mouvements grâce à la prise en compte de la redondance, permettant ainsi d'obtenir une accélération allant jusqu'à 1,73 fois avec une surcharge minimale.

Zihao Zheng, Sicheng Tian, Hangyu Cao, Chenyue Li, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Guojie Luo, Xiang ChenTue, 10 Ma💻 cs

ZK-ACE: Identity-Centric Zero-Knowledge Authorization for Post-Quantum Blockchain Systems

Le papier présente ZK-ACE, une nouvelle couche d'autorisation basée sur l'identité qui remplace les signatures post-quantiques volumineuses par des preuves à divulgation nulle de connaissance succinctes, réduisant ainsi considérablement les données de consensus nécessaires tout en garantissant la sécurité et la résistance aux rejeux dans les systèmes blockchain post-quantiques.

Jian Sheng WangTue, 10 Ma💻 cs

SI-ChainFL: Shapley-Incentivized Secure Federated Learning for High-Speed Rail Data Sharing

Le papier propose SI-ChainFL, un cadre d'apprentissage fédéré sécurisé et incitatif pour les systèmes ferroviaires à grande vitesse, qui combine une estimation efficace de la valeur de Shapley pour récompenser les contributions des clients et un protocole de consensus décentralisé sur blockchain pour prévenir les attaques malveillantes et éliminer les points de défaillance uniques.

Mingjie Zhao, Cheng Dai, Fei Chen, Xin Chen, Kaoru Ota, Mianxiong Dong, Bing GuoTue, 10 Ma💻 cs

SafarDB: FPGA-Accelerated Distributed Transactions via Replicated Data Types

Le papier présente SafarDB, un système de base de données distribué accéléré par FPGA qui intègre une interface réseau dédiée pour exécuter des transactions répliquées directement au niveau du réseau, offrant ainsi des gains significatifs de latence et de débit par rapport aux solutions basées sur RDMA tout en améliorant la résilience aux pannes.

Javad Saberlatibari, Prithviraj Yuvaraj, Mohsen Lesani, Philip Brisk, Mohammad SadoghiTue, 10 Ma💻 cs

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

Ce rapport présente Covenant-72B, un modèle de langage de 72 milliards de paramètres pré-entraîné à l'échelle mondiale via une participation ouverte et sans permission soutenue par un protocole blockchain, démontrant ainsi la viabilité d'un entraînement décentralisé massif compétitif avec les approches centralisées.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel DareTue, 10 Ma🤖 cs.LG

TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction

Cet article présente TA-RNN-Medical-Hybrid, un cadre d'apprentissage profond hybride et interprétable conçu pour prédire avec précision le risque de mortalité en soins intensifs en modélisant les dynamiques temporelles irrégulières des dossiers de santé électroniques tout en fournissant des explications cliniques transparentes.

Zahra Jafari, Azadeh Zamanifar, Amirfarhad FarhadiTue, 10 Ma🤖 cs.LG