Agentic AI-Driven UAV Network Deployment: A LLM-Enhanced Exact Potential Game Approach

Este artículo propone un marco de optimización de topología para redes de vehículos aéreos no tripulados (UAVN) que combina juegos de potencial exacto en escalas espaciales grandes y pequeñas con un agente de IA potenciado por modelos de lenguaje grandes (LLM) para automatizar la configuración de parámetros, logrando así una mejora significativa en el consumo energético, la latencia y el rendimiento del sistema en entornos dinámicos.

Xin Tang, Qian Chen, Binhan Liao, Yaqi Zhang, Jianxin Chen, Changyuan Zhao, Junchuan Fan, Junxi Tian, Xiaohuan LiTue, 10 Ma💻 cs

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

El artículo presenta MAS-H2, un sistema jerárquico de agentes multiagente que resuelve el problema del vacío estratégico en el escalado automático de la nube al integrar políticas de negocio con la planificación proactiva de recursos, logrando en pruebas con Kubernetes una reducción significativa del estrés de CPU y una migración estratégica sin tiempo de inactividad en comparación con los escaladores nativos.

Hamed Hamzeh, Parisa VahdatianTue, 10 Ma🤖 cs.LG

Performance Evaluation of Automated Multi-Service Deployment in Edge-Cloud Environments with the CODECO Toolkit

Este artículo evalúa el toolkit de código abierto CODECO en entornos Edge-Cloud, demostrando que reduce significativamente la intervención manual en la implementación de microservicios sin comprometer el rendimiento ni la eficiencia de recursos en comparación con los flujos de trabajo estándar de Kubernetes.

Georgios Koukis, Ioannis Dermentzis, Vassilis Tsaoussidis, Jan Lenke, Fabian Wolk, Daniel Uceda, Guillermo Sanchez, Miguel A. Puentes, Javier Serrano, Panagiotis Karamolegkos, Rute C. SofiaTue, 10 Ma💻 cs

Scalable Training of Mixture-of-Experts Models with Megatron Core

Este informe presenta Megatron Core, un marco de código abierto que aborda los desafíos de escalabilidad en el entrenamiento de modelos de expertos mezclados (MoE) mediante optimizaciones integradas en memoria, comunicación y computación, logrando un alto rendimiento en hardware NVIDIA GB300/GB200 para modelos desde miles de millones hasta billones de parámetros.

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)Tue, 10 Ma🤖 cs.LG

RAPID: Redundancy-Aware and Compatibility-Optimal Edge-Cloud Partitioned Inference for Diverse VLA models

El artículo presenta RAPID, un nuevo marco de inferencia colaborativa borde-nube para modelos de Visión-Lenguaje-Acción que mitiga la interferencia del ruido visual y preserva la continuidad física de los movimientos mediante la detección de redundancia, logrando una aceleración de hasta 1.73x con un sobrecosto mínimo.

Zihao Zheng, Sicheng Tian, Hangyu Cao, Chenyue Li, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Guojie Luo, Xiang ChenTue, 10 Ma💻 cs

ZK-ACE: Identity-Centric Zero-Knowledge Authorization for Post-Quantum Blockchain Systems

El artículo presenta ZK-ACE, un protocolo de autorización centrado en la identidad que elimina los objetos de firma poscuántica voluminosos en las transacciones de blockchain al reemplazarlos por declaraciones de autorización de conocimiento cero vinculadas a identidades, logrando así una reducción de un orden de magnitud en los datos visibles para el consenso y garantizando seguridad contra reutilización y suplantación.

Jian Sheng WangTue, 10 Ma💻 cs

SI-ChainFL: Shapley-Incentivized Secure Federated Learning for High-Speed Rail Data Sharing

El artículo presenta SI-ChainFL, un marco de aprendizaje federado seguro y descentralizado para sistemas de ferrocarril de alta velocidad que utiliza valores de Shapley para incentivar la participación de clientes de alta calidad y mitigar ataques maliciosos mediante un protocolo de consenso basado en blockchain.

Mingjie Zhao, Cheng Dai, Fei Chen, Xin Chen, Kaoru Ota, Mianxiong Dong, Bing GuoTue, 10 Ma💻 cs

SafarDB: FPGA-Accelerated Distributed Transactions via Replicated Data Types

El artículo presenta SafarDB, un sistema de replicación de datos distribuidos acelerado por FPGA que, mediante la co-diseño de un motor de replicación conectado a la red y una interfaz de red residente en FPGA, logra reducir significativamente la latencia y aumentar el rendimiento de los tipos de datos replicados (CRDTs y WRDTs) en comparación con las implementaciones basadas en RDMA, al tiempo que mejora la resiliencia ante fallos y la velocidad de elección de líderes.

Javad Saberlatibari, Prithviraj Yuvaraj, Mohsen Lesani, Philip Brisk, Mohammad SadoghiTue, 10 Ma💻 cs

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

El informe presenta Covenant-72B, un modelo de lenguaje de 72 mil millones de parámetros pre-entrenado de manera competitiva a través de la mayor colaboración distribuida globalmente hasta la fecha, logrando una participación abierta y sin permisos mediante un protocolo blockchain y el optimizador SparseLoCo.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel DareTue, 10 Ma🤖 cs.LG

TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction

El artículo presenta TA-RNN-Medical-Hybrid, un marco de aprendizaje profundo que combina codificación temporal continua, representaciones de conceptos médicos estandarizados y un mecanismo de atención jerárquica para mejorar la precisión y la interpretabilidad clínica en la predicción de riesgo de mortalidad en unidades de cuidados intensivos.

Zahra Jafari, Azadeh Zamanifar, Amirfarhad FarhadiTue, 10 Ma🤖 cs.LG

A Blockchain-based Traceability System for AI-Driven Engine Blade Inspection

Este artículo presenta BladeChain, un sistema basado en blockchain que garantiza la trazabilidad inmutable y auditable de las inspecciones de álabes de motores de avión mediante la integración de la gestión de múltiples partes interesadas, la programación automatizada y el rastreo de la procedencia de los modelos de inteligencia artificial.

Mahmoud Hafez, Eman Ouda, Mohammed A. Mohammed Eltoum, Khaled Salah, Yusra AbdulrahmanTue, 10 Ma💻 cs