Link Wars: The Semantic Crisis. Is the debate over or is it just beginning?

O artigo argumenta que a atual fragmentação das tecnologias de interconexão de dados decorre de uma "crise semântica" causada por uma falha fundamental na definição de semânticas de link explícitas e testáveis, propondo que a adoção de primitivas de transação bilaterais com ordenação e visibilidade de falhas claras, conforme o Open Atomic Ethernet, é essencial para restaurar a correção e a interoperabilidade sem depender de barreiras globais.

Paul BorrillTue, 10 Ma💻 cs

Agentic AI-Driven UAV Network Deployment: A LLM-Enhanced Exact Potential Game Approach

Este artigo propõe um framework de otimização de topologia para redes de UAVs baseado em jogos de potencial exato e aprimorado por IA Agente e Grandes Modelos de Linguagem, que coordena decisões de enlace e implantação em múltiplas escalas espaciais para superar desafios de complexidade e melhorar o desempenho da rede.

Xin Tang, Qian Chen, Binhan Liao, Yaqi Zhang, Jianxin Chen, Changyuan Zhao, Junchuan Fan, Junxi Tian, Xiaohuan LiTue, 10 Ma💻 cs

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

O artigo apresenta o MAS-H2, um sistema hierárquico de agentes multiagentes que resolve o problema do "vazio estratégico" no autoscaling nativo de nuvem ao decompor a gestão de recursos em camadas estratégicas, de planejamento e execução, demonstrando em testes no Kubernetes superioridade em redução de estresse de CPU, mitigação de picos de carga e migração sem tempo de inatividade em comparação com as soluções nativas.

Hamed Hamzeh, Parisa VahdatianTue, 10 Ma🤖 cs.LG

Performance Evaluation of Automated Multi-Service Deployment in Edge-Cloud Environments with the CODECO Toolkit

Este artigo avalia o toolkit CODECO, demonstrando que ele reduz significativamente o esforço manual na orquestração de microsserviços em ambientes Edge-Cloud heterogêneos, mantendo desempenho competitivo e sobrecarga aceitável em comparação com fluxos de trabalho Kubernetes padrão.

Georgios Koukis, Ioannis Dermentzis, Vassilis Tsaoussidis, Jan Lenke, Fabian Wolk, Daniel Uceda, Guillermo Sanchez, Miguel A. Puentes, Javier Serrano, Panagiotis Karamolegkos, Rute C. SofiaTue, 10 Ma💻 cs

Mitigating the Memory Bottleneck with Machine Learning-Driven and Data-Aware Microarchitectural Techniques

Esta dissertação propõe uma mudança no design de microarquitetura de abordagens agnósticas a dados para técnicas orientadas a dados e impulsionadas por aprendizado de máquina, demonstrando em quatro estudos de caso que explorar o comportamento de execução e as características semânticas dos dados melhora significativamente o desempenho e a eficiência energética ao mitigar o gargalo de memória.

Rahul BeraTue, 10 Ma🤖 cs.LG

Scalable Training of Mixture-of-Experts Models with Megatron Core

Este artigo apresenta o Megatron Core, uma solução de código aberto que otimiza o treinamento escalável de modelos Mixture-of-Experts (MoE) através de técnicas integradas de memória, comunicação e computação, alcançando alto desempenho em clusters de milhares de GPUs para modelos de bilhões a trilhões de parâmetros.

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)Tue, 10 Ma🤖 cs.LG

A Lock-Free, Fully GPU-Resident Architecture for the Verification of Goldbach's Conjecture

Este artigo apresenta uma arquitetura totalmente residente em GPU e sem bloqueios para a verificação em larga escala da conjectura de Goldbach, que migra todo o pipeline de geração de segmentos para o dispositivo e utiliza um pool de roubo de trabalho assíncrono para alcançar eficiência paralela superior a 98% e uma aceleração de 45,6 vezes em comparação com abordagens anteriores acopladas ao host.

Isaac Llorente-SaguerTue, 10 Ma🔢 math

SageSched: Efficient LLM Scheduling Confronting Demand Uncertainty and Hybridity

O artigo apresenta o SageSched, um agendador eficiente para inferência de LLMs que supera as limitações das abordagens existentes ao lidar com a incerteza da demanda e a natureza híbrida das cargas de trabalho, combinando previsões precisas de comprimento de saída com uma política de agendamento que considera simultaneamente custos computacionais e de memória para alcançar ganhos de eficiência superiores a 28,7%.

Zhenghao Gan, Yichen Bao, Yifei Liu, Chen Chen, Quan Chen, Minyi GuoTue, 10 Ma💻 cs

RAPID: Redundancy-Aware and Compatibility-Optimal Edge-Cloud Partitioned Inference for Diverse VLA models

O artigo apresenta o RAPID, um novo framework de inferência colaborativa entre borda e nuvem para modelos Visão-Linguagem-Ação que otimiza a partição de tarefas ao considerar redundância e compatibilidade, resultando em um aumento de velocidade de até 1,73x com baixa sobrecarga.

Zihao Zheng, Sicheng Tian, Hangyu Cao, Chenyue Li, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Guojie Luo, Xiang ChenTue, 10 Ma💻 cs

SafarDB: FPGA-Accelerated Distributed Transactions via Replicated Data Types

O artigo apresenta o SafarDB, um sistema de replicação de dados distribuídos acelerado por FPGA que, ao integrar diretamente a placa de rede com o acelerador, oferece latência e throughput significativamente superiores e maior resiliência a falhas em comparação com implementações baseadas em RDMA para tipos de dados replicados (RDTs e WRDTs).

Javad Saberlatibari, Prithviraj Yuvaraj, Mohsen Lesani, Philip Brisk, Mohammad SadoghiTue, 10 Ma💻 cs

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

O artigo apresenta o Covenant-72B, um modelo de linguagem de 72 bilhões de parâmetros pré-treinado em escala sem precedentes por meio de uma colaboração global e permissionless apoiada por blockchain e pelo otimizador SparseLoCo, demonstrando que a participação aberta e não whitelistada é viável e competitiva em relação a modelos centralizados.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel DareTue, 10 Ma🤖 cs.LG

A Blockchain-based Traceability System for AI-Driven Engine Blade Inspection

Este artigo apresenta o BladeChain, um sistema baseado em blockchain que garante a rastreabilidade imutável e auditável das inspeções de pás de motores de aeronaves, integrando agendamento automatizado, proveniência de modelos de IA e registros criptográficos em uma rede de múltiplas partes interessadas para eliminar falhas manuais e prevenir adulterações.

Mahmoud Hafez, Eman Ouda, Mohammed A. Mohammed Eltoum, Khaled Salah, Yusra AbdulrahmanTue, 10 Ma💻 cs