cs.DC artigos | Gist.Science

Link Wars: The Semantic Crisis. Is the debate over or is it just beginning?

O artigo argumenta que a atual fragmentação das tecnologias de interconexão de dados decorre de uma "crise semântica" causada por uma falha fundamental na definição de semânticas de link explícitas e testáveis, propondo que a adoção de primitivas de transação bilaterais com ordenação e visibilidade de falhas claras, conforme o Open Atomic Ethernet, é essencial para restaurar a correção e a interoperabilidade sem depender de barreiras globais.

Paul BorrillTue, 10 Ma💻 cs

Agentic AI-Driven UAV Network Deployment: A LLM-Enhanced Exact Potential Game Approach

Este artigo propõe um framework de otimização de topologia para redes de UAVs baseado em jogos de potencial exato e aprimorado por IA Agente e Grandes Modelos de Linguagem, que coordena decisões de enlace e implantação em múltiplas escalas espaciais para superar desafios de complexidade e melhorar o desempenho da rede.

Xin Tang, Qian Chen, Binhan Liao, Yaqi Zhang, Jianxin Chen, Changyuan Zhao, Junchuan Fan, Junxi Tian, Xiaohuan LiTue, 10 Ma💻 cs

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

O artigo apresenta o MAS-H2, um sistema hierárquico de agentes multiagentes que resolve o problema do "vazio estratégico" no autoscaling nativo de nuvem ao decompor a gestão de recursos em camadas estratégicas, de planejamento e execução, demonstrando em testes no Kubernetes superioridade em redução de estresse de CPU, mitigação de picos de carga e migração sem tempo de inatividade em comparação com as soluções nativas.

Hamed Hamzeh, Parisa VahdatianTue, 10 Ma🤖 cs.LG

Performance Evaluation of Automated Multi-Service Deployment in Edge-Cloud Environments with the CODECO Toolkit

Este artigo avalia o toolkit CODECO, demonstrando que ele reduz significativamente o esforço manual na orquestração de microsserviços em ambientes Edge-Cloud heterogêneos, mantendo desempenho competitivo e sobrecarga aceitável em comparação com fluxos de trabalho Kubernetes padrão.

Georgios Koukis, Ioannis Dermentzis, Vassilis Tsaoussidis, Jan Lenke, Fabian Wolk, Daniel Uceda, Guillermo Sanchez, Miguel A. Puentes, Javier Serrano, Panagiotis Karamolegkos, Rute C. SofiaTue, 10 Ma💻 cs

Mitigating the Memory Bottleneck with Machine Learning-Driven and Data-Aware Microarchitectural Techniques

Esta dissertação propõe uma mudança no design de microarquitetura de abordagens agnósticas a dados para técnicas orientadas a dados e impulsionadas por aprendizado de máquina, demonstrando em quatro estudos de caso que explorar o comportamento de execução e as características semânticas dos dados melhora significativamente o desempenho e a eficiência energética ao mitigar o gargalo de memória.

Rahul BeraTue, 10 Ma🤖 cs.LG

Scalable Training of Mixture-of-Experts Models with Megatron Core

Este artigo apresenta o Megatron Core, uma solução de código aberto que otimiza o treinamento escalável de modelos Mixture-of-Experts (MoE) através de técnicas integradas de memória, comunicação e computação, alcançando alto desempenho em clusters de milhares de GPUs para modelos de bilhões a trilhões de parâmetros.

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)Tue, 10 Ma🤖 cs.LG

Structured Gossip: A Partition-Resilient DNS for Internet-Scale Dynamic Networks

O artigo apresenta o "Structured Gossip DNS", um sistema de resolução de nomes escalável e resiliente a partições para redes dinâmicas em larga escala, que utiliza tabelas de dedos de DHT e estabilização passiva para reduzir a complexidade de mensagens e garantir consistência eventual sem coordenação global.

Priyanka Sinha, Dilys ThomasTue, 10 Ma💻 cs

ArcLight: A Lightweight LLM Inference Architecture for Many-Core CPUs

O ArcLight é uma arquitetura de inferência leve para LLMs projetada especificamente para CPUs many-core que otimiza o gerenciamento de memória e o agendamento de threads para mitigar os custos de acesso entre nós NUMA, alcançando um aumento de até 46% no rendimento de inferência em comparação com frameworks existentes.

Yuzhuang Xu, Xu Han, Yuxuan Li, Wanxiang CheTue, 10 Ma💬 cs.CL

A Lock-Free, Fully GPU-Resident Architecture for the Verification of Goldbach's Conjecture

Este artigo apresenta uma arquitetura totalmente residente em GPU e sem bloqueios para a verificação em larga escala da conjectura de Goldbach, que migra todo o pipeline de geração de segmentos para o dispositivo e utiliza um pool de roubo de trabalho assíncrono para alcançar eficiência paralela superior a 98% e uma aceleração de 45,6 vezes em comparação com abordagens anteriores acopladas ao host.

Isaac Llorente-SaguerTue, 10 Ma🔢 math

The Consistency Correctness in CoPPar Tree

Este documento suplementar apresenta uma prova detalhada da correção da arquitetura CoPPar Tree.

Xincheng Yang, Kyle HaleTue, 10 Ma💻 cs

SageSched: Efficient LLM Scheduling Confronting Demand Uncertainty and Hybridity

O artigo apresenta o SageSched, um agendador eficiente para inferência de LLMs que supera as limitações das abordagens existentes ao lidar com a incerteza da demanda e a natureza híbrida das cargas de trabalho, combinando previsões precisas de comprimento de saída com uma política de agendamento que considera simultaneamente custos computacionais e de memória para alcançar ganhos de eficiência superiores a 28,7%.

Zhenghao Gan, Yichen Bao, Yifei Liu, Chen Chen, Quan Chen, Minyi GuoTue, 10 Ma💻 cs

RAPID: Redundancy-Aware and Compatibility-Optimal Edge-Cloud Partitioned Inference for Diverse VLA models

O artigo apresenta o RAPID, um novo framework de inferência colaborativa entre borda e nuvem para modelos Visão-Linguagem-Ação que otimiza a partição de tarefas ao considerar redundância e compatibilidade, resultando em um aumento de velocidade de até 1,73x com baixa sobrecarga.

Zihao Zheng, Sicheng Tian, Hangyu Cao, Chenyue Li, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Guojie Luo, Xiang ChenTue, 10 Ma💻 cs

ZK-ACE: Identity-Centric Zero-Knowledge Authorization for Post-Quantum Blockchain Systems

O artigo apresenta o ZK-ACE, uma camada de autorização baseada em identidade que substitui os grandes objetos de assinatura pós-quântica por afirmações de conhecimento zero, reduzindo drasticamente os dados de consenso e mantendo a segurança em blockchains pós-quânticas.

Jian Sheng WangTue, 10 Ma💻 cs

ACE-GF-based Attestation Relay for PQC - Lightweight Mempool Propagation Without On-Path Proofs

O artigo apresenta o AR-ACE, um protocolo de retransmissão que elimina a necessidade de provas de validade no caminho de propagação em blockchains pós-quânticas, substituindo-as por atestações compactas e realizando a verificação agregada apenas no construtor, resultando em uma redução de ordem de magnitude na largura de banda necessária.

Jian Sheng WangTue, 10 Ma💻 cs

SI-ChainFL: Shapley-Incentivized Secure Federated Learning for High-Speed Rail Data Sharing

O artigo propõe o SI-ChainFL, um framework seguro e eficiente para aprendizado federado em sistemas de trem de alta velocidade que combina incentivos baseados no valor de Shapley com agregação descentralizada via blockchain para mitigar ataques maliciosos e eliminar pontos únicos de falha.

Mingjie Zhao, Cheng Dai, Fei Chen, Xin Chen, Kaoru Ota, Mianxiong Dong, Bing GuoTue, 10 Ma💻 cs

SafarDB: FPGA-Accelerated Distributed Transactions via Replicated Data Types

O artigo apresenta o SafarDB, um sistema de replicação de dados distribuídos acelerado por FPGA que, ao integrar diretamente a placa de rede com o acelerador, oferece latência e throughput significativamente superiores e maior resiliência a falhas em comparação com implementações baseadas em RDMA para tipos de dados replicados (RDTs e WRDTs).

Javad Saberlatibari, Prithviraj Yuvaraj, Mohsen Lesani, Philip Brisk, Mohammad SadoghiTue, 10 Ma💻 cs

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

O artigo apresenta o Covenant-72B, um modelo de linguagem de 72 bilhões de parâmetros pré-treinado em escala sem precedentes por meio de uma colaboração global e permissionless apoiada por blockchain e pelo otimizador SparseLoCo, demonstrando que a participação aberta e não whitelistada é viável e competitiva em relação a modelos centralizados.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel DareTue, 10 Ma🤖 cs.LG

A Hodge-Based Framework for Service Operational Analysis in Serverless Platforms

Este artigo propõe um framework baseado em decomposição de Hodge para analisar e identificar fluxos operacionais estruturais em plataformas serverless, permitindo derivar estratégias de remediação que contêm ineficiências sem a necessidade de reestruturar completamente a topologia do serviço.

Gianluca Reali, Mauro FemminellaTue, 10 Ma💻 cs

TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction

O artigo apresenta o TA-RNN-Medical-Hybrid, um framework de aprendizado profundo que combina codificação temporal contínua e representações baseadas em SNOMED para prever com precisão e interpretabilidade o risco de mortalidade em UTIs, superando modelos existentes no conjunto de dados MIMIC-III.

Zahra Jafari, Azadeh Zamanifar, Amirfarhad FarhadiTue, 10 Ma🤖 cs.LG

A Blockchain-based Traceability System for AI-Driven Engine Blade Inspection

Este artigo apresenta o BladeChain, um sistema baseado em blockchain que garante a rastreabilidade imutável e auditável das inspeções de pás de motores de aeronaves, integrando agendamento automatizado, proveniência de modelos de IA e registros criptográficos em uma rede de múltiplas partes interessadas para eliminar falhas manuais e prevenir adulterações.

Mahmoud Hafez, Eman Ouda, Mohammed A. Mohammed Eltoum, Khaled Salah, Yusra AbdulrahmanTue, 10 Ma💻 cs

← Anterior Próximo →