cs.DC articoli | Gist.Science

Link Wars: The Semantic Crisis. Is the debate over or is it just beginning?

Il documento sostiene che il panorama attuale delle interconnessioni di rete soffre di una crisi semantica derivante da assunzioni errate sul tempo e sull'ordinamento, proponendo l'Open Atomic Ethernet come soluzione per definire semantica esplicita e testabile che possa superare la frammentazione strutturale senza ricorrere a barriere globali.

Paul BorrillTue, 10 Ma💻 cs

Agentic AI-Driven UAV Network Deployment: A LLM-Enhanced Exact Potential Game Approach

Questo articolo propone un framework di ottimizzazione della topologia per reti di veicoli aerei senza pilota (UAVN) basato su giochi potenziali esatti potenziati dall'Intelligenza Artificiale Agentic e da un modello linguistico di grandi dimensioni (LLM), che coordina la configurazione dei collegamenti e il dispiegamento degli UAV a diverse scale spaziali per migliorare throughput, latenza ed efficienza energetica in ambienti dinamici.

Xin Tang, Qian Chen, Binhan Liao, Yaqi Zhang, Jianxin Chen, Changyuan Zhao, Junchuan Fan, Junxi Tian, Xiaohuan LiTue, 10 Ma💻 cs

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

Il paper presenta MAS-H2, un sistema multi-agente gerarchico per Kubernetes che risolve il problema del "vuoto strategico" nell'autoscaling cloud-native decomponendo la gestione delle risorse in livelli strategici, di pianificazione e di esecuzione, dimostrando sperimentalmente su GKE una riduzione significativa dello stress CPU e una migrazione a zero downtime rispetto agli strumenti nativi.

Hamed Hamzeh, Parisa VahdatianTue, 10 Ma🤖 cs.LG

Performance Evaluation of Automated Multi-Service Deployment in Edge-Cloud Environments with the CODECO Toolkit

Questo documento valuta il toolkit open-source CODECO, dimostrando che riduce significativamente l'intervento manuale e mantiene prestazioni competitive rispetto ai flussi di lavoro Kubernetes standard nell'orchestrazione di microservizi containerizzati in ambienti Edge-Cloud eterogenei.

Georgios Koukis, Ioannis Dermentzis, Vassilis Tsaoussidis, Jan Lenke, Fabian Wolk, Daniel Uceda, Guillermo Sanchez, Miguel A. Puentes, Javier Serrano, Panagiotis Karamolegkos, Rute C. SofiaTue, 10 Ma💻 cs

Mitigating the Memory Bottleneck with Machine Learning-Driven and Data-Aware Microarchitectural Techniques

Questa tesi dimostra che l'adozione di tecniche microarchitettoniche guidate dai dati e dall'apprendimento automatico, che sfruttano le caratteristiche semantiche delle applicazioni e i comportamenti di esecuzione osservati, supera efficacemente i colli di bottiglia della memoria, migliorando significativamente le prestazioni e l'efficienza energetica rispetto alle soluzioni tradizionali.

Rahul BeraTue, 10 Ma🤖 cs.LG

Scalable Training of Mixture-of-Experts Models with Megatron Core

Questo documento presenta Megatron Core, un framework open-source che risolve le sfide del training scalabile dei modelli Mixture-of-Experts attraverso ottimizzazioni integrate per memoria, comunicazione e calcolo, consentendo addestramenti ad alte prestazioni su cluster di migliaia di GPU.

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)Tue, 10 Ma🤖 cs.LG

Structured Gossip: A Partition-Resilient DNS for Internet-Scale Dynamic Networks

Il paper presenta il "Structured Gossip DNS", un protocollo di risoluzione dei nomi per reti dinamiche su larga scala che utilizza tabelle a dita DHT e operazioni commutative per garantire la resilienza alle partizioni e la consistenza eventuale senza coordinamento globale, riducendo la complessità dei messaggi da $O(n)$ a $O(n/\log n)$ .

Priyanka Sinha, Dilys ThomasTue, 10 Ma💻 cs

ArcLight: A Lightweight LLM Inference Architecture for Many-Core CPUs

Il paper presenta ArcLight, un'architettura di inferenza per LLM leggera e ottimizzata per CPU many-core che, integrando gestione della memoria e pianificazione dei thread, supera i limiti delle soluzioni attuali riducendo l'overhead degli accessi cross-NUMA e aumentando il throughput fino al 46%.

Yuzhuang Xu, Xu Han, Yuxuan Li, Wanxiang CheTue, 10 Ma💬 cs.CL

A Lock-Free, Fully GPU-Resident Architecture for the Verification of Goldbach's Conjecture

Questo articolo presenta un'architettura completamente residente su GPU e priva di blocchi che, migrando l'intera pipeline di generazione dei segmenti sul dispositivo e introducendo un pool di lavoro asincrono, verifica la congettura di Goldbach fino a $10^{13}$ in 133,5 secondi su un cluster di quattro GPU, ottenendo un'accelerazione di 45,6 volte rispetto alle soluzioni precedenti.

Isaac Llorente-SaguerTue, 10 Ma🔢 math

The Consistency Correctness in CoPPar Tree

Questo documento supplementare fornisce una dimostrazione dettagliata della correttezza dell'architettura CoPPar Tree.

Xincheng Yang, Kyle HaleTue, 10 Ma💻 cs

SageSched: Efficient LLM Scheduling Confronting Demand Uncertainty and Hybridity

Il paper presenta SageSched, un efficiente scheduler per l'inferenza di LLM che affronta l'incertezza della domanda e l'ibridità computazionale-memoria attraverso la previsione della lunghezza dell'output e una politica di scheduling consapevole dell'incertezza, ottenendo un miglioramento dell'efficienza superiore al 28,7%.

Zhenghao Gan, Yichen Bao, Yifei Liu, Chen Chen, Quan Chen, Minyi GuoTue, 10 Ma💻 cs

RAPID: Redundancy-Aware and Compatibility-Optimal Edge-Cloud Partitioned Inference for Diverse VLA models

Il paper presenta RAPID, un nuovo framework di inferenza collaborativa edge-cloud progettato per i modelli VLA che, superando le limitazioni delle soluzioni esistenti legate al rumore visivo e alla ridondanza delle azioni, garantisce una continuità fisica del movimento con un'accelerazione fino a 1,73 volte e un overhead ridotto del 5-7%.

Zihao Zheng, Sicheng Tian, Hangyu Cao, Chenyue Li, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Guojie Luo, Xiang ChenTue, 10 Ma💻 cs

ZK-ACE: Identity-Centric Zero-Knowledge Authorization for Post-Quantum Blockchain Systems

Il paper presenta ZK-ACE, un nuovo strato di autorizzazione basato su identità che utilizza dimostrazioni a conoscenza zero per sostituire i costosi oggetti di firma post-quantistica nelle transazioni blockchain, riducendo drasticamente i dati di consenso visibili e garantendo sicurezza contro replay e sostituzioni.

Jian Sheng WangTue, 10 Ma💻 cs

ACE-GF-based Attestation Relay for PQC - Lightweight Mempool Propagation Without On-Path Proofs

Il paper presenta AR-ACE, un protocollo di relay per ambienti blockchain post-quantum che elimina l'overhead delle prove di validità lungo il percorso di propagazione richiedendo solo attestazioni compatte ai nodi di relay, mentre la verifica aggregata avviene esclusivamente presso il builder, riducendo drasticamente la larghezza di banda necessaria.

Jian Sheng WangTue, 10 Ma💻 cs

SI-ChainFL: Shapley-Incentivized Secure Federated Learning for High-Speed Rail Data Sharing

Il paper presenta SI-ChainFL, un framework sicuro ed efficiente per l'apprendimento federato nei sistemi ferroviari ad alta velocità che combina una metrica di Shapley per incentivare la qualità dei dati con un'aggregazione decentralizzata basata su blockchain, garantendo robustezza contro gli attacchi malevoli e superando le prestazioni delle soluzioni esistenti.

Mingjie Zhao, Cheng Dai, Fei Chen, Xin Chen, Kaoru Ota, Mianxiong Dong, Bing GuoTue, 10 Ma💻 cs

SafarDB: FPGA-Accelerated Distributed Transactions via Replicated Data Types

Il paper presenta SafarDB, un sistema che accelera le transazioni distribuite e i tipi di dati replicati (CRDT e WRDT) mediante un motore di replica FPGA co-progettato con un'interfaccia di rete dedicata, ottenendo miglioramenti significativi in termini di latenza, throughput e resilienza rispetto alle implementazioni basate su RDMA.

Javad Saberlatibari, Prithviraj Yuvaraj, Mohsen Lesani, Philip Brisk, Mohammad SadoghiTue, 10 Ma💻 cs

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

Il documento presenta Covenant-72B, un modello linguistico su larga scala addestrato in modo collaborativo e globale tramite partecipanti permissionless supportati da un protocollo blockchain, dimostrando che è possibile raggiungere prestazioni competitive con i modelli centralizzati pur consentendo una partecipazione aperta e decentralizzata.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel DareTue, 10 Ma🤖 cs.LG

A Hodge-Based Framework for Service Operational Analysis in Serverless Platforms

Questo articolo propone un framework basato sulla decomposizione di Hodge per analizzare i flussi operativi nelle piattaforme serverless, identificando le inefficienze armoniche come proprietà strutturali piuttosto che errori di configurazione e offrendo strategie di mitigazione mirate.

Gianluca Reali, Mauro FemminellaTue, 10 Ma💻 cs

TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction

Il paper propone TA-RNN-Medical-Hybrid, un framework di deep learning time-aware e interpretabile che integra codifiche temporali continue e rappresentazioni mediche standardizzate per migliorare l'accuratezza e la trasparenza nella previsione del rischio di mortalità in terapia intensiva.

Zahra Jafari, Azadeh Zamanifar, Amirfarhad FarhadiTue, 10 Ma🤖 cs.LG

A Blockchain-based Traceability System for AI-Driven Engine Blade Inspection

Questo articolo presenta BladeChain, un sistema basato su blockchain che garantisce la tracciabilità immutabile delle ispezioni delle pale dei motori aeronautici, integrando l'endorsement multi-stakeholder, la pianificazione automatizzata e la provenienza dei modelli di intelligenza artificiale per migliorare l'auditabilità e la sicurezza nella manutenzione aerea.

Mahmoud Hafez, Eman Ouda, Mohammed A. Mohammed Eltoum, Khaled Salah, Yusra AbdulrahmanTue, 10 Ma💻 cs

← Precedente Successivo →