cs.DC articles | Gist.Science

Link Wars: The Semantic Crisis. Is the debate over or is it just beginning?

Ce papier soutient que le paysage actuel des interconnexions souffre d'une crise sémantique due à des hypothèses implicites sur le temps et la fiabilité, et propose que l'Open Atomic Ethernet (OAE) résolve cette fragmentation structurelle en introduisant des primitives transactionnelles bilatérales avec un ordre et une visibilité explicites des échecs.

Paul BorrillTue, 10 Ma💻 cs

Agentic AI-Driven UAV Network Deployment: A LLM-Enhanced Exact Potential Game Approach

Cet article propose un cadre d'optimisation de la topologie des réseaux de drones (UAVN) basé sur des jeux potentiels exacts et enrichi par une intelligence artificielle agentique et des modèles de langage, afin de résoudre efficacement les problèmes complexes de déploiement et de gestion des liens dans des environnements dynamiques.

Xin Tang, Qian Chen, Binhan Liao, Yaqi Zhang, Jianxin Chen, Changyuan Zhao, Junchuan Fan, Junxi Tian, Xiaohuan LiTue, 10 Ma💻 cs

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

Cet article présente MAS-H2, un système multi-agents hiérarchique conçu pour Kubernetes qui résout le problème du vide stratégique en décomposant l'autoscaling en trois couches (stratégique, planification et exécution), permettant ainsi une gestion proactive des ressources qui réduit significativement la charge CPU et les coûts par rapport aux solutions natives.

Hamed Hamzeh, Parisa VahdatianTue, 10 Ma🤖 cs.LG

Performance Evaluation of Automated Multi-Service Deployment in Edge-Cloud Environments with the CODECO Toolkit

Cet article évalue le toolkit open-source CODECO et démontre qu'il réduit significativement l'intervention manuelle nécessaire au déploiement de microservices dans des environnements Edge-Cloud hétérogènes, tout en maintenant des performances compétitives par rapport aux flux de travail Kubernetes standards.

Georgios Koukis, Ioannis Dermentzis, Vassilis Tsaoussidis, Jan Lenke, Fabian Wolk, Daniel Uceda, Guillermo Sanchez, Miguel A. Puentes, Javier Serrano, Panagiotis Karamolegkos, Rute C. SofiaTue, 10 Ma💻 cs

Mitigating the Memory Bottleneck with Machine Learning-Driven and Data-Aware Microarchitectural Techniques

Cette thèse propose de surmonter le goulot d'étranglement de la mémoire en faisant évoluer la conception microarchitecturale d'une approche agnostique des données vers une approche informée par les données, en utilisant des techniques d'apprentissage automatique et l'exploitation des caractéristiques sémantiques pour optimiser significativement les performances et l'efficacité énergétique.

Rahul BeraTue, 10 Ma🤖 cs.LG

Scalable Training of Mixture-of-Experts Models with Megatron Core

Ce rapport présente les optimisations intégrées de Megatron Core pour le entraînement évolutif des modèles à mélange d'experts (MoE), couvrant la mémoire, la communication et le calcul afin d'atteindre des performances élevées sur des clusters massifs tout en offrant une solution open-source prête pour la production.

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)Tue, 10 Ma🤖 cs.LG

Structured Gossip: A Partition-Resilient DNS for Internet-Scale Dynamic Networks

Ce papier présente le DNS Structured Gossip, une solution résiliente aux partitions pour les réseaux dynamiques à l'échelle d'Internet qui utilise la stabilisation passive et des vecteurs de version pour garantir une cohérence éventuelle avec une complexité de message réduite, éliminant ainsi le besoin de coordination globale.

Priyanka Sinha, Dilys ThomasTue, 10 Ma💻 cs

ArcLight: A Lightweight LLM Inference Architecture for Many-Core CPUs

ArcLight est une architecture d'inférence légère conçue spécifiquement pour les CPU many-core qui, en optimisant la gestion de la mémoire et le parallélisme des tenseurs pour réduire les accès inter-NUMA, dépasse les performances des cadres existants d'un facteur allant jusqu'à 46 %.

Yuzhuang Xu, Xu Han, Yuxuan Li, Wanxiang CheTue, 10 Ma💬 cs.CL

A Lock-Free, Fully GPU-Resident Architecture for the Verification of Goldbach's Conjecture

Cet article présente une architecture entièrement résidente sur GPU et sans verrou qui, grâce à une migration complète du pipeline de génération de segments et à un mécanisme de vol de travail asynchrone, permet de vérifier la conjecture de Goldbach jusqu'à 10¹³ en seulement 133,5 secondes sur un cluster de quatre GPU, réalisant ainsi une accélération algorithmique de 45,6 fois par rapport aux méthodes précédentes.

Isaac Llorente-SaguerTue, 10 Ma🔢 math

The Consistency Correctness in CoPPar Tree

Ce document complémentaire fournit une preuve détaillée de la correction de l'architecture CoPPar Tree.

Xincheng Yang, Kyle HaleTue, 10 Ma💻 cs

SageSched: Efficient LLM Scheduling Confronting Demand Uncertainty and Hybridity

SageSched est un nouveau planificateur d'inférence LLM efficace qui améliore les performances de plus de 28,7 % en combinant la prédiction de la longueur de sortie et une modélisation complète des coûts de calcul et de mémoire pour gérer l'incertitude de la demande et l'hybridité des charges de travail.

Zhenghao Gan, Yichen Bao, Yifei Liu, Chen Chen, Quan Chen, Minyi GuoTue, 10 Ma💻 cs

RAPID: Redundancy-Aware and Compatibility-Optimal Edge-Cloud Partitioned Inference for Diverse VLA models

Le papier propose RAPID, un cadre d'inférence collaboratif edge-cloud innovant conçu pour optimiser le partitionnement des modèles VLA en atténuant les interférences du bruit visuel et en préservant la continuité physique des mouvements grâce à la prise en compte de la redondance, permettant ainsi d'obtenir une accélération allant jusqu'à 1,73 fois avec une surcharge minimale.

Zihao Zheng, Sicheng Tian, Hangyu Cao, Chenyue Li, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Guojie Luo, Xiang ChenTue, 10 Ma💻 cs

ZK-ACE: Identity-Centric Zero-Knowledge Authorization for Post-Quantum Blockchain Systems

Le papier présente ZK-ACE, une nouvelle couche d'autorisation basée sur l'identité qui remplace les signatures post-quantiques volumineuses par des preuves à divulgation nulle de connaissance succinctes, réduisant ainsi considérablement les données de consensus nécessaires tout en garantissant la sécurité et la résistance aux rejeux dans les systèmes blockchain post-quantiques.

Jian Sheng WangTue, 10 Ma💻 cs

ACE-GF-based Attestation Relay for PQC - Lightweight Mempool Propagation Without On-Path Proofs

L'article présente AR-ACE, un protocole d'attestation relayée pour les blockchains post-quantiques qui élimine la nécessité de preuves de validité sur le chemin de propagation en les déplaçant vers le constructeur final, réduisant ainsi considérablement la bande passante requise tout en assurant une sécurité PQC.

Jian Sheng WangTue, 10 Ma💻 cs

SI-ChainFL: Shapley-Incentivized Secure Federated Learning for High-Speed Rail Data Sharing

Le papier propose SI-ChainFL, un cadre d'apprentissage fédéré sécurisé et incitatif pour les systèmes ferroviaires à grande vitesse, qui combine une estimation efficace de la valeur de Shapley pour récompenser les contributions des clients et un protocole de consensus décentralisé sur blockchain pour prévenir les attaques malveillantes et éliminer les points de défaillance uniques.

Mingjie Zhao, Cheng Dai, Fei Chen, Xin Chen, Kaoru Ota, Mianxiong Dong, Bing GuoTue, 10 Ma💻 cs

SafarDB: FPGA-Accelerated Distributed Transactions via Replicated Data Types

Le papier présente SafarDB, un système de base de données distribué accéléré par FPGA qui intègre une interface réseau dédiée pour exécuter des transactions répliquées directement au niveau du réseau, offrant ainsi des gains significatifs de latence et de débit par rapport aux solutions basées sur RDMA tout en améliorant la résilience aux pannes.

Javad Saberlatibari, Prithviraj Yuvaraj, Mohsen Lesani, Philip Brisk, Mohammad SadoghiTue, 10 Ma💻 cs

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

Ce rapport présente Covenant-72B, un modèle de langage de 72 milliards de paramètres pré-entraîné à l'échelle mondiale via une participation ouverte et sans permission soutenue par un protocole blockchain, démontrant ainsi la viabilité d'un entraînement décentralisé massif compétitif avec les approches centralisées.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel DareTue, 10 Ma🤖 cs.LG

A Hodge-Based Framework for Service Operational Analysis in Serverless Platforms

Cet article propose un cadre d'analyse basé sur la décomposition de Hodge pour modéliser topologiquement les flux opérationnels dans les plateformes serverless, permettant d'identifier les modes harmoniques structurels comme des propriétés inhérentes plutôt que des erreurs et de formuler des stratégies de remédiation ciblées.

Gianluca Reali, Mauro FemminellaTue, 10 Ma💻 cs

TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction

Cet article présente TA-RNN-Medical-Hybrid, un cadre d'apprentissage profond hybride et interprétable conçu pour prédire avec précision le risque de mortalité en soins intensifs en modélisant les dynamiques temporelles irrégulières des dossiers de santé électroniques tout en fournissant des explications cliniques transparentes.

Zahra Jafari, Azadeh Zamanifar, Amirfarhad FarhadiTue, 10 Ma🤖 cs.LG

A Blockchain-based Traceability System for AI-Driven Engine Blade Inspection

Cet article présente BladeChain, un système de traçabilité basé sur la blockchain qui intègre l'IA et la cryptographie pour assurer une maintenance immuable, automatisée et auditable des pales de moteurs d'avion tout au long de leur cycle de vie.

Mahmoud Hafez, Eman Ouda, Mohammed A. Mohammed Eltoum, Khaled Salah, Yusra AbdulrahmanTue, 10 Ma💻 cs

← Précédent Suivant →