cs.DC artículos | Gist.Science

Link Wars: The Semantic Crisis. Is the debate over or is it just beginning?

El artículo sostiene que el panorama actual de interconexiones sufre una crisis semántica derivada de suposiciones erróneas sobre el tiempo y la fiabilidad, proponiendo que la estandarización abierta mediante primitivas de transacción explícitas, como las de Open Atomic Ethernet, es esencial para resolver la fragmentación estructural y lograr la corrección sin barreras globales.

Paul BorrillTue, 10 Ma💻 cs

Agentic AI-Driven UAV Network Deployment: A LLM-Enhanced Exact Potential Game Approach

Este artículo propone un marco de optimización de topología para redes de vehículos aéreos no tripulados (UAVN) que combina juegos de potencial exacto en escalas espaciales grandes y pequeñas con un agente de IA potenciado por modelos de lenguaje grandes (LLM) para automatizar la configuración de parámetros, logrando así una mejora significativa en el consumo energético, la latencia y el rendimiento del sistema en entornos dinámicos.

Xin Tang, Qian Chen, Binhan Liao, Yaqi Zhang, Jianxin Chen, Changyuan Zhao, Junchuan Fan, Junxi Tian, Xiaohuan LiTue, 10 Ma💻 cs

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

El artículo presenta MAS-H2, un sistema jerárquico de agentes multiagente que resuelve el problema del vacío estratégico en el escalado automático de la nube al integrar políticas de negocio con la planificación proactiva de recursos, logrando en pruebas con Kubernetes una reducción significativa del estrés de CPU y una migración estratégica sin tiempo de inactividad en comparación con los escaladores nativos.

Hamed Hamzeh, Parisa VahdatianTue, 10 Ma🤖 cs.LG

Performance Evaluation of Automated Multi-Service Deployment in Edge-Cloud Environments with the CODECO Toolkit

Este artículo evalúa el toolkit de código abierto CODECO en entornos Edge-Cloud, demostrando que reduce significativamente la intervención manual en la implementación de microservicios sin comprometer el rendimiento ni la eficiencia de recursos en comparación con los flujos de trabajo estándar de Kubernetes.

Georgios Koukis, Ioannis Dermentzis, Vassilis Tsaoussidis, Jan Lenke, Fabian Wolk, Daniel Uceda, Guillermo Sanchez, Miguel A. Puentes, Javier Serrano, Panagiotis Karamolegkos, Rute C. SofiaTue, 10 Ma💻 cs

Mitigating the Memory Bottleneck with Machine Learning-Driven and Data-Aware Microarchitectural Techniques

Esta tesis doctoral propone superar el cuello de botella de la memoria mediante técnicas microarquitectónicas que pasan de ser ajenas a los datos a ser informadas por ellos, utilizando aprendizaje automático y características semánticas de los datos para optimizar significativamente el rendimiento y la eficiencia energética de los procesadores.

Rahul BeraTue, 10 Ma🤖 cs.LG

Scalable Training of Mixture-of-Experts Models with Megatron Core

Este informe presenta Megatron Core, un marco de código abierto que aborda los desafíos de escalabilidad en el entrenamiento de modelos de expertos mezclados (MoE) mediante optimizaciones integradas en memoria, comunicación y computación, logrando un alto rendimiento en hardware NVIDIA GB300/GB200 para modelos desde miles de millones hasta billones de parámetros.

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)Tue, 10 Ma🤖 cs.LG

Structured Gossip: A Partition-Resilient DNS for Internet-Scale Dynamic Networks

El artículo presenta un sistema de DNS basado en gossip estructurado que utiliza tablas de dedos de DHT y operaciones conmutativas para lograr consistencia eventual y escalabilidad en redes dinámicas masivas, reduciendo la complejidad de mensajes y eliminando la necesidad de coordinación global ante particiones de red.

Priyanka Sinha, Dilys ThomasTue, 10 Ma💻 cs

ArcLight: A Lightweight LLM Inference Architecture for Many-Core CPUs

ArcLight es una arquitectura de inferencia ligera diseñada específicamente para CPUs multinúcleo que supera las limitaciones de acceso a memoria entre nodos NUMA mediante una gestión eficiente de memoria y paralelismo tensorial, logrando un aumento de hasta un 46% en el rendimiento de inferencia en comparación con los marcos de trabajo existentes.

Yuzhuang Xu, Xu Han, Yuxuan Li, Wanxiang CheTue, 10 Ma💬 cs.CL

A Lock-Free, Fully GPU-Resident Architecture for the Verification of Goldbach's Conjecture

Este trabajo presenta una arquitectura totalmente residente en GPU y sin bloqueos para la verificación masiva de la conjetura de Goldbach, que logra una eficiencia paralela superior al 98% y acelera el proceso en 45,6 veces al eliminar la comunicación con el host mediante un mecanismo de robo de trabajo asíncrono y el uso de memoria compartida optimizada.

Isaac Llorente-SaguerTue, 10 Ma🔢 math

The Consistency Correctness in CoPPar Tree

Este documento es un suplemento al artículo sobre el árbol CoPPar que proporciona una demostración detallada de la corrección de la arquitectura CoPPar.

Xincheng Yang, Kyle HaleTue, 10 Ma💻 cs

SageSched: Efficient LLM Scheduling Confronting Demand Uncertainty and Hybridity

SageSched es un planificador eficiente para inferencias de LLM que aborda la incertidumbre de la demanda y la hibridez de los recursos mediante la predicción de la longitud de salida y la modelización de costos computacionales y de memoria, logrando una mejora de eficiencia superior al 28,7%.

Zhenghao Gan, Yichen Bao, Yifei Liu, Chen Chen, Quan Chen, Minyi GuoTue, 10 Ma💻 cs

RAPID: Redundancy-Aware and Compatibility-Optimal Edge-Cloud Partitioned Inference for Diverse VLA models

El artículo presenta RAPID, un nuevo marco de inferencia colaborativa borde-nube para modelos de Visión-Lenguaje-Acción que mitiga la interferencia del ruido visual y preserva la continuidad física de los movimientos mediante la detección de redundancia, logrando una aceleración de hasta 1.73x con un sobrecosto mínimo.

Zihao Zheng, Sicheng Tian, Hangyu Cao, Chenyue Li, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Guojie Luo, Xiang ChenTue, 10 Ma💻 cs

ZK-ACE: Identity-Centric Zero-Knowledge Authorization for Post-Quantum Blockchain Systems

El artículo presenta ZK-ACE, un protocolo de autorización centrado en la identidad que elimina los objetos de firma poscuántica voluminosos en las transacciones de blockchain al reemplazarlos por declaraciones de autorización de conocimiento cero vinculadas a identidades, logrando así una reducción de un orden de magnitud en los datos visibles para el consenso y garantizando seguridad contra reutilización y suplantación.

Jian Sheng WangTue, 10 Ma💻 cs

ACE-GF-based Attestation Relay for PQC - Lightweight Mempool Propagation Without On-Path Proofs

El artículo presenta AR-ACE, un protocolo de retransmisión para entornos de blockchain post-cuánticos que elimina la sobrecarga de pruebas de validez en la ruta de propagación al utilizar atestaciones compactas, delegando la verificación agregada únicamente al constructor y logrando así una reducción de un orden de magnitud en el ancho de banda.

Jian Sheng WangTue, 10 Ma💻 cs

SI-ChainFL: Shapley-Incentivized Secure Federated Learning for High-Speed Rail Data Sharing

El artículo presenta SI-ChainFL, un marco de aprendizaje federado seguro y descentralizado para sistemas de ferrocarril de alta velocidad que utiliza valores de Shapley para incentivar la participación de clientes de alta calidad y mitigar ataques maliciosos mediante un protocolo de consenso basado en blockchain.

Mingjie Zhao, Cheng Dai, Fei Chen, Xin Chen, Kaoru Ota, Mianxiong Dong, Bing GuoTue, 10 Ma💻 cs

SafarDB: FPGA-Accelerated Distributed Transactions via Replicated Data Types

El artículo presenta SafarDB, un sistema de replicación de datos distribuidos acelerado por FPGA que, mediante la co-diseño de un motor de replicación conectado a la red y una interfaz de red residente en FPGA, logra reducir significativamente la latencia y aumentar el rendimiento de los tipos de datos replicados (CRDTs y WRDTs) en comparación con las implementaciones basadas en RDMA, al tiempo que mejora la resiliencia ante fallos y la velocidad de elección de líderes.

Javad Saberlatibari, Prithviraj Yuvaraj, Mohsen Lesani, Philip Brisk, Mohammad SadoghiTue, 10 Ma💻 cs

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

El informe presenta Covenant-72B, un modelo de lenguaje de 72 mil millones de parámetros pre-entrenado de manera competitiva a través de la mayor colaboración distribuida globalmente hasta la fecha, logrando una participación abierta y sin permisos mediante un protocolo blockchain y el optimizador SparseLoCo.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel DareTue, 10 Ma🤖 cs.LG

A Hodge-Based Framework for Service Operational Analysis in Serverless Platforms

Este artículo propone un marco basado en la descomposición de Hodge para analizar flujos operativos en plataformas serverless, identificando modos armónicos como propiedades estructurales y ofreciendo estrategias de remediación que evitan la reestructuración completa del sistema.

Gianluca Reali, Mauro FemminellaTue, 10 Ma💻 cs

TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction

El artículo presenta TA-RNN-Medical-Hybrid, un marco de aprendizaje profundo que combina codificación temporal continua, representaciones de conceptos médicos estandarizados y un mecanismo de atención jerárquica para mejorar la precisión y la interpretabilidad clínica en la predicción de riesgo de mortalidad en unidades de cuidados intensivos.

Zahra Jafari, Azadeh Zamanifar, Amirfarhad FarhadiTue, 10 Ma🤖 cs.LG

A Blockchain-based Traceability System for AI-Driven Engine Blade Inspection

Este artículo presenta BladeChain, un sistema basado en blockchain que garantiza la trazabilidad inmutable y auditable de las inspecciones de álabes de motores de avión mediante la integración de la gestión de múltiples partes interesadas, la programación automatizada y el rastreo de la procedencia de los modelos de inteligencia artificial.

Mahmoud Hafez, Eman Ouda, Mohammed A. Mohammed Eltoum, Khaled Salah, Yusra AbdulrahmanTue, 10 Ma💻 cs

← Anterior Siguiente →