cs.DC Arbeiten | Gist.Science

Link Wars: The Semantic Crisis. Is the debate over or is it just beginning?

Die Arbeit argumentiert, dass die aktuelle Fragmentierung von Interconnect-Technologien auf einem fundamentalen semantischen Mangel beruht, der durch die Einführung offener, bilateraler Transaktionsprimitive im Open Atomic Ethernet-Projekt des Open Compute Project behoben werden könnte, um Konsistenz ohne globale Barrieren zu gewährleisten.

Paul BorrillTue, 10 Ma💻 cs

Agentic AI-Driven UAV Network Deployment: A LLM-Enhanced Exact Potential Game Approach

Diese Arbeit stellt einen Agentic-AI-gestützten Rahmen vor, der durch die Kombination von exakten Potentialspielen auf verschiedenen räumlichen Skalen und einem Large Language Model zur automatischen Parametrierung die Topologieoptimierung von UAV-Netzwerken hinsichtlich Energieeffizienz, Latenz und Durchsatz verbessert.

Xin Tang, Qian Chen, Binhan Liao, Yaqi Zhang, Jianxin Chen, Changyuan Zhao, Junchuan Fan, Junxi Tian, Xiaohuan LiTue, 10 Ma💻 cs

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

Die Studie stellt MAS-H2 vor, ein hierarchisches Multi-Agenten-System für Kubernetes, das durch die Integration von Geschäftsstrategien, proaktiver Planung und Ausführung die reaktiven Grenzen nativer Autoscaler überwindet und so in dynamischen Szenarien signifikant weniger Ressourcenverschwendung sowie eine höhere Stabilität und Zero-Downtime-Migration ermöglicht.

Hamed Hamzeh, Parisa VahdatianTue, 10 Ma🤖 cs.LG

Performance Evaluation of Automated Multi-Service Deployment in Edge-Cloud Environments with the CODECO Toolkit

Die Studie bewertet das Open-Source-Framework CODECO und zeigt, dass es im Vergleich zu herkömmlichen Kubernetes-Workflows den manuellen Aufwand bei der Bereitstellung von Container-Mikrodiensten in heterogenen Edge-Cloud-Umgebungen erheblich reduziert, ohne dabei die Laufzeitleistung oder Ressourceneffizienz zu beeinträchtigen.

Georgios Koukis, Ioannis Dermentzis, Vassilis Tsaoussidis, Jan Lenke, Fabian Wolk, Daniel Uceda, Guillermo Sanchez, Miguel A. Puentes, Javier Serrano, Panagiotis Karamolegkos, Rute C. SofiaTue, 10 Ma💻 cs

Mitigating the Memory Bottleneck with Machine Learning-Driven and Data-Aware Microarchitectural Techniques

Diese Dissertation schlägt vor, den Engpass im Speichersystem durch den Übergang von datenagnostischen zu dateninformierten Mikroarchitektur-Techniken zu überwinden, die maschinelles Lernen und semantische Datenmerkmale nutzen, um Leistung und Energieeffizienz signifikant zu steigern.

Rahul BeraTue, 10 Ma🤖 cs.LG

Scalable Training of Mixture-of-Experts Models with Megatron Core

Dieser Bericht stellt das Megatron Core-Framework vor, das durch integrierte Optimierungen in den Bereichen Speicher, Kommunikation und Berechnung sowie Unterstützung für parallele Verfahren und niedrige Präzision das skalierbare Training von Mixture-of-Experts-Modellen auf Tausenden von GPUs ermöglicht und dabei hohe Rechenleistung auf NVIDIA-Hardware erreicht.

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)Tue, 10 Ma🤖 cs.LG

Structured Gossip: A Partition-Resilient DNS for Internet-Scale Dynamic Networks

Die Arbeit stellt „Structured Gossip DNS" vor, ein partitionstolerantes DNS-System für Internet-Skala, das durch die Nutzung von DHT-Fingertabellen und passiver Stabilisierung die Nachrichtenkomplexität auf $O(n/\log n)$ reduziert und dabei ohne globale Koordination eine eventual consistency gewährleistet.

Priyanka Sinha, Dilys ThomasTue, 10 Ma💻 cs

ArcLight: A Lightweight LLM Inference Architecture for Many-Core CPUs

ArcLight ist eine neuartige, leichte Inferenzarchitektur für viele Kern-CPU-Plattformen, die durch optimiertes Speichermanagement, Thread-Scheduling und fein abgestimmte Tensor-Parallelität den Overhead beim zugriff auf NUMA-Knoten reduziert und damit den Durchsatz im Vergleich zu bestehenden Frameworks um bis zu 46 % steigert.

Yuzhuang Xu, Xu Han, Yuxuan Li, Wanxiang CheTue, 10 Ma💬 cs.CL

A Lock-Free, Fully GPU-Resident Architecture for the Verification of Goldbach's Conjecture

Die vorgestellte Arbeit stellt eine vollständig GPU-residente, sperrenfreie Multi-GPU-Architektur vor, die durch den vollständigen Umzug des Sieb-Generierungsprozesses auf die GPU und die Einführung eines asynchronen Work-Stealing-Pools die Goldbach-Vermutung bis zu $10^{13}$ mit einer Geschwindigkeit von 133,5 Sekunden auf einem Vier-GPU-System verifiziert und dabei eine algorithmische Beschleunigung von 45,6-fach gegenüber vorherigen Ansätzen erreicht.

Isaac Llorente-SaguerTue, 10 Ma🔢 math

The Consistency Correctness in CoPPar Tree

Dieses Dokument ist eine ergänzende Veröffentlichung zum CoPPar Tree, die einen detaillierten Korrektheitsbeweis für die CoPPar-Architektur liefert.

Xincheng Yang, Kyle HaleTue, 10 Ma💻 cs

SageSched: Efficient LLM Scheduling Confronting Demand Uncertainty and Hybridity

Das Paper stellt SageSched vor, einen effizienten LLM-Scheduler, der durch die Vorhersage der Ausgabe-Länge und die Berücksichtigung sowohl von Rechen- als auch von Speicherkosten bei unsicherer Nachfrage die Gesamteffizienz um über 28,7 % steigert.

Zhenghao Gan, Yichen Bao, Yifei Liu, Chen Chen, Quan Chen, Minyi GuoTue, 10 Ma💻 cs

RAPID: Redundancy-Aware and Compatibility-Optimal Edge-Cloud Partitioned Inference for Diverse VLA models

Das Paper stellt RAPID vor, ein redundanzbewusstes und kompatibilitätsoptimiertes Edge-Cloud-Inferenzframework für diverse Vision-Language-Action-Modelle, das durch die Überwindung von visuellen Störungen und die Berücksichtigung redundanter Schritte die Echtzeitfähigkeit verbessert und dabei eine Geschwindigkeitssteigerung von bis zu 1,73-fach bei einem geringen Overhead von 5–7 % erreicht.

Zihao Zheng, Sicheng Tian, Hangyu Cao, Chenyue Li, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Guojie Luo, Xiang ChenTue, 10 Ma💻 cs

ZK-ACE: Identity-Centric Zero-Knowledge Authorization for Post-Quantum Blockchain Systems

Die Arbeit stellt ZK-ACE vor, eine identitätszentrierte Zero-Knowledge-Autorisierungsschicht für Post-Quantum-Blockchains, die durch den Ersatz von Transaktionssignaturen zugunsten von identitätsgebundenen Beweisen die on-chain-Datenmenge um eine Größenordnung reduziert und gleichzeitig Sicherheit gegen Replay-Angriffe sowie Substitution gewährleistet.

Jian Sheng WangTue, 10 Ma💻 cs

ACE-GF-based Attestation Relay for PQC - Lightweight Mempool Propagation Without On-Path Proofs

Die Arbeit stellt AR-ACE vor, ein PQC-fähiges Attestierungs-Relay-Protokoll für Blockchains, das durch die Verlagerung von Validitätsbeweisen vom Propagationspfad auf den Builder die Bandbreitenanforderungen für die Mempool-Propagierung um eine Größenordnung reduziert.

Jian Sheng WangTue, 10 Ma💻 cs

SI-ChainFL: Shapley-Incentivized Secure Federated Learning for High-Speed Rail Data Sharing

Der Artikel stellt SI-ChainFL vor, ein dezentrales, sicherheitsorientiertes Framework für das Federated Learning im Hochgeschwindigkeitszugverkehr, das durch eine Shapley-Wert-basierte Anreizmechanik und Blockchain-Konsens sowohl Datenqualität fördert als auch Angriffe widersteht.

Mingjie Zhao, Cheng Dai, Fei Chen, Xin Chen, Kaoru Ota, Mianxiong Dong, Bing GuoTue, 10 Ma💻 cs

SafarDB: FPGA-Accelerated Distributed Transactions via Replicated Data Types

Die Arbeit stellt SafarDB vor, ein FPGA-beschleunigtes verteiltes Transaktionssystem, das durch die direkte Anbindung eines FPGA-Accelerators an das Netzwerk und die Co-Design-Architektur von Replikations-Engine und Netzwerkschnittstelle die Latenz und den Durchsatz für CRDTs und WRDTs im Vergleich zu RDMA-basierten Lösungen erheblich verbessert und gleichzeitig die Fehlertoleranz erhöht.

Javad Saberlatibari, Prithviraj Yuvaraj, Mohsen Lesani, Philip Brisk, Mohammad SadoghiTue, 10 Ma💻 cs

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

Die Arbeit stellt Covenant-72B vor, ein 72-Milliarden-Parameter-Sprachmodell, das durch den bisher größten kollaborativen, global verteilten Pre-Training-Lauf mit erlaubnisfreier Teilnahme über eine Blockchain-Protokoll und den effizienten SparseLoCo-Optimierer trainiert wurde und dabei mit zentralisierten Modellen vergleichbare Leistung erbringt.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel DareTue, 10 Ma🤖 cs.LG

A Hodge-Based Framework for Service Operational Analysis in Serverless Platforms

Diese Arbeit stellt einen topologischen Rahmen vor, der die Hodge-Zerlegung nutzt, um in serverlosen Plattformen auftretende komplexe Informationsflüsse in lokal korrigierbare Komponenten und globale harmonische Moden zu zerlegen, um strukturelle Ineffizienzen zu identifizieren und gezielte Remediationsstrategien zu entwickeln.

Gianluca Reali, Mauro FemminellaTue, 10 Ma💻 cs

TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction

Die Studie stellt TA-RNN-Medical-Hybrid vor, ein interpretierbares, zeitaufmerksames Deep-Learning-Framework, das durch die Integration kontinuierlicher Zeitkodierung und medizinischer Konzeptdarstellungen die Sterblichkeitsrisiko-Vorhersage in Intensivstationen sowohl präziser als auch klinisch nachvollziehbarer macht.

Zahra Jafari, Azadeh Zamanifar, Amirfarhad FarhadiTue, 10 Ma🤖 cs.LG

A Blockchain-based Traceability System for AI-Driven Engine Blade Inspection

Die Arbeit stellt BladeChain vor, ein auf Hyperledger Fabric basierendes Blockchain-System, das durch die Integration von KI-Modell-Herkunft, automatisierten Inspektionsauslösungen und einer unveränderlichen, mehrstufigen Ledger-Struktur eine fälschungssichere und vollständig nachvollziehbare Lebenszyklus-Verfolgung für Flugzeugtriebwerksschaufeln ermöglicht.

Mahmoud Hafez, Eman Ouda, Mohammed A. Mohammed Eltoum, Khaled Salah, Yusra AbdulrahmanTue, 10 Ma💻 cs

← Zurück Weiter →