cs.DC papers | Gist.Science

A Survey on Decentralized Federated Learning

Deze survey biedt een overzicht van decentrale federatieve leermethodes tot begin 2026, classificeert ze in traditionele en blockchain-gebaseerde families, stelt een nieuwe taxonomie voor die gebaseerd is op uitdagingen, en identificeert kritieke onderzoekslacunes en toekomstige richtingen op het gebied van beveiliging, privacy en prikkels.

Edoardo Gabrielli, Anthony Di Pietro, Dario Fenoglio, Giovanni Pica, Gabriele TolomeiWed, 11 Ma🤖 cs.LG

Enhancing Computational Efficiency in Multiscale Systems Using Deep Learning of Coordinates and Flow Maps

Dit paper presenteert een diep learning-gebaseerd raamwerk dat door gezamenlijke ontdekking van coördinaten en stroomkaarten de computationele efficiëntie van multischaal-systemen verbetert met state-of-the-art voorspellende nauwkeurigheid en lagere kosten.

Asif Hamid, Danish Rafiq, Shahkar Ahmad Nahvi, Mohammad Abid BazazWed, 11 Ma🤖 cs.LG

Scalable and Performant Data Loading

Dit paper introduceert SPDL, een open-source bibliotheek die de prestaties van GPU-data-laden aanzienlijk verbetert door de Python GIL te omzeilen, wat resulteert in een 74% snellere verwerking van ImageNet en een lagere CPU- en geheugengebruik vergeleken met PyTorch DataLoader.

Moto Hira, Christian Puhrsch, Valentin Andrei, Roman Malinovskyy, Gael Le Lan, Abhinandan Krishnan, Joseph Cummings, Victor Bourgin, Olga Gerasimova, Miguel Martin, Gokul Gunasekaran, Yuta Inoue, Alex J Turner, Raghuraman KrishnamoorthiWed, 11 Ma💻 cs

PhD Thesis Summary: Methods for Reliability Assessment and Enhancement of Deep Neural Network Hardware Accelerators

Deze proefschriftsamenvatting presenteert kostenefficiënte methoden voor het beoordelen en verbeteren van de betrouwbaarheid van DNN-hardwareversnellers, waaronder een nieuwe analytische tool en de real-time, zero-overhead techniek AdAM die fouttolerantie biedt met aanzienlijk lagere hardwarekosten.

Mahdi TaheriWed, 11 Ma🤖 cs.AI

ARKV: Adaptive and Resource-Efficient KV Cache Management under Limited Memory Budget for Long-Context Inference in LLMs

Dit paper introduceert ARKV, een lichtgewicht en adaptief framework dat de geheugenefficiëntie van Large Language Models bij lange contexten aanzienlijk verbetert door dynamisch precisieniveaus toe te wijzen aan tokens op basis van hun belang, waardoor het KV-cachegebruik met een factor 4 wordt gereduceerd zonder significante kwaliteitsverlies.

Jianlong Lei, Shashikant IlagerWed, 11 Ma🤖 cs.AI

RSH-SpMM: A Row-Structured Hybrid Kernel for Sparse Matrix-Matrix Multiplication on GPUs

Het artikel introduceert RSH-SpMM, een hybride kernel voor GPU's die door middel van adaptieve rij-partitionering en een RS-Tile-representatie de prestaties van Sparse Matrix-Matrix Multiplication (SpMM) bij onregelmatige sparsiteit aanzienlijk verbetert met een versnelling van 1,27x tot 6,13x ten opzichte van bestaande methoden.

Aiying Li, Jingwei Sun, Han Li, Wence Ji, Guangzhong SunWed, 11 Ma💻 cs

Benchmarking Federated Learning in Edge Computing Environments: A Systematic Review and Performance Evaluation

Dit artikel presenteert een systematische review en prestatie-evaluatie van federatief leertechnieken in edge-computingomgevingen, waarbij vijf toonaangevende algoritmen worden vergeleken op basis van nauwkeurigheid, communicatie-efficiëntie en energieconsumptie om bestaande uitdagingen te identificeren en een onderzoeksagenda voor de toekomst te schetsen.

Sales Aribe Jr., Gil Nicholas CagandeWed, 11 Ma🤖 cs.AI

Autonomous Edge-Deployed AI Agents for Electric Vehicle Charging Infrastructure Management

Dit artikel introduceert Auralink SDC, een architectuur met edge-geplaatste AI-agenten die autonome, veilige en responsieve beheeroplossingen biedt voor openbare laadinfrastructuur, waardoor de hoge uitvalpercentages en trage reparatietijden van bestaande cloudsystemen worden overwonnen.

Mohammed CherifiWed, 11 Ma🤖 cs.AI

Sensitivity-Guided Framework for Pruned and Quantized Reservoir Computing Accelerators

Dit artikel presenteert een compressieframework voor Reservoir Computing dat gebruikmaakt van een op gevoeligheid gebaseerde prune-mechanisme om de afweging tussen kwantisatie, pruning en hardware-efficiëntie te optimaliseren, wat resulteert in aanzienlijke verbeteringen in resourcegebruik en energie-efficiëntie op FPGA's zonder merkbare nauwkeurigheidsverlies.

Atousa Jafari, Mahdi Taheri, Hassan Ghasemzadeh Mohammadi, Christian Herglotz, Marco PlatznerWed, 11 Ma🤖 cs.AI

Adaptive Multi-Objective Tiered Storage Configuration for KV Cache in LLM Service

Dit paper introduceert Kareto, een geoptimaliseerde tool voor het dynamisch beheren van gestapelde opslag voor KV-caches in LLM-diensten, die door het vinden van de Pareto-grens tussen kosten, doorvoer en latentie aanzienlijke verbeteringen boekt ten opzichte van statische configuraties.

Xianzhe Zheng, Zhengheng Wang, Ruiyan Ma, Rui Wang, Xiyu Wang, Rui Chen, Peng Zhang, Sicheng Pan, Zhangheng Huang, Chenxin Wu, Yi Zhang, Bo Cai, Kan Liu, Teng Ma, Yin Du, Dong Deng, Sai Wu, Guoyun Zhu, Wei Zhang, Feifei LiWed, 11 Ma💻 cs

Zipage: Maintain High Request Concurrency for LLM Reasoning through Compressed PagedAttention

Dit paper introduceert Zipage, een hoog-concurrentie LLM-inferentie-engine die Compressed PagedAttention combineert met geavanceerde scheduling en compressie om de geheugenbottleneck bij redenerende modellen op te lossen en zo een snelheidswinst van meer dan 2,1x te bereiken met behoud van 95% van de prestaties.

Mengqi Liao, Lu Wang, Chaoyun Zhang, Bo Qiao, Si Qin, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang, Huaiyu WanWed, 11 Ma🤖 cs.AI

Extension of ACETONE C code generator for multi-core architectures

Dit artikel introduceert een uitbreiding van de ACETONE C-codegenerator om parallelle code voor multi-core architecturen te genereren, waarbij het processor-toewijzingsprobleem formeel wordt gedefinieerd en de staat van de kunst wordt onderzocht.

Yanis Aït-Aïssa (IRIT-TRACES), Thomas Carle (IRIT-TRACES), Sergei Chichin, Benjamin Lesage, Claire PagettiWed, 11 Ma💻 cs

Serving Compound Inference Systems on Datacenter GPUs

Dit paper introduceert JigsawServe, het eerste serveerframework dat end-to-end latency, nauwkeurigheid en GPU-kosten optimaliseert door adaptief modelvarianten te kiezen en ruimtelijke GPU-partitionering toe te passen voor compound inference-systemen, wat resulteert in een tot 11,3 keer hogere doorvoer en aanzienlijk lager resourcegebruik dan bestaande oplossingen.

Sriram Devata, Rahul Singh, Sarita AdveWed, 11 Ma💻 cs

DeZent: Decentralized z-Anonymity with Privacy-Preserving Coordination

Dit paper introduceert deZent, een gedecentraliseerde implementatie van z-anonimiteit die privacy in sensornetwerken verbetert door lokale anonimiseringsprocessen te coördineren met behulp van een stochastische telstructuur en een beveiligde som, waardoor de afhankelijkheid van een centraal entiteit wordt verminderd en de communicatie-overhead wordt verlaagd zonder in te leveren op de prestaties.

Carolin Brunn, Florian TschorschWed, 11 Ma💻 cs

FedLECC: Cluster- and Loss-Guided Client Selection for Federated Learning under Non-IID Data

Dit paper introduceert FedLECC, een lichtgewicht client-selectiestrategie voor Federated Learning die clusters en lokale verliezen gebruikt om onder niet-IID-omstandigheden de testnauwkeurigheid te verhogen en communicatiekosten aanzienlijk te verlagen.

Daniel M. Jimenez-Gutierrez, Giovanni Giunta, Mehrdad Hassanzadeh, Aris Anagnostopoulos, Ioannis Chatzigiannakis, Andrea VitalettiWed, 11 Ma🤖 cs.AI

A Consensus-Driven Multi-LLM Pipeline for Missing-Person Investigations

Dit paper introduceert Guardian, een end-to-end systeem dat een meermodel-pipeline met consensusmechanismen en QLoRA-finetuning gebruikt om de eerste 72 uur van zoektochten naar vermiste personen te ondersteunen door middel van gecontroleerde, auditabele informatie-extractie.

Joshua Castillo, Ravi MukkamalaWed, 11 Ma🤖 cs.AI

The $qs$ Inequality: Quantifying the Double Penalty of Mixture-of-Experts at Inference

Dit paper introduceert de $qs$ -ongelijkheid om aan te tonen dat MoE-modellen tijdens inferentie structureel worden benadeeld door hergebruiksfragmentatie, waardoor ze bij lange contexten vaak minder efficiënt zijn dan kwalitatief gelijkwaardige dichte modellen.

Vignesh Adhinarayanan, Nuwan JayasenaWed, 11 Ma🤖 cs.LG

Lockbox -- A Zero Trust Architecture for Secure Processing of Sensitive Cloud Workloads

Dit artikel introduceert Lockbox, een Zero Trust-architectuur die geavanceerde isolatie, encryptie en strikte toegangscontroles implementeert om de veilige verwerking van gevoelige cloud-workloads, inclusief AI-gestuurde analyses, binnen enterprise-omgevingen mogelijk te maken.

Vamshi Krishna Thotempudi, Mahima Agarwal, Raghav Batta, Anjali MangalWed, 11 Ma💻 cs

Two Teachers Better Than One: Hardware-Physics Co-Guided Distributed Scientific Machine Learning

Dit paper introduceert EPIC, een gedistribueerd SciML-framework dat hardware- en fysica-gestuurde technieken combineert om communicatiekosten en latentie aanzienlijk te verminderen terwijl de fysieke nauwkeurigheid behouden blijft.

Yuchen Yuan, Junhuan Yang, Hao Wan, Yipei Liu, Hanhan Wu, Youzuo Lin, Lei YangWed, 11 Ma🤖 cs.LG

Accelerating High-Order Finite Element Simulations at Extreme Scale with FP64 Tensor Cores

Deze paper demonstreert dat het gebruik van FP64-tensorcores op NVIDIA-GPU's, gecombineerd met kernelfusie-optimalisaties, de prestaties en energie-efficiëntie van high-order eindige-elementensimulaties aanzienlijk verbetert, met een schaalbaarheid tot bijna 10.000 GPU's op het exascale-systeem Alps.

Jiqun Tu, Ian Karlin, John Camier, Veselin Dobrev, Tzanio Kolev, Stefan Henneking, Omar GhattasWed, 11 Ma💻 cs

cs.DC