Communication-Efficient Multimodal Federated Learning: Joint Modality and Client Selection

Il paper presenta MFedMC, un framework di apprendimento federato multimodale efficiente nelle comunicazioni che, attraverso un'architettura disaccoppiata e un algoritmo di selezione congiunta di client e modalità basato su valori di Shapley, riduce l'overhead di comunicazione di oltre 20 volte mantenendo prestazioni comparabili ai metodi esistenti.

Liangqi Yuan, Dong-Jun Han, Su Wang, Devesh Upadhyay, Christopher G. BrintonThu, 12 Ma🤖 cs.LG

Architecture-Aware LLM Inference Optimization on AMD Instinct GPUs: A Comprehensive Benchmark and Deployment Study

Questo studio presenta una valutazione trasversale dell'inferenza di LLM su GPU AMD Instinct MI325X, dimostrando che l'ottimizzazione consapevole dell'architettura è fondamentale per massimizzare il throughput e la stabilità, evidenziando come modelli MoE+MLA e GQA richiedano configurazioni specifiche del runtime AITER e blocchi di cache diversi per raggiungere prestazioni competitive.

Athos GeorgiouThu, 12 Ma🤖 cs.AI

Pooling Engram Conditional Memory in Large Language Models using CXL

Questo articolo propone l'utilizzo di un pool di memoria CXL per archiviare la memoria engramma condizionale nei grandi modelli linguistici, integrandolo in SGLang per ottenere prestazioni end-to-end vicine a quelle della DRAM e offrire una soluzione di storage scalabile ed economica senza compromettere l'inferenza.

Ruiyang Ma, Teng Ma, Zhiyuan Su, Hantian Zha, Xinpeng Zhao, Xuchun Shang, Xingrui Yi, Zheng Liu, Zhu Cao, An Wu, Zhichong Dou, Ziqian Liu, Daikang Kuang, Guojie LuoThu, 12 Ma💻 cs

AgentServe: Algorithm-System Co-Design for Efficient Agentic AI Serving on a Consumer-Grade GPU

Il paper presenta AgentServe, un sistema di serving per AI agenti su GPU consumer che, attraverso la co-progettazione algoritmo-sistema e l'isolamento delle fasi di prefill e decode, garantisce un'esecuzione multi-agente stabile con riduzioni fino a 2,8 volte nel tempo di primo token e 2,7 volte nel tempo per token rispetto alle soluzioni attuali.

Yuning Zhang, Yan Yan, Nan Yang, Dong YuanThu, 12 Ma💻 cs

COHORT: Hybrid RL for Collaborative Large DNN Inference on Multi-Robot Systems Under Real-Time Constraints

Il paper presenta COHORT, un framework basato su ROS che utilizza un approccio ibrido di apprendimento per rinforzo (offline e online) per ottimizzare l'inferenza collaborativa di grandi reti neurali su sistemi multi-robot, riducendo il consumo energetico e migliorando l'utilizzo della GPU nel rispetto dei vincoli temporali reali.

Mohammad Saeid Anwar, Anuradha Ravi, Indrajeet Ghosh, Gaurav Shinde, Carl Busart, Nirmalya RoyThu, 12 Ma💻 cs

Aceso: Carbon-Aware and Cost-Effective Microservice Placement for Small and Medium-sized Enterprises

Il paper presenta Aceso, un sistema adattivo che ottimizza il posizionamento dei microservizi per le PMI considerando vincoli di carbonio, costi e latenza, riducendo le emissioni di carbonio del 37,4% e i costi operativi del 3,6% rispetto alle distribuzioni statiche.

Georgia Christofidi, Francisco Álvarez-Terribas, Ioannis Roumpos, Nicolas Kourtellis, Jesus Omaña Iglesias, Thaleia Dimitra DoudaliThu, 12 Ma💻 cs

Data Augmentation and Convolutional Network Architecture Influence on Distributed Learning

Questo studio analizza come le architetture delle reti neurali convoluzionali influenzino l'accuratezza del modello e l'efficienza computazionale nell'apprendimento distribuito, fornendo indicazioni per ottimizzare il loro dispiegamento in scenari ad alta intensità di risorse.

Victor Forattini Jansen, Emanuel Teixeira Martins, Yasmin Souza Lima, Flavio de Oliveira Silva, Rodrigo Moreira, Larissa Ferreira Rodrigues MoreiraThu, 12 Ma💻 cs

Reference Architecture of a Quantum-Centric Supercomputer

Questo articolo presenta un'architettura di riferimento e una roadmap per i supercomputer centrati sul quantum (QCSC), sistemi co-progettati che integrano unità di elaborazione quantistica, GPU e CPU per superare le limitazioni attuali e accelerare la scoperta di algoritmi ibridi in ambiti come la chimica e la scienza dei materiali.

Seetharami Seelam, Jerry M. Chow, Antonio Córcoles, Sarah Sheldon, Tushar Mittal, Abhinav Kandala, Sean Dague, Ian Hincks, Hiroshi Horii, Blake Johnson, Michael Le, Hani Jamjoom, Jay M. GambettaThu, 12 Ma⚡ eess