Hierarchical Observe-Orient-Decide-Act Enabled UAV Swarms in Uncertain Environments: Frameworks, Potentials, and Challenges

Questo articolo propone un framework gerarchico basato sul ciclo OODA (Osserva-Orienta-Decidi-Agisci) distribuito su livelli cloud-edge-terminal e potenziato dalla virtualizzazione delle funzioni di rete, per migliorare l'adattabilità, l'efficienza e il processo decisionale cooperativo degli sciami di droni in ambienti incerti.

Ziye Jia, Yao Wu, Qihui Wu, Lijun He, Qiuming Zhu, Fuhui Zhou, Zhu HanWed, 11 Ma💻 cs

PIM-SHERPA: Software Method for On-device LLM Inference by Resolving PIM Memory Attribute and Layout Inconsistencies

Il paper introduce PIM-SHERPA, un metodo software che risolve le inconsistenze negli attributi e nel layout della memoria per abilitare un'efficiente inferenza di modelli linguistici di grandi dimensioni (LLM) su dispositivi edge tramite Processing-in-Memory (PIM), ottenendo risparmi significativi nella capacità di memoria senza compromettere le prestazioni.

Sunjung Lee, Sanghoon Cha, Hyeonsu Kim, Seungwoo Seo, Yuhwan Ro, Sukhan Lee, Byeongho Kim, Yongjun Park, Kyomin Sohn, Seungwon Lee, Jaehoon YuWed, 11 Ma💻 cs

Flash-KMeans: Fast and Memory-Efficient Exact K-Means

Il paper presenta Flash-KMeans, un'implementazione GPU ottimizzata che supera i colli di bottiglia di I/O e di contenzione delle versioni esistenti tramite le innovazioni FlashAssign e sort-inverse update, ottenendo speedup fino a 17,9 volte rispetto ai migliori baseline e fino a 200 volte rispetto alle librerie industriali come FAISS.

Shuo Yang, Haocheng Xi, Yilong Zhao, Muyang Li, Xiaoze Fan, Jintao Zhang, Han Cai, Yujun Lin, Xiuyu Li, Kurt Keutzer, Song Han, Chenfeng Xu, Ion StoicaWed, 11 Ma💻 cs

Rate-Distortion Bounds for Heterogeneous Random Fields on Finite Lattices

Questo articolo introduce un quadro teorico di rate-distortion a blocco finito per campi aleatori eterogenei su reticoli finiti, stabilendo limiti non asintotici e un'espansione del secondo ordine che quantificano l'impatto di correlazione spaziale, eterogeneità e vincoli di tassellazione sulle prestazioni di compressione lossy in ambito scientifico.

Sujata Sinha, Vishwas Rao, Robert Underwood, David Lenz, Sheng Di, Franck Cappello, Lingjia LiuWed, 11 Ma🔢 math

The Bureaucracy of Speed: Structural Equivalence Between Memory Consistency Models and Multi-Agent Authorization Revocation

Il documento propone un sistema di coerenza delle capacità (CCS) che mappa i modelli di consistenza della memoria sui meccanismi di revoca dell'autorizzazione, dimostrando tramite simulazione che la strategia RCC riduce drasticamente le operazioni non autorizzate rispetto ai metodi basati su TTL, eliminando la dipendenza dalla velocità di esecuzione degli agenti.

Vladyslav ParakhinWed, 11 Ma💻 cs

General Coded Computing in a Probabilistic Straggler Regime

Questo articolo analizza teoricamente e sperimentalmente la convergenza dell'errore di approssimazione verso zero in due schemi di calcolo codificato generale (BACC e LeTCC) in presenza di un regime probabilistico di server lenti, dimostrando che l'indipendenza delle interruzioni permette di ottenere risultati precisi anche quando il numero medio di server lenti scala con la dimensione totale del sistema.

Parsa Moradi, Mohammad Ali Maddah-AliTue, 10 Ma🤖 cs.LG

EROICA: Online Performance Troubleshooting for Large-scale Model Training

Il paper presenta EROICA, il primo sistema di risoluzione dei problemi di prestazioni online per l'addestramento di modelli su larga scala, che combina profilazione dettagliata e osservabilità differenziale per diagnosticare con successo sia problemi hardware che software su cluster di GPU di produzione.

Yu Guan, Zhiyu Yin, Haoyu Chen, Sheng Cheng, Chaojie Yang, Kun Qian, Tianyin Xu, Pengcheng Zhang, Yang Zhang, Hanyu Zhao, Yong Li, Wei Lin, Dennis Cai, Ennan ZhaiTue, 10 Ma🤖 cs.LG

Co-LoRA: Collaborative Model Personalization on Heterogeneous Multi-Modal Clients

Il paper propone Co-LoRA, un metodo di apprendimento federato personalizzato che affronta l'eterogeneità sia dei dati che delle architetture dei modelli attraverso una strategia di aggregazione consapevole della rilevanza del compito e un modulo dimensionale-invariante, validato su un nuovo benchmark multi-modale che dimostra prestazioni superiori rispetto agli stati dell'arte.

Minhyuk Seo, Taeheon Kim, Hankook Lee, Jonghyun Choi, Tinne TuytelaarsTue, 10 Ma🤖 cs.LG

Tiny but Mighty: A Software-Hardware Co-Design Approach for Efficient Multimodal Inference on Battery-Powered Small Devices

Il paper presenta NANOMIND, un framework di co-progettazione hardware-software che ottimizza l'inferenza di modelli multimodali su dispositivi portatili alimentati a batteria suddividendo i modelli in moduli eseguiti su acceleratori eterogenei, ottenendo così un'efficienza energetica superiore e un funzionamento completamente offline.

Yilong Li, Shuai Zhang, Yijing Zeng, Hao Zhang, Xinmiao Xiong, Jingyu Liu, Pan Hu, Suman BanerjeeTue, 10 Ma💬 cs.CL

NEST: Network- and Memory-Aware Device Placement For Distributed Deep Learning

Il paper presenta NEST, un framework di posizionamento dei dispositivi per l'addestramento distribuito di deep learning che unifica la parallelizzazione, la modellazione della topologia di rete e la fattibilità della memoria tramite programmazione dinamica strutturata, ottenendo fino a 2,43 volte una maggiore velocità di elaborazione rispetto alle soluzioni esistenti.

Irene Wang, Vishnu Varma Venkata, Arvind Krishnamurthy, Divya MahajanTue, 10 Ma🤖 cs.LG

Uber's Failover Architecture: Reconciling Reliability and Efficiency in Hyperscale Microservice Infrastructure

Il documento presenta l'architettura di failover di Uber (UFA), un sistema che ottimizza l'affidabilità e l'efficienza dei costi su larga scala sostituendo il modello di ridondanza 2x con un approccio differenziato basato sulla criticità del servizio, riducendo così il provisioning di base da 2x a 1,3x e liberando oltre un milione di core CPU mantenendo un'uptime del 99,97%.

Mayank Bansal, Milind Chabbi, Kenneth Bogh, Srikanth Prodduturi, Kevin Xu, Amit Kumar, David Bell, Ranjib Dey, Yufei Ren, Sachin Sharma, Juan Marcano, Shriniket Kale, Subhav Pradhan, Ivan Beschastnikh, Miguel Covarrubias, Chien-Chih Liao, Sandeep Koushik Sheshadri, Wen Luo, Kai Song, Ashish Samant, Sahil Rihan, Nimish Sheth, Uday Kiran MedisettyTue, 10 Ma💻 cs