cs.LG articoli | Gist.Science

Service Placement in Small Cell Networks Using Distributed Best Arm Identification in Linear Bandits

Il paper propone un algoritmo distribuito e adattivo di identificazione del "braccio migliore" basato su banditi lineari, che permette alle piccole celle di collaborare per selezionare in modo efficiente i servizi da collocare al bordo della rete, riducendo la latenza e accelerando l'apprendimento rispetto al cloud.

Mariam Yahya, Aydin Sezgin, Setareh Maghsudi2026-03-11🤖 cs.LG

Convergence Rate for the Last Iterate of Stochastic Gradient Descent Schemes

Questo studio stabilisce nuovi tassi di convergenza per l'ultima iterazione degli algoritmi di discesa del gradiente stocastico (SGD) e del heavy ball stocastico (SHB) su funzioni obiettivo globalmente convesse o non convesse con gradiente Hölderiano, dimostrando risultati tramite la disuguaglianza discreta di Gronwall senza ricorrere al teorema di Robbins-Siegmund.

Marcel Hudiani2026-03-11🤖 cs.LG

Operator Learning for Consolidation: An Architectural Comparison for DeepONet Variants

Questo studio valuta diverse architetture DeepONet per il problema della consolidazione geotecnica, dimostrando che un modello potenziato con caratteristiche di Fourier nel trunk net supera le limitazioni delle configurazioni standard e offre un'accelerazione computazionale significativa, specialmente in scenari 3D, facilitando così l'analisi dell'incertezza.

Yongjin Choi, Chenying Liu, Jorge Macedo2026-03-11🤖 cs.LG

Langevin Flows for Modeling Neural Latent Dynamics

Il paper introduce LangevinFlow, un modello di Variational Auto-Encoder sequenziale ispirato alla fisica che utilizza l'equazione di Langevin sottosmorzata e potenziali basati su oscillatori accoppiati per catturare con successo la dinamica latente delle popolazioni neurali, superando gli stati dell'arte nella previsione delle attività neuronali e nel decoding dei comportamenti.

Yue Song, T. Anderson Keller, Yisong Yue, Pietro Perona, Max Welling2026-03-11🤖 cs.LG

Latent Policy Steering with Embodiment-Agnostic Pretrained World Models

Il paper presenta Latent Policy Steering (LPS), un metodo che migliora le politiche visuomotorie robotiche in scenari con pochi dati preaddestando un modello del mondo su rappresentazioni di flusso ottico agnostiche rispetto all'effettore per sfruttare dati eterogenei, per poi affinare la politica e selezionare le azioni ottimali tramite una funzione di valore appresa.

Yiqi Wang, Mrinal Verghese, Jeff Schneider2026-03-11🤖 cs.AI

Multimodal LLM-assisted Evolutionary Search for Programmatic Control Policies

Questo lavoro introduce MLES, un nuovo approccio che combina modelli linguistici multimodali e ricerca evolutiva per generare automaticamente politiche di controllo programmatiche trasparenti e verificabili, ottenendo prestazioni comparabili ai metodi di deep reinforcement learning tradizionali ma con una logica interpretabile dall'uomo.

Qinglong Hu, Xialiang Tong, Mingxuan Yuan, Fei Liu, Zhichao Lu, Qingfu Zhang2026-03-11🤖 cs.LG

CTRL Your Shift: Clustered Transfer Residual Learning for Many Small Datasets

Il paper introduce CTRL, un metodo di apprendimento meta che combina l'apprendimento residuo e il clustering adattivo per migliorare l'accuratezza e preservare l'eterogeneità delle fonti in contesti caratterizzati da molti piccoli dataset con distribuzioni diverse, dimostrando prestazioni superiori rispetto agli standard attuali su cinque dataset reali, incluso un programma nazionale di asilo in Svizzera.

Gauri Jain, Dominik Rothenhäusler, Kirk Bansak, Elisabeth Paulson2026-03-11🤖 cs.LG

Singing Syllabi with Virtual Avatars: Enhancing Student Engagement Through AI-Generated Music and Digital Embodiment

Questo studio propone un approccio innovativo che utilizza avatar virtuali e musica generata dall'intelligenza artificiale per trasformare i programmi didattici testuali in canzoni audiovisive, migliorando significativamente l'engagement, la comprensione e il ricordo delle informazioni essenziali da parte degli studenti.

Xinxing Wu2026-03-11🤖 cs.AI

MuFlex: A Scalable, Physics-based Platform for Multi-Building Flexibility Analysis and Coordination

Il documento presenta MuFlex, una piattaforma open-source scalabile e basata su principi fisici che facilita il coordinamento della flessibilità energetica tra più edifici tramite simulazione coesa di modelli dettagliati e l'addestramento di agenti di Reinforcement Learning, dimostrando una riduzione significativa della domanda di picco aggregata mantenendo il comfort interno.

Ziyan Wu, Ivan Korolija, Rui Tang2026-03-11⚡ eess

RF-Informed Graph Neural Networks for Accurate and Data-Efficient Circuit Performance Prediction

Questo lavoro presenta un framework leggero e basato su reti neurali grafiche (GNN) arricchito da conoscenze specifiche del dominio RF, in grado di prevedere con elevata accuratezza e in modo efficiente dal punto di vista dei dati le prestazioni di circuiti attivi a radiofrequenza, superando significativamente le prestazioni degli approcci attuali grazie a una migliore generalizzazione tra diverse topologie.

Anahita Asadi, Leonid Popryho, Inna Partin-Vaisband2026-03-11🤖 cs.LG

Iterative In-Context Learning to Enhance LLMs Abstract Reasoning: The Case-Study of Algebraic Tasks

Questo studio introduce una metodologia di apprendimento in contesto iterativo con selezione adattiva degli esempi, dimostrando che tale approccio, integrato con istruzioni di ragionamento esplicite, migliora significativamente la capacità di generalizzazione sistematica dei modelli linguistici su compiti algebrici complessi, rivelando paradossalmente che esempi più semplici possono essere più efficaci di quelli complessi.

Stefano Fioravanti, Matteo Zavatteri, Roberto Confalonieri, Kamyar Zeinalipour, Paolo Frazzetto, Alessandro Sperduti, Nicolò Navarin2026-03-11🤖 cs.LG

A Surrogate model for High Temperature Superconducting Magnets to Predict Current Distribution with Neural Network

Questo lavoro presenta un modello surrogato basato su una rete neurale residua completamente connessa (FCRN) addestrato su simulazioni FEM per prevedere rapidamente la distribuzione della densità di corrente e ottimizzare il design di magneti solenoidi in REBCO su larga scala, superando i limiti computazionali dei metodi tradizionali con errori ridotti.

Mianjun Xiao, Peng Song, Yulong Liu, Cedric Korte, Ziyang Xu, Jiale Gao, Jiaqi Lu, Haoyang Nie, Qiantong Deng, Timing Qu2026-03-11🤖 cs.LG

Repulsive Monte Carlo on the sphere for the sliced Wasserstein distance

Questo articolo propone e valuta metodi di Monte Carlo repulsivi per calcolare la distanza di Wasserstein tagliata (sliced Wasserstein distance) su sfere di qualsiasi dimensione, concludendo che l'uso di UnifOrtho è preferibile in alte dimensioni mentre i metodi di quasi-Monte Carlo randomizzato sono ottimali in basse dimensioni.

Vladimir Petrovic, Rémi Bardenet, Agnès Desolneux2026-03-11🤖 cs.LG

Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale

Questo lavoro introduce il Robot Control Stack (RCS), un ecosistema leggero e modulare progettato per colmare il divario tra l'addestramento su larga scala di modelli Vision-Language-Action e la loro applicazione nel mondo reale, facilitando il trasferimento sim-to-real e offrendo una valutazione estesa di diverse politiche robotiche.

Tobias Jülg, Pierre Krack, Seongjin Bien, Yannik Blei, Khaled Gamal, Ken Nakahara, Johannes Hechtl, Roberto Calandra, Wolfram Burgard, Florian Walter2026-03-11🤖 cs.LG

Kuramoto Orientation Diffusion Models

Il paper propone un modello generativo basato su score che utilizza le dinamiche stocastiche di Kuramoto su domini periodici per migliorare la generazione di immagini ricche di orientamento, come impronte digitali e texture, sfruttando la sincronizzazione e la desincronizzazione delle fasi per modellare efficacemente i pattern angolari coerenti.

Yue Song, T. Anderson Keller, Sevan Brodjian, Takeru Miyato, Yisong Yue, Pietro Perona, Max Welling2026-03-11🤖 cs.LG

Reinforced Generation of Combinatorial Structures: Hardness of Approximation

Questo articolo dimostra come l'agente di mutazione del codice basato su LLM chiamato AlphaEvolve possa essere utilizzato per ottenere nuovi risultati di inapprossimabilità e limiti superiori/inferiori per problemi combinatori come MAX-CUT, MAX-4-CUT, MAX-3-CUT e il TSP metrico, migliorando gli stati dell'arte attuali attraverso la scoperta automatizzata di riduzioni e gadget.

Ansh Nagda, Prabhakar Raghavan, Abhradeep Thakurta2026-03-11🤖 cs.AI

VLCE: A Knowledge-Enhanced Framework for Image Description in Disaster Assessment

Il paper propone VLCE, un framework che integra conoscenze semantiche esterne da ConceptNet e WordNet per migliorare la generazione di descrizioni testuali di immagini satellitari e UAV in contesti di disastri, ottenendo risultati superiori rispetto ai modelli VLM generici in termini di coerenza fattuale e vocabolario specifico.

Md. Mahfuzur Rahman, Kishor Datta Gupta, Marufa Kamal + 5 more2026-03-11🤖 cs.LG

ZeroSiam: An Efficient Asymmetry for Test-Time Entropy Optimization without Collapse

Il paper presenta ZeroSiam, un'architettura asimmetrica efficiente che previene il collasso durante l'ottimizzazione dell'entropia al momento del test, migliorando la stabilità e le prestazioni sia nei compiti di adattamento visivo che nel ragionamento dei modelli linguistici su larga scala.

Guohao Chen, Shuaicheng Niu, Deyu Chen, Jiahao Yang, Zitian Zhang, Mingkui Tan, Pengcheng Wu, Zhiqi Shen2026-03-11🤖 cs.LG

Compose Your Policies! Improving Diffusion-based or Flow-based Robot Policies via Test-time Distribution-level Composition

Questo lavoro introduce la Composizione Generale delle Politiche (GPC), un metodo senza addestramento che migliora le prestazioni dei robot combinando a tempo di test i punteggi distribuzionali di modelli pre-addestrati eterogenei, dimostrandosi efficace sia in simulazione che nel mondo reale.

Jiahang Cao, Yize Huang, Hanzhong Guo, Rui Zhang, Mu Nan, Weijian Mai, Jiaxu Wang, Hao Cheng, Jingkai Sun, Gang Han, Wen Zhao, Qiang Zhang, Yijie Guo, Qihao Zheng, Chunfeng Song, Xiao Li, Ping Luo, Andrew F. Luo2026-03-11🤖 cs.LG

Improved Robustness of Deep Reinforcement Learning for Control of Time-Varying Systems by Bounded Extremum Seeking

Questo articolo propone un controllore ibrido che combina l'apprendimento per rinforzo profondo (DRL) con la ricerca del massimo limitata (bounded extremum seeking) per migliorare la robustezza e le prestazioni dei sistemi di controllo non lineari a tempo variabile, come dimostrato nella sintonizzazione automatica di un acceleratore di particelle.

Shaifalee Saxena, Alan Williams, Rafael Fierro, Alexander Scheinker2026-03-11🤖 cs.LG

← Precedente Successivo →