cs.LG articoli | Gist.Science

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

Questo lavoro propone un metodo che sfrutta modelli visione-linguaggio preaddestrati per apprendere modelli del mondo simbolici astratti da dimostrazioni brevi, consentendo a sistemi robotici di pianificare e risolvere compiti decisionali a lungo termine con una generalizzazione zero-shot in scenari complessi e non visti in precedenza.

Ashay Athalye, Nishanth Kumar, Tom Silver, Yichao Liang, Jiuguang Wang, Tomás Lozano-Pérez, Leslie Pack Kaelbling2026-03-10🤖 cs.LG

UFGraphFR: Graph Federation Recommendation System based on User Text description features

Il paper presenta UFGraphFR, un sistema di raccomandazione federato che supera i limiti della localizzazione dei dati trasformando le informazioni private in vettori semantici per ricostruire in modo sicuro grafi delle relazioni utente e migliorare la precisione dei suggerimenti senza compromettere la privacy.

Xudong Wang, Qingbo Hao, Yingyuan Xiao2026-03-10🤖 cs.LG

Efficient Semi-Supervised Adversarial Training via Latent Clustering-Based Data Reduction

Questo paper propone strategie di riduzione dei dati basate sul clustering nello spazio latente per ottimizzare l'addestramento avversario semi-supervisionato, consentendo di ridurre drasticamente il volume di dati non etichettati e i costi computazionali mantenendo un'elevata robustezza del modello.

Somrita Ghosh, Yuelin Xu, Xiao Zhang2026-03-10🤖 cs.LG

The Exploration of Error Bounds in Classification with Noisy Labels

Questo lavoro deriva limiti di errore per il rischio eccessivo nella classificazione con etichette rumorose all'interno di framework di deep learning, decomponendo l'errore in componenti statistiche e di approssimazione e affinando i risultati sotto l'ipotesi di varietà a bassa dimensionalità.

Haixia Liu, Boxiao Li, Can Yang, Yang Wang2026-03-10🤖 cs.LG

Strengthening Generative Robot Policies through Predictive World Modeling

Il paper presenta GPC, un framework di controllo generativo che combina clonazione comportamentale, modelli predittivi del mondo e pianificazione online per superare le prestazioni della clonazione comportamentale in compiti di manipolazione robotica sia in simulazione che nel mondo reale.

Han Qi, Haocheng Yin, Aris Zhu, Yilun Du, Heng Yang2026-03-10🤖 cs.LG

General Coded Computing in a Probabilistic Straggler Regime

Questo articolo analizza teoricamente e sperimentalmente la convergenza dell'errore di approssimazione verso zero in due schemi di calcolo codificato generale (BACC e LeTCC) in presenza di un regime probabilistico di server lenti, dimostrando che l'indipendenza delle interruzioni permette di ottenere risultati precisi anche quando il numero medio di server lenti scala con la dimensione totale del sistema.

Parsa Moradi, Mohammad Ali Maddah-Ali2026-03-10🤖 cs.LG

GRADIEND: Feature Learning within Neural Networks Exemplified through Biases

Il paper introduce GRADIEND, un nuovo approccio encoder-decoder che utilizza i gradienti delle reti neurali per identificare e modificare i pesi responsabili dei pregiudizi sociali, consentendo di debiasare i modelli mantenendone le altre capacità.

Jonathan Drechsel, Steffen Herbold2026-03-10🤖 cs.LG

Security and Quality in LLM-Generated Code: A Multi-Language, Multi-Model Analysis

Questo studio analizza la sicurezza e la qualità del codice generato da modelli linguistici su diverse lingue di programmazione, rivelando che, sebbene l'automazione sia efficace, molti modelli non adottano le moderne funzionalità di sicurezza e ricorrono ancora a metodi obsoleti, sottolineando la necessità di migliorare gli LLM per integrare le migliori pratiche emergenti.

Mohammed Kharma, Soohyeon Choi, Mohammed AlKhanafseh, David Mohaisen2026-03-10🤖 cs.LG

An Efficient Local Search Approach for Polarized Community Discovery in Signed Networks

Questo articolo propone un nuovo algoritmo di ricerca locale che, collegandosi all'ottimizzazione Frank-Wolfe a blocchi, identifica comunità polarizzate in reti firmate con vertici neutrali risolvendo il problema dello squilibrio dimensionale e garantendo una convergenza lineare con prestazioni superiori rispetto agli stati dell'arte.

Linus Aronsson, Morteza Haghir Chehreghani2026-03-10🤖 cs.LG

Controllable Sequence Editing for Biological and Clinical Trajectories

Il paper presenta CLEF, un modello di generazione condizionale che supera i limiti delle metodologie esistenti consentendo l'editing controllato e mirato di traiettorie sequenziali biologiche e cliniche, modificando specifiche variabili a partire da un momento temporale definito per generare scenari controfattuali realistici.

Michelle M. Li, Kevin Li, Yasha Ektefaie, Ying Jin, Yepeng Huang, Shvat Messica, Tianxi Cai, Marinka Zitnik2026-03-10🤖 cs.LG

Mitigating Unintended Memorization with LoRA in Federated Learning for LLMs

Questo lavoro dimostra che l'uso della Low-Rank Adaptation (LoRA) nel federated learning per i grandi modelli linguistici riduce significativamente la memorizzazione involontaria dei dati di addestramento, migliorando la privacy senza compromettere le prestazioni.

Thierry Bossy, Julien Vignoud, Tahseen Rabbani, Juan R. Troncoso Pastoriza, Martin Jaggi2026-03-10🤖 cs.LG

Active Advantage-Aligned Online Reinforcement Learning with Offline Data

Il paper introduce A3RL, un nuovo metodo di apprendimento per rinforzo che combina dati online e offline tramite una strategia di campionamento attiva e consapevole della fiducia per superare limiti come l'oblio catastrofico e migliorare l'efficienza dei campioni.

Xuefeng Liu, Hung T. C. Le, Siyu Chen, Rick Stevens, Zhuoran Yang, Matthew R. Walter, Yuxin Chen2026-03-10🤖 cs.LG

Language in the Flow of Time: Time-Series-Paired Texts Weaved into a Unified Temporal Narrative

Il paper propone il framework "Texts as Time Series" (TaTS), che sfrutta le proprietà periodiche dei testi associati alle serie temporali come variabili ausiliarie per potenziare le prestazioni di modelli esistenti nelle previsioni e nell'imputazione multimodale senza modificare le loro architetture.

Zihao Li, Xiao Lin, Zhining Liu, Jiaru Zou, Ziwei Wu, Lecheng Zheng, Dongqi Fu, Yada Zhu, Hendrik Hamann, Hanghang Tong, Jingrui He2026-03-10🤖 cs.LG

LaVCa: LLM-assisted Visual Cortex Captioning

Il paper presenta LaVCa, un approccio basato su modelli linguistici di grandi dimensioni (LLM) che genera didascalie naturali per descrivere con maggiore precisione e dettaglio la selettività dei voxel nella corteccia visiva umana, superando i limiti dei modelli di codifica tradizionali e rivelando nuove sfumature nella rappresentazione visiva del cervello.

Takuya Matsuyama, Shinji Nishimoto, Yu Takagi2026-03-10🤖 cs.LG

Unveiling Downstream Performance Scaling of LLMs: A Clustering-Based Perspective

Il paper propone il framework COD (Clustering-On-Difficulty), che raggruppa i compiti in base alle loro caratteristiche di scalabilità per prevedere con alta precisione le prestazioni downstream dei grandi modelli linguistici, superando le sfide poste dai fenomeni emergenti e dalla variabilità delle metriche.

Chengyin Xu, Kaiyuan Chen, Xiao Li, Ke Shen, Chenggang Li2026-03-10🤖 cs.LG

Subclass Classification of Gliomas Using MRI Fusion Technique

Questo studio presenta un algoritmo che fonde immagini MRI multimodali pre-elaborate e segmentate tramite architetture UNET in 2D e 3D, per poi classificarle con un modello ResNet50, ottenendo un'accuratezza del 99,25% nella sottoclassificazione dei gliomi.

Kiranmayee Janardhan, Christy Bobby Thomas2026-03-10💻 cs

A Simple and Effective Reinforcement Learning Method for Text-to-Image Diffusion Fine-tuning

Questo lavoro propone LOOP, un nuovo metodo di apprendimento per rinforzo che combina le tecniche di riduzione della varianza di REINFORCE con la robustezza di PPO per ottimizzare il fine-tuning dei modelli di diffusione testo-immagine, ottenendo un miglior equilibrio tra efficienza nel campionamento e prestazioni finali.

Shashank Gupta, Chaitanya Ahuja, Tsung-Yu Lin + 4 more2026-03-10🤖 cs.AI

Go Beyond Your Means: Unlearning with Per-Sample Gradient Orthogonalization

Il paper presenta OrthoGrad, un nuovo metodo di disapprendimento automatico che proietta i gradienti dei dati da rimuovere nello spazio ortogonale ai gradienti di un piccolo insieme di dati di ritenzione, permettendo così di eliminare concetti specifici senza compromettere le prestazioni del modello anche quando l'intero dataset di addestramento non è disponibile.

Aviv Shamsian, Eitan Shaar, Aviv Navon, Gal Chechik, Ethan Fetaya2026-03-10🤖 cs.LG

LLM-Powered Prediction of Hyperglycemia and Discovery of Behavioral Treatment Pathways from Wearables and Diet

Il paper presenta GlucoLens, un sistema di intelligenza artificiale spiegabile che utilizza dati provenienti da dispositivi indossabili e diete per prevedere l'iperglicemia postprandiale e suggerire percorsi di trattamento comportamentale personalizzati, ottenendo prestazioni superiori rispetto ai modelli esistenti.

Abdullah Mamun, Asiful Arefeen, Susan B. Racette + 4 more2026-03-10🤖 cs.AI

IMPACT: Intelligent Motion Planning with Acceptable Contact Trajectories via Vision-Language Models

Il paper presenta IMPACT, un nuovo framework di pianificazione del movimento che utilizza modelli visione-linguaggio per generare mappe di costo anisotrope e identificare contatti sicuri, permettendo a un robot di navigare in ambienti affollati attraverso percorsi ricchi di contatto controllati e sicuri.

Yiyang Ling, Karan Owalekar, Oluwatobiloba Adesanya, Erdem Bıyık, Daniel Seita2026-03-10🤖 cs.LG

← Precedente Successivo →