Beyond Mixtures and Products for Ensemble Aggregation: A Likelihood Perspective on Generalized Means

Questo lavoro propone un formalismo unificato per l'aggregazione di densità basato sulle medie generalizzate, dimostrando teoricamente e validando empiricamente che solo l'intervallo r[0,1]r \in [0,1] garantisce miglioramenti sistematici rispetto alle distribuzioni individuali, fornendo così una giustificazione rigorosa per l'uso diffuso della media lineare (r=1r=1) e geometrica (r=0r=0) negli ensemble di deep learning.

Raphaël Razafindralambo, Rémy Sun, Frédéric Precioso + 2 more2026-03-05🤖 cs.LG

Beyond Edge Deletion: A Comprehensive Approach to Counterfactual Explanation in Graph Neural Networks

Il paper presenta XPlore, un nuovo metodo basato su gradienti che amplia lo spazio di ricerca delle spiegazioni controfattuali per le Graph Neural Networks permettendo non solo la rimozione ma anche l'inserimento di archi e la modifica delle caratteristiche dei nodi, ottenendo risultati significativamente migliori in termini di validità e fedeltà rispetto alle tecniche esistenti.

Matteo De Sanctis, Riccardo De Sanctis, Stefano Faralli + 2 more2026-03-05🤖 cs.LG

Online Learning for Multi-Layer Hierarchical Inference under Partial and Policy-Dependent Feedback

Il paper propone un algoritmo online basato su EXP4 con riduzione della varianza e ottimizzazione Lyapunov per gestire l'inferenza gerarchica multistrato sotto vincoli di risorse e feedback parziale dipendente dalla politica, garantendo stime di perdita non distorte e stabilità rispetto ai metodi di bandit contestuale tradizionali.

Haoran Zhang, Seohyeon Cha, Hasan Burhan Beytur + 3 more2026-03-05🤖 cs.AI

Memex(RL): Scaling Long-Horizon LLM Agents via Indexed Experience Memory

Il paper presenta Memex, un meccanismo di memoria indicizzata che supera i limiti delle finestre contestuali negli agenti LLM a lungo termine archiviando interazioni complete in un database esterno e utilizzando un framework di apprendimento per rinforzo (MemexRL) per ottimizzare dinamicamente la sintesi, l'indicizzazione e il recupero selettivo delle informazioni, garantendo così una memoria a lungo termine meno lossiva e un contesto di lavoro più compatto.

Zhenting Wang, Huancheng Chen, Jiayun Wang + 1 more2026-03-05🤖 cs.LG

IPD: Boosting Sequential Policy with Imaginary Planning Distillation in Offline Reinforcement Learning

Il paper propone IPD (Imaginary Planning Distillation), un nuovo framework per l'apprendimento per rinforzo offline che integra la pianificazione immaginaria e l'addestramento di un modello del mondo per arricchire i dati con roll-out ottimali, migliorando così le prestazioni delle politiche sequenziali basate su transformer rispetto agli stati dell'arte.

Yihao Qin, Yuanfei Wang, Hang Zhou + 3 more2026-03-05🤖 cs.AI

PTOPOFL: Privacy-Preserving Personalised Federated Learning via Persistent Homology

Il paper presenta PTOPOFL, un framework di apprendimento federato personalizzato che garantisce la privacy e migliora le prestazioni su dati non-IID sostituendo la condivisione dei gradienti con descrittori topologici derivati dall'omologia persistente, riducendo drasticamente il rischio di ricostruzioni dei dati e ottenendo risultati superiori rispetto agli approcci esistenti.

Kelly L Vomo-Donfack, Adryel Hoszu, Grégory Ginot + 1 more2026-03-05🤖 cs.LG

Scalable Evaluation of the Realism of Synthetic Environmental Augmentations in Images

Il paper presenta un framework scalabile per valutare il realismo delle aumentazioni sintetiche di condizioni ambientali (come nebbia, pioggia e notte) nelle immagini, dimostrando che i metodi di intelligenza artificiale generativa superano significativamente gli approcci basati su regole, raggiungendo o superando le prestazioni delle immagini reali per la maggior parte delle condizioni.

Damian J. Ruck, Paul Vautravers, Oliver Chalkley + 1 more2026-03-05🤖 cs.LG