cs.LG articoli | Gist.Science

Bayesian Adversarial Privacy

Questo lavoro introduce una nuova nozione quantitativa di privacy basata sulla teoria decisionale bayesiana, che supera i limiti della privacy differenziale e della teoria della divulgazione statistica adottando una prospettiva a priori per le decisioni di divulgazione.

Cameron Bell, Timothy Johnston, Antoine Luciano + 1 more2026-03-05🤖 cs.LG

Beyond Mixtures and Products for Ensemble Aggregation: A Likelihood Perspective on Generalized Means

Questo lavoro propone un formalismo unificato per l'aggregazione di densità basato sulle medie generalizzate, dimostrando teoricamente e validando empiricamente che solo l'intervallo $r \in [0,1]$ garantisce miglioramenti sistematici rispetto alle distribuzioni individuali, fornendo così una giustificazione rigorosa per l'uso diffuso della media lineare ( $r=1$ ) e geometrica ( $r=0$ ) negli ensemble di deep learning.

Raphaël Razafindralambo, Rémy Sun, Frédéric Precioso + 2 more2026-03-05🤖 cs.LG

Beyond Edge Deletion: A Comprehensive Approach to Counterfactual Explanation in Graph Neural Networks

Il paper presenta XPlore, un nuovo metodo basato su gradienti che amplia lo spazio di ricerca delle spiegazioni controfattuali per le Graph Neural Networks permettendo non solo la rimozione ma anche l'inserimento di archi e la modifica delle caratteristiche dei nodi, ottenendo risultati significativamente migliori in termini di validità e fedeltà rispetto alle tecniche esistenti.

Matteo De Sanctis, Riccardo De Sanctis, Stefano Faralli + 2 more2026-03-05🤖 cs.LG

Semi-Supervised Generative Learning via Latent Space Distribution Matching

Il paper introduce LSDM, un nuovo framework semi-supervisionato per la generazione condizionale che apprende uno spazio latente utilizzando dati sia accoppiati che non accoppiati e allinea le distribuzioni congiunte tramite la distanza di Wasserstein, migliorando la fedeltà geometrica e fornendo nuove basi teoriche anche per i Latent Diffusion Models.

Kwong Yu Chong, Long Feng2026-03-05🤖 cs.LG

Nearest-Neighbor Density Estimation for Dependency Suppression

Il paper propone un metodo basato su un autoencoder variazionale specializzato e una stima della densità non parametrica per rimuovere le dipendenze indesiderate dai dati preservandone l'utilità, superando le tecniche esistenti sia non supervisionate che supervisionate.

Kathleen Anderson, Thomas Martinetz2026-03-05🤖 cs.LG

Agentics 2.0: Logical Transduction Algebra for Agentic Data Workflows

Il paper presenta Agentics 2.0, un framework Python nativo che utilizza un'algebra di trasduzione logica per trasformare le chiamate ai modelli linguistici in funzioni semantiche tipizzate e componibili, garantendo affidabilità, osservabilità e scalabilità nei flussi di lavoro agenziali e ottenendo prestazioni all'avanguardia su benchmark complessi.

Alfio Massimiliano Gliozzo, Junkyu Lee, Nahuel Defosse2026-03-05🤖 cs.AI

Online Learning for Multi-Layer Hierarchical Inference under Partial and Policy-Dependent Feedback

Il paper propone un algoritmo online basato su EXP4 con riduzione della varianza e ottimizzazione Lyapunov per gestire l'inferenza gerarchica multistrato sotto vincoli di risorse e feedback parziale dipendente dalla politica, garantendo stime di perdita non distorte e stabilità rispetto ai metodi di bandit contestuale tradizionali.

Haoran Zhang, Seohyeon Cha, Hasan Burhan Beytur + 3 more2026-03-05🤖 cs.AI

Memex(RL): Scaling Long-Horizon LLM Agents via Indexed Experience Memory

Il paper presenta Memex, un meccanismo di memoria indicizzata che supera i limiti delle finestre contestuali negli agenti LLM a lungo termine archiviando interazioni complete in un database esterno e utilizzando un framework di apprendimento per rinforzo (MemexRL) per ottimizzare dinamicamente la sintesi, l'indicizzazione e il recupero selettivo delle informazioni, garantendo così una memoria a lungo termine meno lossiva e un contesto di lavoro più compatto.

Zhenting Wang, Huancheng Chen, Jiayun Wang + 1 more2026-03-05🤖 cs.LG

Causality Elicitation from Large Language Models

Questo articolo propone una pipeline per estrarre relazioni causali dai grandi modelli linguistici campionando documenti, estraendo ed aggregando eventi in variabili canoniche, e applicando metodi di scoperta causale per generare un insieme ispezionabile di ipotesi causali plausibili, pur senza garantire la causalità nel mondo reale.

Takashi Kameyama, Masahiro Kato, Yasuko Hio + 2 more2026-03-05🤖 cs.AI

IPD: Boosting Sequential Policy with Imaginary Planning Distillation in Offline Reinforcement Learning

Il paper propone IPD (Imaginary Planning Distillation), un nuovo framework per l'apprendimento per rinforzo offline che integra la pianificazione immaginaria e l'addestramento di un modello del mondo per arricchire i dati con roll-out ottimali, migliorando così le prestazioni delle politiche sequenziali basate su transformer rispetto agli stati dell'arte.

Yihao Qin, Yuanfei Wang, Hang Zhou + 3 more2026-03-05🤖 cs.AI

LabelBuddy: An Open Source Music and Audio Language Annotation Tagging Tool Using AI Assistance

Questo articolo presenta LabelBuddy, uno strumento open source di annotazione audio collaborativo che utilizza modelli di intelligenza artificiale e agenti autonomi per colmare il divario tra l'intento umano e la comprensione delle macchine, superando le limitazioni degli strumenti di tagging statici.

Ioannis Prokopiou, Ioannis Sina, Agisilaos Kounelis + 2 more2026-03-05🤖 cs.AI

LUMINA: Foundation Models for Topology Transferable ACOPF

Il paper presenta LUMINA, un framework che stabilisce principi di progettazione per modelli fondazionali scientifici vincolati, applicati al flusso di potenza AC ottimale (ACOPF), per bilanciare l'apprendimento di rappresentazioni invarianti alla fisica con il rispetto rigoroso dei vincoli di sicurezza e delle leggi fisiche.

Yijiang Li, Zeeshan Memon, Hongwei Jin + 7 more2026-03-05🤖 cs.LG

Activation Outliers in Transformer Quantization: Reproduction, Statistical Analysis, and Deployment Tradeoffs

Questo studio riproduce e analizza statisticamente il drastico calo di accuratezza nella quantizzazione post-allenamento dei transformer causato da outlier strutturati nelle attivazioni, dimostrando che l'allocazione della precisione a livello di canale è essenziale per mitigare il problema senza compromettere le prestazioni di deployment.

Pranav Kumar Kaliaperumal2026-03-05🤖 cs.AI

CRESTomics: Analyzing Carotid Plaques in the CREST-2 Trial with a New Additive Classification Model

Il documento presenta CRESTomics, un nuovo modello di classificazione additiva basato su kernel che, analizzando 500 placche carotidee del trial CREST-2 tramite ecografia B-mode, identifica in modo accurato e interpretabile marcatori radiomici associati al rischio clinico di ictus.

Pranav Kulkarni, Brajesh K. Lal, Georges Jreij + 11 more2026-03-05🤖 cs.AI

World Properties without World Models: Recovering Spatial and Temporal Structure from Co-occurrence Statistics in Static Word Embeddings

Questo studio dimostra che la capacità di recuperare informazioni spaziali e temporali tramite sonde lineari non prova necessariamente l'esistenza di modelli interni del mondo nei LLM, poiché strutture simili sono già presenti nelle statistiche di co-occorrenza dei semplici embedding statici.

Elan Barenholtz2026-03-05🤖 cs.AI

PTOPOFL: Privacy-Preserving Personalised Federated Learning via Persistent Homology

Il paper presenta PTOPOFL, un framework di apprendimento federato personalizzato che garantisce la privacy e migliora le prestazioni su dati non-IID sostituendo la condivisione dei gradienti con descrittori topologici derivati dall'omologia persistente, riducendo drasticamente il rischio di ricostruzioni dei dati e ottenendo risultati superiori rispetto agli approcci esistenti.

Kelly L Vomo-Donfack, Adryel Hoszu, Grégory Ginot + 1 more2026-03-05🤖 cs.LG

Scalable Evaluation of the Realism of Synthetic Environmental Augmentations in Images

Il paper presenta un framework scalabile per valutare il realismo delle aumentazioni sintetiche di condizioni ambientali (come nebbia, pioggia e notte) nelle immagini, dimostrando che i metodi di intelligenza artificiale generativa superano significativamente gli approcci basati su regole, raggiungendo o superando le prestazioni delle immagini reali per la maggior parte delle condizioni.

Damian J. Ruck, Paul Vautravers, Oliver Chalkley + 1 more2026-03-05🤖 cs.LG

Algorithmic Compliance and Regulatory Loss in Digital Assets

Lo studio dimostra che le metriche statiche di classificazione sovrastimano l'efficacia reale dei sistemi di enforcement ML per il riciclaggio di criptovalute, poiché la non stazionarietà temporale causa una scarsa calibrazione delle regole decisionali e perdite normative persistenti, evidenziando la necessità di framework di valutazione basati sulle perdite.

Khem Raj Bhatt, Krishna Sharma2026-03-05🤖 cs.LG

What Does Flow Matching Bring To TD Learning?

Questo lavoro dimostra che il Flow Matching migliora l'apprendimento TD rispetto ai critici tradizionali non attraverso la modellazione distribuzionale, ma grazie alla capacità di recupero degli errori tramite integrazione a tempo di test e all'apprendimento di feature più plastiche ottenuto supervisionando il campo di velocità a più livelli.

Bhavya Agrawalla, Michal Nauman, Aviral Kumar2026-03-05🤖 cs.AI

Balancing Fidelity, Utility, and Privacy in Synthetic Cardiac MRI Generation: A Comparative Study

Questo studio confronta modelli generativi come DDPM, LDM e Flow Matching per la sintesi di risonanza magnetica cardiaca, dimostrando che i modelli basati su diffusione offrono il miglior compromesso tra fedeltà dell'immagine, utilità clinica e privacy, specialmente in scenari con dati limitati.

Madhura Edirisooriya, Dasuni Kawya, Ishan Kumarasinghe + 5 more2026-03-05🤖 cs.LG

← Precedente Successivo →