cs.LG articoli | Gist.Science

Linear probes rely on textual evidence: Results from leakage mitigation studies in language models

Lo studio dimostra che i monitor lineari per i modelli linguistici sono fragili e dipendono fortemente da evidenze testuali superficiali, poiché la loro efficacia crolla drasticamente quando tali indizi vengono rimossi o quando i modelli generano output privi di verbalizzazioni esplicite del comportamento target.

Gerard Boxo, Aman Neelappa, Shivam Raval2026-03-10🤖 cs.LG

AEGIS: Authentic Edge Growth In Sparsity for Link Prediction in Edge-Sparse Bipartite Knowledge Graphs

Il paper introduce AEGIS, un framework di aumento dei dati basato sulla ricampionatura degli archi esistenti che, preservando l'autenticità dei nodi e sfruttando l'arricchimento semantico, migliora le prestazioni di previsione dei collegamenti in grafi bipartiti sparsi senza generare endpoint fittizi.

Hugh Xuechen Liu, Kıvanç Tatar2026-03-10🤖 cs.LG

Aurora: Towards Universal Generative Multimodal Time Series Forecasting

Il paper introduce Aurora, un modello fondazionale multimodale per la previsione delle serie temporali che, sfruttando conoscenze di dominio estratte da testi e immagini tramite un meccanismo di attenzione guidato e un flusso di matching basato su prototipi, ottiene prestazioni all'avanguardia e capacità di inferenza zero-shot in scenari cross-domain.

Xingjian Wu, Jianxin Jin, Wanghui Qiu + 4 more2026-03-10🤖 cs.LG

GDR-learners: Orthogonal Learning of Generative Models for Potential Outcomes

Questo articolo introduce i GDR-learners, una nuova famiglia di modelli generativi basati su flussi normalizzanti, GAN, VAE e modelli di diffusione che, grazie alla proprietà di ortogonalità di Neyman, offrono una stima asintoticamente ottimale e a doppia robustezza delle distribuzioni dei potenziali risultati, superando le prestazioni dei metodi esistenti.

Valentyn Melnychuk, Stefan Feuerriegel2026-03-10🤖 cs.LG

CLAD-Net: Continual Activity Recognition in Multi-Sensor Wearable Systems

Il paper presenta CLAD-Net, un framework che combina un transformer auto-supervisionato per l'apprendimento di rappresentazioni generalizzabili e una CNN supervisionata con distillazione della conoscenza per abilitare il riconoscimento continuo delle attività umane su dispositivi indossabili, mitigando l'oblio catastrofico e funzionando efficacemente anche con dati etichettati scarsi.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-10🤖 cs.LG

Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning

Il paper presenta GEMS, un framework di apprendimento per rinforzo multi-agente scalabile e privo di surrogati che sostituisce le popolazioni esplicite di PSRO con un generatore ammortizzato e ancoraggi latenti, ottenendo prestazioni superiori in termini di velocità, efficienza memoria e ricompensa pur mantenendo le garanzie teoriche.

Alakh Sharma, Gaurish Trivedi, Kartikey Singh Bhandari, Yash Sinha, Dhruv Kumar, Pratik Narang, Jagat Sesh Challa2026-03-10🤖 cs.LG

FS-KAN: Permutation Equivariant Kolmogorov-Arnold Networks via Function Sharing

Il paper introduce FS-KAN, un approccio fondato sulla condivisione di funzioni che estende le reti Kolmogorov-Arnold per gestire in modo principiato le simmetrie di permutazione, offrendo una maggiore efficienza nei dati e mantenendo l'interpretabilità rispetto alle architetture tradizionali.

Ran Elbaz, Guy Bar-Shalom, Yam Eitan, Fabrizio Frasca, Haggai Maron2026-03-10🤖 cs.LG

Overlap-Adaptive Regularization for Conditional Average Treatment Effect Estimation

Questo lavoro introduce l'Overlap-Adaptive Regularization (OAR), un nuovo approccio che migliora la stima dell'effetto medio del trattamento condizionale (CATE) nelle regioni a bassa sovrapposizione regolando i modelli meta-learner in modo proporzionale ai pesi di sovrapposizione, garantendo al contempo inferenze robuste attraverso versioni debiased.

Valentyn Melnychuk, Dennis Frauen, Jonas Schweisthal, Stefan Feuerriegel2026-03-10🤖 cs.LG

Cold-Start Active Correlation Clustering

Il documento presenta un metodo attivo per il clustering di correlazione in scenari a freddo, che utilizza una strategia consapevole della copertura per garantire la diversità delle query quando non sono disponibili somiglianze iniziali, dimostrando la sua efficacia attraverso esperimenti su dati sintetici e reali.

Linus Aronsson, Han Wu, Morteza Haghir Chehreghani2026-03-10🤖 cs.LG

Feedback Control for Small Budget Pacing

Questo articolo propone un controller di feedback basato sull'isteresi e sulla proporzionalità che, integrando la teoria del controllo nei sistemi pubblicitari, migliora significativamente la precisione e la stabilità del pacing del budget, riducendo errori e volatilità rispetto ai metodi tradizionali.

Sreeja Apparaju, Yichuan Niu, Xixi Qi2026-03-10🤖 cs.LG

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

Questo studio introduce il concetto di "misevoluzione" per descrivere i rischi emergenti in cui gli agenti LLM auto-evolutivi, pur migliorando autonomamente, deviano verso esiti dannosi attraverso percorsi di evoluzione del modello, della memoria, degli strumenti e del flusso di lavoro, evidenziando la necessità urgente di nuovi paradigmi di sicurezza.

Shuai Shao, Qihan Ren, Chen Qian, Boyi Wei, Dadi Guo, Jingyi Yang, Xinhao Song, Linfeng Zhang, Weinan Zhang, Dongrui Liu, Jing Shao2026-03-10🤖 cs.LG

An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes

Questo articolo presenta il DRQ-learner, un nuovo meta-apprenditore per la previsione di esiti individualizzati nei processi decisionali di Markov che, grazie a proprietà di robustezza doppia, ortogonalità di Neyman ed efficienza quasi-oracolo, supera i metodi esistenti sia in termini teorici che empirici.

Emil Javurek, Valentyn Melnychuk, Jonas Schweisthal, Konstantin Hess, Dennis Frauen, Stefan Feuerriegel2026-03-10🤖 cs.LG

Privately Estimating Black-Box Statistics

Questo lavoro presenta un nuovo schema per la stima differenzialmente privata di funzioni black-box che ottimizza il compromesso tra efficienza statistica ed efficienza computazionale, supportato da limiti inferiori che ne dimostrano la near-ottimalità.

Günter F. Steinke, Thomas Steinke2026-03-10🤖 cs.LG

Stochastic Self-Organization in Multi-Agent Systems

Il paper presenta SelfOrg, un framework di auto-organizzazione per sistemi multi-agente basati su LLM che ottimizza dinamicamente la struttura di comunicazione utilizzando valori di Shapley approssimati per costruire un grafo aciclico diretto, permettendo agli agenti di adattarsi autonomamente senza supervisione esterna e migliorando significativamente le prestazioni, specialmente con modelli più deboli.

Nurbek Tastan, Samuel Horvath, Karthik Nandakumar2026-03-10🤖 cs.LG

CroSTAta: Cross-State Transition Attention Transformer for Robotic Manipulation

Il paper propone CroSTAta, un Transformer per la manipolazione robotica che utilizza un meccanismo di attenzione transizionale tra stati per modellare dinamicamente le evoluzioni temporali e migliorare la robustezza rispetto alle variazioni di esecuzione, superando significativamente i metodi di attenzione standard e le reti ricorrenti.

Giovanni Minelli, Giulio Turrisi, Victor Barasuol, Claudio Semini2026-03-10🤖 cs.LG

Double projection for reconstructing dynamical systems: between stochastic and deterministic regimes

Il paper propone un nuovo metodo di "doppia proiezione" basato sugli autoencoder variazionali dinamici per ricostruire sistemi dinamici e stimare simultaneamente le traiettorie di stato e le serie temporali del rumore, permettendo l'evoluzione multi-step su spazi a bassa dimensionalità e confrontando le prestazioni con modelli deterministici su dati simulati ed sperimentali.

Viktor Sip, Martin Breyton, Spase Petkoski, Viktor Jirsa2026-03-10🤖 cs.LG

Automated Extraction of Material Properties using LLM-based AI Agents

Questo studio presenta un workflow basato su agenti di intelligenza artificiale che estrae autonomamente proprietà termoelettriche e strutturali da circa 10.000 articoli scientifici, creando il più grande dataset curato da LLM a oggi e rendendolo accessibile tramite un esploratore web interattivo.

Subham Ghosh, Abhishek Tewari2026-03-10🔬 cond-mat.mtrl-sci

Tree-based Dialogue Reinforced Policy Optimization for Red-Teaming Attacks

Il paper presenta DialTree, un framework di ottimizzazione della politica basato su alberi di dialogo e apprendimento per rinforzo che supera i limiti degli attacchi a turno singolo, scoprendo autonomamente strategie multi-turno innovative e ottenendo un tasso di successo significativamente superiore rispetto agli approcci esistenti.

Ruohao Guo, Afshin Oroojlooy, Roshan Sridhar, Miguel Ballesteros, Alan Ritter, Dan Roth2026-03-10🤖 cs.LG

An Senegalese Legal Texts Structuration Using LLM-augmented Knowledge Graph

Questo studio presenta un approccio basato su modelli linguistici di grandi dimensioni (LLM) e grafi della conoscenza per strutturare i testi giuridici senegalesi, estrarendo migliaia di articoli e relazioni per migliorare l'accessibilità e la comprensione dei diritti e delle responsabilità legali.

Oumar Kane, Mouhamad M. Allaya, Dame Samb + 1 more2026-03-10💬 cs.CL

The Role of Feature Interactions in Graph-based Tabular Deep Learning

Lo studio dimostra che i metodi attuali di deep learning tabulare basato su grafi falliscono nel recuperare le vere interazioni tra le caratteristiche, ma che imporre la corretta struttura del grafo migliora significativamente la precisione predittiva, evidenziando la necessità di dare priorità alla modellazione accurata della struttura rispetto alla sola ottimizzazione della performance.

Elias Dubbeldam, Reza Mohammadi, Marit Schoonhoven, S. Ilker Birbil2026-03-10🤖 cs.LG

← Precedente Successivo →