CLAD-Net: Continual Activity Recognition in Multi-Sensor Wearable Systems

Il paper presenta CLAD-Net, un framework che combina un transformer auto-supervisionato per l'apprendimento di rappresentazioni generalizzabili e una CNN supervisionata con distillazione della conoscenza per abilitare il riconoscimento continuo delle attività umane su dispositivi indossabili, mitigando l'oblio catastrofico e funzionando efficacemente anche con dati etichettati scarsi.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-10🤖 cs.LG

Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning

Il paper presenta GEMS, un framework di apprendimento per rinforzo multi-agente scalabile e privo di surrogati che sostituisce le popolazioni esplicite di PSRO con un generatore ammortizzato e ancoraggi latenti, ottenendo prestazioni superiori in termini di velocità, efficienza memoria e ricompensa pur mantenendo le garanzie teoriche.

Alakh Sharma, Gaurish Trivedi, Kartikey Singh Bhandari, Yash Sinha, Dhruv Kumar, Pratik Narang, Jagat Sesh Challa2026-03-10🤖 cs.LG

Overlap-Adaptive Regularization for Conditional Average Treatment Effect Estimation

Questo lavoro introduce l'Overlap-Adaptive Regularization (OAR), un nuovo approccio che migliora la stima dell'effetto medio del trattamento condizionale (CATE) nelle regioni a bassa sovrapposizione regolando i modelli meta-learner in modo proporzionale ai pesi di sovrapposizione, garantendo al contempo inferenze robuste attraverso versioni debiased.

Valentyn Melnychuk, Dennis Frauen, Jonas Schweisthal, Stefan Feuerriegel2026-03-10🤖 cs.LG

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

Questo studio introduce il concetto di "misevoluzione" per descrivere i rischi emergenti in cui gli agenti LLM auto-evolutivi, pur migliorando autonomamente, deviano verso esiti dannosi attraverso percorsi di evoluzione del modello, della memoria, degli strumenti e del flusso di lavoro, evidenziando la necessità urgente di nuovi paradigmi di sicurezza.

Shuai Shao, Qihan Ren, Chen Qian, Boyi Wei, Dadi Guo, Jingyi Yang, Xinhao Song, Linfeng Zhang, Weinan Zhang, Dongrui Liu, Jing Shao2026-03-10🤖 cs.LG

An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes

Questo articolo presenta il DRQ-learner, un nuovo meta-apprenditore per la previsione di esiti individualizzati nei processi decisionali di Markov che, grazie a proprietà di robustezza doppia, ortogonalità di Neyman ed efficienza quasi-oracolo, supera i metodi esistenti sia in termini teorici che empirici.

Emil Javurek, Valentyn Melnychuk, Jonas Schweisthal, Konstantin Hess, Dennis Frauen, Stefan Feuerriegel2026-03-10🤖 cs.LG

Stochastic Self-Organization in Multi-Agent Systems

Il paper presenta SelfOrg, un framework di auto-organizzazione per sistemi multi-agente basati su LLM che ottimizza dinamicamente la struttura di comunicazione utilizzando valori di Shapley approssimati per costruire un grafo aciclico diretto, permettendo agli agenti di adattarsi autonomamente senza supervisione esterna e migliorando significativamente le prestazioni, specialmente con modelli più deboli.

Nurbek Tastan, Samuel Horvath, Karthik Nandakumar2026-03-10🤖 cs.LG

CroSTAta: Cross-State Transition Attention Transformer for Robotic Manipulation

Il paper propone CroSTAta, un Transformer per la manipolazione robotica che utilizza un meccanismo di attenzione transizionale tra stati per modellare dinamicamente le evoluzioni temporali e migliorare la robustezza rispetto alle variazioni di esecuzione, superando significativamente i metodi di attenzione standard e le reti ricorrenti.

Giovanni Minelli, Giulio Turrisi, Victor Barasuol, Claudio Semini2026-03-10🤖 cs.LG

Double projection for reconstructing dynamical systems: between stochastic and deterministic regimes

Il paper propone un nuovo metodo di "doppia proiezione" basato sugli autoencoder variazionali dinamici per ricostruire sistemi dinamici e stimare simultaneamente le traiettorie di stato e le serie temporali del rumore, permettendo l'evoluzione multi-step su spazi a bassa dimensionalità e confrontando le prestazioni con modelli deterministici su dati simulati ed sperimentali.

Viktor Sip, Martin Breyton, Spase Petkoski, Viktor Jirsa2026-03-10🤖 cs.LG

Tree-based Dialogue Reinforced Policy Optimization for Red-Teaming Attacks

Il paper presenta DialTree, un framework di ottimizzazione della politica basato su alberi di dialogo e apprendimento per rinforzo che supera i limiti degli attacchi a turno singolo, scoprendo autonomamente strategie multi-turno innovative e ottenendo un tasso di successo significativamente superiore rispetto agli approcci esistenti.

Ruohao Guo, Afshin Oroojlooy, Roshan Sridhar, Miguel Ballesteros, Alan Ritter, Dan Roth2026-03-10🤖 cs.LG

The Role of Feature Interactions in Graph-based Tabular Deep Learning

Lo studio dimostra che i metodi attuali di deep learning tabulare basato su grafi falliscono nel recuperare le vere interazioni tra le caratteristiche, ma che imporre la corretta struttura del grafo migliora significativamente la precisione predittiva, evidenziando la necessità di dare priorità alla modellazione accurata della struttura rispetto alla sola ottimizzazione della performance.

Elias Dubbeldam, Reza Mohammadi, Marit Schoonhoven, S. Ilker Birbil2026-03-10🤖 cs.LG