Neuro-Symbolic Skill Discovery for Conditional Multi-Level Planning

Questo articolo propone un'architettura di apprendimento neuro-simbolica che, partendo da poche dimostrazioni non etichettate, scopre simboli ad alto livello e acquisisce controllori a basso livello per pianificare ed eseguire compiti a lungo raggio in ambienti complessi e non visti, integrando modelli linguistici visivi per l'interpretazione dei simboli e la generazione di piani.

Hakan Aktas, Yigit Yildirim, Ahmet Firat Gamsiz + 3 more2026-03-03🤖 cs.AI

LD-EnSF: Synergizing Latent Dynamics with Ensemble Score Filters for Fast Data Assimilation with Sparse Observations

Il lavoro propone LD-EnSF, un nuovo metodo di assimilazione dei dati basato su punteggi che, evolvendo le dinamiche in uno spazio latente compatto e utilizzando encoder LSTM storici, elimina la necessità di simulazioni complete nello spazio fisico, garantendo velocità superiori di ordini di grandezza e alta accuratezza anche con osservazioni sparse e rumorose.

Pengpeng Xiao, Phillip Si, Peng Chen2026-03-03🤖 cs.LG

Mixing Times and Privacy Analysis for the Projected Langevin Algorithm under a Modulus of Continuity

Questo lavoro estende il framework di amplificazione della privacy per iterazione (PABI) ad algoritmi con mappe gradiente non necessariamente non espansive, derivando nuovi limiti dimension-free per i tempi di miscelazione dell'algoritmo Langevin proiettato e curve di privacy per la discesa del gradiente stocastica rumorosa basate sulla regolarità dei gradienti.

Mario Bravo, Juan P. Flores-Mella, Cristóbal Guzmán2026-03-03📊 stat

AI/ML Based Detection and Categorization of Covert Communication in IPv6 Network

Questo studio propone un approccio basato sull'intelligenza artificiale e sul machine learning per rilevare e categorizzare le comunicazioni covert nelle reti IPv6, superando le limitazioni degli scenari precedenti attraverso la generazione di dataset realistici, l'addestramento di modelli avanzati (come Random Forest, CNN e LSTM) che raggiungono un'accuratezza superiore al 90%, e l'introduzione di un nuovo framework di affinamento guidato dall'IA generativa.

Mohammad Wali Ur Rahman, Yu-Zheng Lin, Carter Weeks + 6 more2026-03-03🤖 cs.AI

Polynomial, trigonometric, and tropical activations

Questo articolo dimostra che l'utilizzo di funzioni di attivazione basate su basi ortonormali (polinomiali, trigonometriche e tropicali), combinate con un'inizializzazione che preserva la varianza, permette di addestrare con successo modelli profondi come GPT-2 e ConvNeXt risolvendo i problemi di esplosione e svanimento dei gradienti, offrendo al contempo nuove prospettive sull'interpretazione strutturale delle reti neurali e facilitando il fine-tuning tramite approssimazione di attivazioni classiche.

Ismail Khalfaoui-Hassani, Stefan Kesselheim2026-03-03💬 cs.CL

CLIP Behaves like a Bag-of-Words Model Cross-modally but not Uni-modally

Questo studio dimostra che, sebbene CLIP appaia comportarsi come un modello "bag-of-words" nell'allineamento cross-modale, le informazioni sulle relazioni attributo-oggetto sono già presenti nelle sue rappresentazioni unimodali e possono essere recuperate efficacemente tramite una semplice trasformazione lineare, migliorando così le prestazioni senza necessità di un addestramento costoso.

Darina Koishigarina, Arnas Uselis, Seong Joon Oh2026-03-03🤖 cs.LG

Topological derivative approach for deep neural network architecture adaptation

Questo lavoro presenta un algoritmo innovativo per l'adattamento progressivo dell'architettura delle reti neurali profonde che, sfruttando il derivato topologico di un funzionale di forma e un punto di vista di controllo ottimo, identifica matematicamente le posizioni ottimali per l'inserimento di nuovi strati e le relative inizializzazioni, superando le strategie di adattamento esistenti.

C G Krishnanunni, Tan Bui-Thanh, Clint Dawson2026-03-03🤖 cs.AI