LLMs can construct powerful representations and streamline sample-efficient supervised learning

Il paper propone un'agente pipeline basata su LLM che genera rubriche per standardizzare dati eterogenei, migliorando significativamente l'apprendimento supervisionato su compiti clinici rispetto a modelli tradizionali e foundation model, garantendo al contempo auditabilità, efficienza dei costi e interoperabilità con tecniche di machine learning tabellare.

Ilker Demirel, Larry Shi, Zeshan Hussain, David Sontag2026-03-13🤖 cs.AI

Causal Prosody Mediation for Text-to-Speech:Counterfactual Training of Duration, Pitch, and Energy in FastSpeech2

Il paper propone un nuovo framework di mediazione causale per la sintesi vocale che, integrando un modello strutturale causale e obiettivi di addestramento controfattuale nell'architettura FastSpeech2, disaccoppia efficacemente l'espressività emotiva dal contenuto linguistico per ottenere una manipolazione del prosodia più controllabile e naturale.

Suvendu Sekhar Mohanty2026-03-13🤖 cs.AI

Explicit Logic Channel for Validation and Enhancement of MLLMs on Zero-Shot Tasks

Il paper propone un "Canale Logico Esplicito" parallelo ai modelli MLLM esistenti, che integra ragionamento logico e inferenza probabilistica per validare, selezionare e migliorare le prestazioni dei modelli multimodali su compiti zero-shot senza necessità di annotazioni di ground-truth, aumentando così la loro affidabilità e spiegabilità.

Mei Chee Leong, Ying Gu, Hui Li Tan, Liyuan Li, Nancy Chen2026-03-13🤖 cs.AI

STAIRS-Former: Spatio-Temporal Attention with Interleaved Recursive Structure Transformer for Offline Multi-task Multi-agent Reinforcement Learning

Il paper presenta STAIRS-Former, un'architettura transformer basata su gerarchie spaziali e temporali e su un meccanismo di ricorsione intercalata, che supera i metodi esistenti nell'apprendimento per rinforzo multi-agente offline multi-task garantendo una migliore coordinazione, una gestione robusta di popolazioni di agenti variabili e una superiore capacità di catturare dipendenze temporali a lungo termine.

Jiwon Jeon, Myungsik Cho, Youngchul Sung2026-03-13🤖 cs.AI

OSCBench: Benchmarking Object State Change in Text-to-Video Generation

Il paper introduce OSCBench, un nuovo benchmark basato su dati di cucina che valuta la capacità dei modelli di generazione video da testo di rappresentare correttamente i cambiamenti di stato degli oggetti, rivelando che le attuali tecnologie faticano a gestire tali trasformazioni, specialmente in scenari nuovi o compositi.

Xianjing Han, Bin Zhu, Shiqi Hu, Franklin Mingzhe Li, Patrick Carrington, Roger Zimmermann, Jingjing Chen2026-03-13💬 cs.CL

Scaling Laws for Educational AI Agents

Il paper propone una "Legge di Scalabilità per Agenti" basata su definizioni di ruolo, competenze, strumenti e competenze umane, implementata tramite il formato strutturato AgentProfile e la piattaforma EduClaw, dimostrando che le prestazioni degli agenti educativi crescono in modo prevedibile con la ricchezza strutturale dei profili piuttosto che con la sola dimensione del modello.

Mengsong Wu, Hao Hao, Shuzhen Bi, Keqian Li, Wentao Liu, Siyu Song, Hongbo Zhao, Aimin Zhou2026-03-13🤖 cs.AI

Affect Decoding in Phonated and Silent Speech Production from Surface EMG

Questo studio introduce un nuovo dataset e dimostra che l'analisi dell'attività muscolare facciale tramite elettromiografia di superficie (sEMG) permette di decodificare con affidabilità stati emotivi come la frustrazione, generalizzando efficacemente sia nel parlato fonato che in quello silenzioso.

Simon Pistrosch, Kleanthis Avramidis, Tiantian Feng, Jihwan Lee, Monica Gonzalez-Machorro, Shrikanth Narayanan, Björn W. Schuller2026-03-13⚡ eess

When OpenClaw Meets Hospital: Toward an Agentic Operating System for Dynamic Clinical Workflows

Questo lavoro propone un'architettura per un "Sistema Operativo Agente" ospedaliero, basata su OpenClaw, che integra un ambiente di esecuzione limitato, una memoria a lungo termine indicizzata e una libreria di competenze mediche curate per garantire l'automazione sicura, trasparente e tracciabile dei flussi di lavoro clinici.

Wenxian Yang, Hanzheng Qiu, Bangqun Zhang, Chengquan Li, Zhiyong Huang, Xiaobin Feng, Rongshan Yu, Jiahong Dong2026-03-13🤖 cs.AI

Gender Bias in Generative AI-assisted Recruitment Processes

Questo studio valuta l'impatto del modello generativo GPT-5 nel reclutamento di laureati italiani under-35, rivelando che, sebbene le proposte occupazionali non mostrino differenze significative, il modello perpetua stereotipi di genere assegnando aggettivi emotivi ed empatici alle donne e tratti strategici e analitici agli uomini, sollevando così preoccupazioni etiche sull'uso di tali sistemi nei processi di selezione.

Martina Ullasci, Marco Rondina, Riccardo Coppola, Antonio Vetrò2026-03-13🤖 cs.AI

Anomaly detection in time-series via inductive biases in the latent space of conditional normalizing flows

Il paper propone un metodo per il rilevamento di anomalie nelle serie temporali multivariate che, superando i limiti della massimizzazione della verosimiglianza nello spazio delle osservazioni, sposta la definizione di anomalia in uno spazio latente vincolato da bias induttivi e dinamiche temporali prescritte, permettendo così di identificare le deviazioni tramite test statistici di conformità ai modelli di evoluzione temporale.

David Baumgartner, Eliezer de Souza da Silva, Iñigo Urteaga2026-03-13🤖 cs.AI

Exploiting Expertise of Non-Expert and Diverse Agents in Social Bandit Learning: A Free Energy Approach

Questo studio propone un algoritmo di apprendimento sociale basato sull'energia libera per i banditi sociali, che permette a un agente di valutare e sfruttare le competenze di altri agenti non esperti o diversificati senza conoscere le loro ricompense, migliorando le prestazioni individuali e garantendo una convergenza teorica ottimale.

Erfan Mirzaei, Seyed Pooya Shariatpanahi, Alireza Tavakoli, Reshad Hosseini, Majid Nili Ahmadabadi2026-03-13📊 stat

Governing Evolving Memory in LLM Agents: Risks, Mechanisms, and the Stability and Safety Governed Memory (SSGM) Framework

Questo lavoro propone il framework SSGM (Stabilità e Sicurezza Governata della Memoria) per affrontare i rischi di corruzione e deriva semantica nei sistemi di memoria a lungo termine degli agenti LLM, garantendo la sicurezza e l'affidabilità attraverso meccanismi di verifica della coerenza, modellazione del decadimento temporale e controllo degli accessi dinamico.

Chingkwun Lam, Jiaxin Li, Lingfei Zhang, Kuo Zhao2026-03-13🤖 cs.AI

An Automatic Text Classification Method Based on Hierarchical Taxonomies, Neural Networks and Document Embedding: The NETHIC Tool

Il documento descrive NETHIC, uno strumento di classificazione automatica del testo che combina reti neurali scalabili e tassonomie gerarchiche, il quale è stato recentemente migliorato con un meccanismo di embedding dei documenti che ne ha aumentato le prestazioni su corpora generici e specifici.

Luigi Lomasto, Rosario Di Florio, Andrea Ciapetti, Giuseppe Miscione, Giulia Ruggiero, Daniele Toti2026-03-13🤖 cs.AI