cs.AI articoli | Gist.Science

LLMs can construct powerful representations and streamline sample-efficient supervised learning

Il paper propone un'agente pipeline basata su LLM che genera rubriche per standardizzare dati eterogenei, migliorando significativamente l'apprendimento supervisionato su compiti clinici rispetto a modelli tradizionali e foundation model, garantendo al contempo auditabilità, efficienza dei costi e interoperabilità con tecniche di machine learning tabellare.

Ilker Demirel, Larry Shi, Zeshan Hussain, David Sontag2026-03-13🤖 cs.AI

Entropy-Preserving Reinforcement Learning

Questo paper introduce metodi di apprendimento per rinforzo che preservano l'entropia, come REPO e ADAPO, per contrastare la riduzione naturale della diversità delle traiettorie negli algoritmi di gradiente della politica, garantendo così politiche finali più performanti e capaci di apprendimento sequenziale continuo.

Aleksei Petrenko, Ben Lipkin, Kevin Chen, Erik Wijmans, Marco Cusumano-Towner, Raja Giryes, Philipp Krähenbühl2026-03-13🤖 cs.LG

Causal Prosody Mediation for Text-to-Speech:Counterfactual Training of Duration, Pitch, and Energy in FastSpeech2

Il paper propone un nuovo framework di mediazione causale per la sintesi vocale che, integrando un modello strutturale causale e obiettivi di addestramento controfattuale nell'architettura FastSpeech2, disaccoppia efficacemente l'espressività emotiva dal contenuto linguistico per ottenere una manipolazione del prosodia più controllabile e naturale.

Suvendu Sekhar Mohanty2026-03-13🤖 cs.AI

SemBench: A Universal Semantic Framework for LLM Evaluation

Il paper introduce SemBench, un framework universale e multilingue che genera automaticamente benchmark sintetici per valutare la comprensione semantica dei modelli linguistici di grandi dimensioni utilizzando solo definizioni lessicali, offrendo un metodo scalabile, efficiente e indipendente dalla lingua rispetto ai tradizionali dataset curati.

Mikel Zubillaga, Naiara Perez, Oscar Sainz, German Rigau2026-03-13💬 cs.CL

Explicit Logic Channel for Validation and Enhancement of MLLMs on Zero-Shot Tasks

Il paper propone un "Canale Logico Esplicito" parallelo ai modelli MLLM esistenti, che integra ragionamento logico e inferenza probabilistica per validare, selezionare e migliorare le prestazioni dei modelli multimodali su compiti zero-shot senza necessità di annotazioni di ground-truth, aumentando così la loro affidabilità e spiegabilità.

Mei Chee Leong, Ying Gu, Hui Li Tan, Liyuan Li, Nancy Chen2026-03-13🤖 cs.AI

STAIRS-Former: Spatio-Temporal Attention with Interleaved Recursive Structure Transformer for Offline Multi-task Multi-agent Reinforcement Learning

Il paper presenta STAIRS-Former, un'architettura transformer basata su gerarchie spaziali e temporali e su un meccanismo di ricorsione intercalata, che supera i metodi esistenti nell'apprendimento per rinforzo multi-agente offline multi-task garantendo una migliore coordinazione, una gestione robusta di popolazioni di agenti variabili e una superiore capacità di catturare dipendenze temporali a lungo termine.

Jiwon Jeon, Myungsik Cho, Youngchul Sung2026-03-13🤖 cs.AI

OSCBench: Benchmarking Object State Change in Text-to-Video Generation

Il paper introduce OSCBench, un nuovo benchmark basato su dati di cucina che valuta la capacità dei modelli di generazione video da testo di rappresentare correttamente i cambiamenti di stato degli oggetti, rivelando che le attuali tecnologie faticano a gestire tali trasformazioni, specialmente in scenari nuovi o compositi.

Xianjing Han, Bin Zhu, Shiqi Hu, Franklin Mingzhe Li, Patrick Carrington, Roger Zimmermann, Jingjing Chen2026-03-13💬 cs.CL

Scaling Laws for Educational AI Agents

Il paper propone una "Legge di Scalabilità per Agenti" basata su definizioni di ruolo, competenze, strumenti e competenze umane, implementata tramite il formato strutturato AgentProfile e la piattaforma EduClaw, dimostrando che le prestazioni degli agenti educativi crescono in modo prevedibile con la ricchezza strutturale dei profili piuttosto che con la sola dimensione del modello.

Mengsong Wu, Hao Hao, Shuzhen Bi, Keqian Li, Wentao Liu, Siyu Song, Hongbo Zhao, Aimin Zhou2026-03-13🤖 cs.AI

Affect Decoding in Phonated and Silent Speech Production from Surface EMG

Questo studio introduce un nuovo dataset e dimostra che l'analisi dell'attività muscolare facciale tramite elettromiografia di superficie (sEMG) permette di decodificare con affidabilità stati emotivi come la frustrazione, generalizzando efficacemente sia nel parlato fonato che in quello silenzioso.

Simon Pistrosch, Kleanthis Avramidis, Tiantian Feng, Jihwan Lee, Monica Gonzalez-Machorro, Shrikanth Narayanan, Björn W. Schuller2026-03-13⚡ eess

When OpenClaw Meets Hospital: Toward an Agentic Operating System for Dynamic Clinical Workflows

Questo lavoro propone un'architettura per un "Sistema Operativo Agente" ospedaliero, basata su OpenClaw, che integra un ambiente di esecuzione limitato, una memoria a lungo termine indicizzata e una libreria di competenze mediche curate per garantire l'automazione sicura, trasparente e tracciabile dei flussi di lavoro clinici.

Wenxian Yang, Hanzheng Qiu, Bangqun Zhang, Chengquan Li, Zhiyong Huang, Xiaobin Feng, Rongshan Yu, Jiahong Dong2026-03-13🤖 cs.AI

Adapting Dijkstra for Buffers and Unlimited Transfers

Questo lavoro introduce l'algoritmo Transfer Aware Dijkstra (TAD), una modifica del Dijkstra temporale che gestisce correttamente i tempi di attesa alle fermate distinguendo tra passeggeri seduti e in transito, dimostrando sperimentalmente di superare le prestazioni dell'algoritmo MR mantenendo risultati ottimali su reti reali.

Denys Katkalo, Andrii Rohovyi, Toby Walsh2026-03-13🤖 cs.AI

Gender Bias in Generative AI-assisted Recruitment Processes

Questo studio valuta l'impatto del modello generativo GPT-5 nel reclutamento di laureati italiani under-35, rivelando che, sebbene le proposte occupazionali non mostrino differenze significative, il modello perpetua stereotipi di genere assegnando aggettivi emotivi ed empatici alle donne e tratti strategici e analitici agli uomini, sollevando così preoccupazioni etiche sull'uso di tali sistemi nei processi di selezione.

Martina Ullasci, Marco Rondina, Riccardo Coppola, Antonio Vetrò2026-03-13🤖 cs.AI

CINDI: Conditional Imputation and Noisy Data Integrity with Flows in Power Grid Data

Il paper introduce CINDI, un framework probabilistico non supervisionato basato su flussi normalizzanti condizionali che unifica il rilevamento delle anomalie e l'imputazione dei dati per ripristinare l'integrità delle serie temporali multivariate nelle reti elettriche, superando i limiti degli approcci tradizionali frammentati.

David Baumgartner, Helge Langseth, Heri Ramampiaro2026-03-13🤖 cs.AI

Compression Favors Consistency, Not Truth: When and Why Language Models Prefer Correct Information

Lo studio dimostra che la preferenza dei modelli linguistici per affermazioni corrette non deriva da un intrinseco bias verso la verità, ma è un effetto collaterale della pressione di compressione che favorisce le ipotesi con descrizioni più brevi e internamente coerenti.

Konstantin Krestnikov2026-03-13💬 cs.CL

Anomaly detection in time-series via inductive biases in the latent space of conditional normalizing flows

Il paper propone un metodo per il rilevamento di anomalie nelle serie temporali multivariate che, superando i limiti della massimizzazione della verosimiglianza nello spazio delle osservazioni, sposta la definizione di anomalia in uno spazio latente vincolato da bias induttivi e dinamiche temporali prescritte, permettendo così di identificare le deviazioni tramite test statistici di conformità ai modelli di evoluzione temporale.

David Baumgartner, Eliezer de Souza da Silva, Iñigo Urteaga2026-03-13🤖 cs.AI

Exploiting Expertise of Non-Expert and Diverse Agents in Social Bandit Learning: A Free Energy Approach

Questo studio propone un algoritmo di apprendimento sociale basato sull'energia libera per i banditi sociali, che permette a un agente di valutare e sfruttare le competenze di altri agenti non esperti o diversificati senza conoscere le loro ricompense, migliorando le prestazioni individuali e garantendo una convergenza teorica ottimale.

Erfan Mirzaei, Seyed Pooya Shariatpanahi, Alireza Tavakoli, Reshad Hosseini, Majid Nili Ahmadabadi2026-03-13📊 stat

Understanding Wikidata Qualifiers: An Analysis and Taxonomy

Questo articolo presenta un'analisi approfondita dei qualificatori di Wikidata e propone una tassonomia strutturata, basata su un indice di entropia di Shannon modificato, per guidare la creazione, la query e l'inferenza logica dei dati nella conoscenza.

Gilles Falquet, Sahar Aljalbout2026-03-13🤖 cs.AI

Governing Evolving Memory in LLM Agents: Risks, Mechanisms, and the Stability and Safety Governed Memory (SSGM) Framework

Questo lavoro propone il framework SSGM (Stabilità e Sicurezza Governata della Memoria) per affrontare i rischi di corruzione e deriva semantica nei sistemi di memoria a lungo termine degli agenti LLM, garantendo la sicurezza e l'affidabilità attraverso meccanismi di verifica della coerenza, modellazione del decadimento temporale e controllo degli accessi dinamico.

Chingkwun Lam, Jiaxin Li, Lingfei Zhang, Kuo Zhao2026-03-13🤖 cs.AI

An Automatic Text Classification Method Based on Hierarchical Taxonomies, Neural Networks and Document Embedding: The NETHIC Tool

Il documento descrive NETHIC, uno strumento di classificazione automatica del testo che combina reti neurali scalabili e tassonomie gerarchiche, il quale è stato recentemente migliorato con un meccanismo di embedding dei documenti che ne ha aumentato le prestazioni su corpora generici e specifici.

Luigi Lomasto, Rosario Di Florio, Andrea Ciapetti, Giuseppe Miscione, Giulia Ruggiero, Daniele Toti2026-03-13🤖 cs.AI

From Debate to Deliberation: Structured Collective Reasoning with Typed Epistemic Acts

Il paper introduce la Deliberative Collective Intelligence (DCI), un framework che migliora significativamente la risoluzione di compiti complessi e non routinari attraverso un processo strutturato di ragionamento collettivo con atti epistemici tipizzati, pur evidenziando un elevato costo computazionale e una minore efficacia rispetto a un singolo agente su decisioni di routine.

Sunil Prakash2026-03-13🤖 cs.AI

← Precedente Successivo →