CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain

Il paper introduce CBR-to-SQL, un framework basato sul ragionamento per casi che supera le limitazioni dei metodi RAG tradizionali nel dominio sanitario, ottenendo risultati all'avanguardia nella traduzione da testo a SQL su dati EHR grazie a un processo di recupero a due stadi che migliora l'efficienza e la robustezza anche in condizioni di scarsità di dati.

Hung Nguyen, Hans Moen, Pekka Marttinen2026-03-09🤖 cs.AI

NOTAI.AI: Explainable Detection of Machine-Generated Text via Curvature and Feature Attribution

NOTAI.AI è un framework spiegabile per il rilevamento di testi generati da IA che combina segnali di curvatura, caratteristiche neurali e stilometriche in un classificatore XGBoost, utilizzando SHAP e un layer basato su LLM per fornire attribuzioni di funzionalità e spiegazioni in linguaggio naturale tramite un'applicazione web interattiva.

Oleksandr Marchenko Breneur, Adelaide Danilov, Aria Nourbakhsh, Salima Lamsiyah2026-03-09💬 cs.CL

FreeTxt-Vi: A Benchmarked Vietnamese-English Toolkit for Segmentation, Sentiment, and Summarisation

Il documento presenta FreeTxt-Vi, un toolkit open source basato sul web che integra tecniche di segmentazione ibrida, analisi del sentiment e riassunto testuale per facilitare l'elaborazione di corpus bilingui vietnamita-inglese senza richiedere competenze di programmazione, dimostrando prestazioni competitive rispetto alle soluzioni esistenti.

Hung Nguyen Huy, Mo El-Haj, Dawn Knight, Paul Rayson2026-03-09💬 cs.CL

Towards Robust Retrieval-Augmented Generation Based on Knowledge Graph: A Comparative Analysis

Questo studio utilizza il benchmark RGB per confrontare l'efficacia di un sistema RAG basato su grafi della conoscenza (GraphRAG) rispetto a una baseline standard, dimostrando che le personalizzazioni di GraphRAG migliorano significativamente la robustezza dei modelli linguistici di fronte a rumore, informazioni contraddittorie e scenari negativi.

Hazem Amamou, Stéphane Gagnon, Alan Davoust, Anderson R. Avila2026-03-09💬 cs.CL

Cultural Perspectives and Expectations for Generative AI: A Global Survey Approach

Questo studio presenta i risultati di un'indagine globale su larga scala per analizzare le percezioni e le aspettative riguardo alla rappresentazione culturale nell'IA generativa, proponendo definizioni operative di cultura e raccomandazioni per lo sviluppo di sistemi più inclusivi e sensibili alle specificità culturali.

Erin van Liemt, Renee Shelby, Andrew Smart, Sinchana Kumbale, Richard Zhang, Neha Dixit, Qazi Mamunur Rashid, Jamila Smith-Loud2026-03-09🤖 cs.AI

NERdME: a Named Entity Recognition Dataset for Indexing Research Artifacts in Code Repositories

Il paper introduce NERdME, un nuovo dataset di 200 file README annotati manualmente per colmare il divario nell'estrazione di informazioni scientifiche a livello di implementazione nei repository di codice, dimostrando come l'identificazione di entità specifiche in questi file possa migliorare la scoperta di artefatti e l'integrazione dei metadati.

Genet Asefa Gesese, Zongxiong Chen, Shufan Jiang, Mary Ann Tan, Zhaotai Liu, Sonja Schimmler, Harald Sack2026-03-09💬 cs.CL

PVminerLLM: Structured Extraction of Patient Voice from Patient-Generated Text using Large Language Models

Il paper introduce PVminer, un benchmark e un modello LLM supervisionato (PVminerLLM) che supera i metodi basati su prompt per estrarre in modo strutturato e scalabile le esperienze dei pazienti da testi generati dagli stessi, raggiungendo prestazioni elevate anche con modelli di dimensioni ridotte.

Samah Fodeh, Linhai Ma, Ganesh Puthiaraju, Srivani Talakokkul, Afshan Khan, Ashley Hagaman, Sarah Lowe, Aimee Roundtree2026-03-09🤖 cs.AI

Tutor Move Taxonomy: A Theory-Aligned Framework for Analyzing Instructional Moves in Tutoring

Questo articolo presenta una tassonomia delle azioni dei tutor, sviluppata attraverso un processo deduttivo-induttivo e organizzata in quattro categorie principali, che fornisce un quadro strutturato per l'analisi su larga scala dei dialoghi di tutoraggio al fine di collegare i comportamenti istruttivi ai risultati di apprendimento.

Zhuqian Zhou, Kirk Vanacore, Tamisha Thompson, Jennifer St John, Rene Kizilcec2026-03-09💬 cs.CL

Proof-of-Guardrail in AI Agents and What (Not) to Trust from It

Il paper propone "Proof-of-Guardrail", un sistema che utilizza ambienti di esecuzione attendibili (TEE) per fornire prove crittografiche verificabili che le risposte degli agenti AI sono state filtrate da specifici guardrail open-source, garantendo l'integrità del processo di sicurezza senza rivelare la logica proprietaria dell'agente, pur evidenziando i rischi residui di inganno da parte di sviluppatori malevoli.

Xisen Jin, Michael Duan, Qin Lin, Aaron Chan, Zhenglun Chen, Junyi Du, Xiang Ren2026-03-09🤖 cs.AI

RouteGoT: Node-Adaptive Routing for Cost-Efficient Graph of Thoughts Reasoning

Il paper presenta RouteGoT, un framework di routing adattivo che ottimizza l'efficienza dei costi e la precisione nel ragionamento a grafo (GoT) assegnando dinamicamente modelli leggeri ai sottocompiti semplici e modelli potenti alla pianificazione, riducendo significativamente l'uso di token rispetto alle tecniche esistenti.

Yuhang Liu, Ruijie Wang, Yunlong Chu, Bing Hao, Yumeng Lin, Shengzhong Liu, Minglai Shao2026-03-09💬 cs.CL

Test-Time Adaptation via Many-Shot Prompting: Benefits, Limits, and Pitfalls

Questo studio empirico analizza l'efficacia e i limiti del prompting many-shot come strategia di adattamento a tempo di test per i modelli linguistici, rivelando che mentre funziona bene per compiti strutturati ad alto guadagno informativo, è spesso sensibile alla selezione degli esempi e poco vantaggioso per la generazione aperta.

Shubhangi Upasani, Chen Wu, Jay Rainton, Bo Li, Changran Hu, Qizheng Zhang, Urmish Thakker2026-03-09🤖 cs.LG

ReflexiCoder: Teaching Large Language Models to Self-Reflect on Generated Code and Self-Correct It via Reinforcement Learning

Il paper introduce ReflexiCoder, un nuovo framework di apprendimento per rinforzo che addestra i modelli linguistici a internalizzare capacità autonome di auto-riflessione e auto-correzione del codice, ottenendo risultati all'avanguardia su diversi benchmark senza dipendere da oracoli esterni o feedback di esecuzione durante l'inferenza.

Juyong Jiang, Jiasi Shen, Sunghun Kim, Kang Min Yoo, Jeonghoon Kim, Sungju Kim2026-03-09🤖 cs.LG