CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain

Cet article propose CBR-to-SQL, un cadre inspiré du raisonnement à partir de cas qui améliore la génération de requêtes SQL à partir de questions en langage naturel dans le domaine de la santé grâce à une recherche en deux étapes, surpassant les approches RAG standard en précision, efficacité et robustesse sur le jeu de données MIMICSQL.

Hung Nguyen, Hans Moen, Pekka Marttinen2026-03-09🤖 cs.AI

NOTAI.AI: Explainable Detection of Machine-Generated Text via Curvature and Feature Attribution

Le papier présente NOTAI.AI, un cadre interprétable de détection de texte généré par IA qui combine des signaux de courbure, des métriques stylistiques et un classifieur XGBoost enrichi par des explications SHAP et des rationales en langage naturel via un LLM, le tout accessible via une application web interactive.

Oleksandr Marchenko Breneur, Adelaide Danilov, Aria Nourbakhsh, Salima Lamsiyah2026-03-09💬 cs.CL

Cultural Perspectives and Expectations for Generative AI: A Global Survey Approach

Cet article présente une enquête mondiale visant à cerner les perceptions culturelles de l'IA générative afin de définir des recommandations pour son développement, notamment par l'adoption d'approches participatives et d'un cadre de sensibilité aux limites culturelles.

Erin van Liemt, Renee Shelby, Andrew Smart, Sinchana Kumbale, Richard Zhang, Neha Dixit, Qazi Mamunur Rashid, Jamila Smith-Loud2026-03-09🤖 cs.AI

Structured Multidimensional Representation Learning for Large Language Models

Cet article présente le L-Transformer, une architecture qui utilise une factorisation spectrale tensorielle pour décomposer les encodeurs en sous-réseaux indépendants, permettant ainsi de réduire considérablement le nombre de paramètres tout en préservant les performances et en introduisant un biais inductif favorable à la généralisation.

Alaa El Ichi, Khalide Jbilou, Mohamed El Guide, Franck Dufrenois2026-03-09💬 cs.CL

CodeScout: Contextual Problem Statement Enhancement for Software Agents

Le papier présente CodeScout, une approche de raffinement de requêtes qui améliore les performances des agents de codage en transformant les demandes mal définies en problèmes contextuels complets grâce à une pré-exploration structurée du code, permettant une augmentation de 20 % du taux de résolution sur le benchmark SWEBench-Verified.

Manan Suri, Xiangci Li, Mehdi Shojaie, Songyang Han, Chao-Chun Hsu, Shweta Garg, Aniket Anand Deshmukh, Varun Kumar2026-03-09💬 cs.CL

NERdME: a Named Entity Recognition Dataset for Indexing Research Artifacts in Code Repositories

Le papier présente NERdME, un nouveau jeu de données annoté manuellement de 200 fichiers README, conçu pour combler le manque de ressources d'extraction d'entités nommées au niveau de l'implémentation dans les dépôts de code et faciliter la découverte d'artefacts de recherche.

Genet Asefa Gesese, Zongxiong Chen, Shufan Jiang, Mary Ann Tan, Zhaotai Liu, Sonja Schimmler, Harald Sack2026-03-09💬 cs.CL

PVminerLLM: Structured Extraction of Patient Voice from Patient-Generated Text using Large Language Models

Ce papier présente PVminerLLM, un modèle de langage supervisé qui surpasse les approches par prompting pour extraire de manière structurée et précise les signaux de la voix des patients à partir de textes générés par eux-mêmes, facilitant ainsi l'analyse à grande échelle des déterminants non cliniques des résultats de santé.

Samah Fodeh, Linhai Ma, Ganesh Puthiaraju, Srivani Talakokkul, Afshan Khan, Ashley Hagaman, Sarah Lowe, Aimee Roundtree2026-03-09🤖 cs.AI

Tutor Move Taxonomy: A Theory-Aligned Framework for Analyzing Instructional Moves in Tutoring

Cet article présente une taxonomie des interventions tutorales, élaborée par une approche hybride déductive-inductive et alignée sur la théorie, qui catégorise les actions pédagogiques en quatre domaines pour permettre une analyse à grande échelle des dialogues de tutorat et leur lien avec les résultats d'apprentissage.

Zhuqian Zhou, Kirk Vanacore, Tamisha Thompson, Jennifer St John, Rene Kizilcec2026-03-09💬 cs.CL

Proof-of-Guardrail in AI Agents and What (Not) to Trust from It

Cet article propose le « Proof-of-Guardrail », un système utilisant des environnements d'exécution de confiance (TEE) pour fournir des preuves cryptographiques vérifiables de l'exécution de garde-fous de sécurité dans les agents IA, tout en soulignant les limites de cette approche face aux tentatives de contournement malveillant.

Xisen Jin, Michael Duan, Qin Lin, Aaron Chan, Zhenglun Chen, Junyi Du, Xiang Ren2026-03-09🤖 cs.AI

Test-Time Adaptation via Many-Shot Prompting: Benefits, Limits, and Pitfalls

Cette étude empirique examine les avantages, les limites et les pièges de l'adaptation au moment du test par le biais du prompting à plusieurs exemples, révélant que cette méthode est efficace pour les tâches structurées mais sensible à la stratégie de sélection et souvent peu bénéfique pour les tâches de génération ouverte.

Shubhangi Upasani, Chen Wu, Jay Rainton, Bo Li, Changran Hu, Qizheng Zhang, Urmish Thakker2026-03-09🤖 cs.LG