cs.CL articles | Gist.Science

Aligning the True Semantics: Constrained Decoupling and Distribution Sampling for Cross-Modal Alignment

Ce papier propose CDDS, un nouvel algorithme d'alignement cross-modal qui utilise un décodage contraint et un échantillonnage de distribution pour isoler les véritables sémantiques des informations modales, surpassant ainsi les méthodes de l'état de l'art de 6,6 % à 14,2 %.

Xiang Ma, Lexin Fang, Litian Xu, Caiming Zhang2026-03-09🤖 cs.LG

CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain

Cet article propose CBR-to-SQL, un cadre inspiré du raisonnement à partir de cas qui améliore la génération de requêtes SQL à partir de questions en langage naturel dans le domaine de la santé grâce à une recherche en deux étapes, surpassant les approches RAG standard en précision, efficacité et robustesse sur le jeu de données MIMICSQL.

Hung Nguyen, Hans Moen, Pekka Marttinen2026-03-09🤖 cs.AI

NOTAI.AI: Explainable Detection of Machine-Generated Text via Curvature and Feature Attribution

Le papier présente NOTAI.AI, un cadre interprétable de détection de texte généré par IA qui combine des signaux de courbure, des métriques stylistiques et un classifieur XGBoost enrichi par des explications SHAP et des rationales en langage naturel via un LLM, le tout accessible via une application web interactive.

Oleksandr Marchenko Breneur, Adelaide Danilov, Aria Nourbakhsh, Salima Lamsiyah2026-03-09💬 cs.CL

Safer Reasoning Traces: Measuring and Mitigating Chain-of-Thought Leakage in LLMs

Cette étude révèle que l'activation du raisonnement par chaîne de pensée (CoT) dans les grands modèles de langage augmente significativement les fuites d'informations personnellement identifiables (PII), démontrant ainsi la nécessité de politiques de filtrage hybrides et adaptatives pour équilibrer utilité et sécurité.

Patrick Ahrend, Tobias Eder, Xiyang Yang, Zhiyi Pan, Georg Groh2026-03-09💬 cs.CL

RACAS: Controlling Diverse Robots With a Single Agentic System

Le papier présente RACAS, une architecture agentic basée sur des modèles de langage qui permet de contrôler de manière unifiée et sans réentraînement divers robots (terrestres, sous-marins et articulés) en se fiant uniquement à des descriptions et commandes en langage naturel.

Dylan R. Ashley, Jan Przepióra, Yimeng Chen, Ali Abualsaud, Nurzhan Yesmagambet, Shinkyu Park, Eric Feron, Jürgen Schmidhuber2026-03-09🤖 cs.AI

The Fragility Of Moral Judgment In Large Language Models

Cette étude démontre que les jugements moraux des grands modèles de langage sont fragiles et fortement influencés par la forme narrative, le point de vue et la structure de la tâche plutôt que par la substance éthique des dilemmes, soulevant ainsi des inquiétudes majeures concernant la reproductibilité et l'équité de ces systèmes.

Tom van Nuenen, Pratik S. Sachdeva2026-03-09🤖 cs.AI

FreeTxt-Vi: A Benchmarked Vietnamese-English Toolkit for Segmentation, Sentiment, and Summarisation

FreeTxt-Vi est une boîte à outils web open source qui intègre un pipeline NLP bilingue vietnamien-anglais pour la segmentation, l'analyse de sentiments et le résumé de texte, offrant des performances compétitives tout en rendant l'analyse de corpus accessible aux non-spécialistes.

Hung Nguyen Huy, Mo El-Haj, Dawn Knight, Paul Rayson2026-03-09💬 cs.CL

Autonomous Algorithm Discovery for Ptychography via Evolutionary LLM Reasoning

Ce papier présente Ptychi-Evolve, un cadre autonome utilisant des modèles de langage et des mécanismes évolutifs pour découvrir automatiquement de nouvelles fonctions de régularisation qui surpassent les méthodes conventionnelles en ptychographie.

Xiangyu Yin, Ming Du, Junjing Deng, Zhi Yang, Yimo Han, Yi Jiang2026-03-09🤖 cs.AI

Towards Robust Retrieval-Augmented Generation Based on Knowledge Graph: A Comparative Analysis

Cette étude utilise le benchmark RGB pour comparer le RAG standard et le GraphRAG, démontrant que les personnalisations basées sur les graphes de connaissances améliorent la robustesse des modèles face au bruit, à l'intégration d'informations et aux affirmations contrefactuelles.

Hazem Amamou, Stéphane Gagnon, Alan Davoust, Anderson R. Avila2026-03-09💬 cs.CL

Cultural Perspectives and Expectations for Generative AI: A Global Survey Approach

Cet article présente une enquête mondiale visant à cerner les perceptions culturelles de l'IA générative afin de définir des recommandations pour son développement, notamment par l'adoption d'approches participatives et d'un cadre de sensibilité aux limites culturelles.

Erin van Liemt, Renee Shelby, Andrew Smart, Sinchana Kumbale, Richard Zhang, Neha Dixit, Qazi Mamunur Rashid, Jamila Smith-Loud2026-03-09🤖 cs.AI

Structured Multidimensional Representation Learning for Large Language Models

Cet article présente le L-Transformer, une architecture qui utilise une factorisation spectrale tensorielle pour décomposer les encodeurs en sous-réseaux indépendants, permettant ainsi de réduire considérablement le nombre de paramètres tout en préservant les performances et en introduisant un biais inductif favorable à la généralisation.

Alaa El Ichi, Khalide Jbilou, Mohamed El Guide, Franck Dufrenois2026-03-09💬 cs.CL

Let's Talk, Not Type: An Oral-First Multi-Agent Architecture for Guaraní

Ce papier de position propose une architecture multi-agents axée sur l'oralité pour le guarani, visant à dépasser les approches textocentriques de l'IA afin de respecter la souveraineté des données autochtones et les pratiques conversationnelles vivantes du Paraguay.

Samantha Adorno, Akshata Kishore Moharir, Ratna Kandala2026-03-09💬 cs.CL

CodeScout: Contextual Problem Statement Enhancement for Software Agents

Le papier présente CodeScout, une approche de raffinement de requêtes qui améliore les performances des agents de codage en transformant les demandes mal définies en problèmes contextuels complets grâce à une pré-exploration structurée du code, permettant une augmentation de 20 % du taux de résolution sur le benchmark SWEBench-Verified.

Manan Suri, Xiangci Li, Mehdi Shojaie, Songyang Han, Chao-Chun Hsu, Shweta Garg, Aniket Anand Deshmukh, Varun Kumar2026-03-09💬 cs.CL

NERdME: a Named Entity Recognition Dataset for Indexing Research Artifacts in Code Repositories

Le papier présente NERdME, un nouveau jeu de données annoté manuellement de 200 fichiers README, conçu pour combler le manque de ressources d'extraction d'entités nommées au niveau de l'implémentation dans les dépôts de code et faciliter la découverte d'artefacts de recherche.

Genet Asefa Gesese, Zongxiong Chen, Shufan Jiang, Mary Ann Tan, Zhaotai Liu, Sonja Schimmler, Harald Sack2026-03-09💬 cs.CL

PVminerLLM: Structured Extraction of Patient Voice from Patient-Generated Text using Large Language Models

Ce papier présente PVminerLLM, un modèle de langage supervisé qui surpasse les approches par prompting pour extraire de manière structurée et précise les signaux de la voix des patients à partir de textes générés par eux-mêmes, facilitant ainsi l'analyse à grande échelle des déterminants non cliniques des résultats de santé.

Samah Fodeh, Linhai Ma, Ganesh Puthiaraju, Srivani Talakokkul, Afshan Khan, Ashley Hagaman, Sarah Lowe, Aimee Roundtree2026-03-09🤖 cs.AI

Tutor Move Taxonomy: A Theory-Aligned Framework for Analyzing Instructional Moves in Tutoring

Cet article présente une taxonomie des interventions tutorales, élaborée par une approche hybride déductive-inductive et alignée sur la théorie, qui catégorise les actions pédagogiques en quatre domaines pour permettre une analyse à grande échelle des dialogues de tutorat et leur lien avec les résultats d'apprentissage.

Zhuqian Zhou, Kirk Vanacore, Tamisha Thompson, Jennifer St John, Rene Kizilcec2026-03-09💬 cs.CL

Proof-of-Guardrail in AI Agents and What (Not) to Trust from It

Cet article propose le « Proof-of-Guardrail », un système utilisant des environnements d'exécution de confiance (TEE) pour fournir des preuves cryptographiques vérifiables de l'exécution de garde-fous de sécurité dans les agents IA, tout en soulignant les limites de cette approche face aux tentatives de contournement malveillant.

Xisen Jin, Michael Duan, Qin Lin, Aaron Chan, Zhenglun Chen, Junyi Du, Xiang Ren2026-03-09🤖 cs.AI

RouteGoT: Node-Adaptive Routing for Cost-Efficient Graph of Thoughts Reasoning

Le papier présente RouteGoT, un cadre de raisonnement adaptatif qui optimise le rapport coût-précision des graphes de pensées en acheminant dynamiquement les tâches vers des modèles de différentes tailles selon leur difficulté et en respectant des contraintes budgétaires globales.

Yuhang Liu, Ruijie Wang, Yunlong Chu, Bing Hao, Yumeng Lin, Shengzhong Liu, Minglai Shao2026-03-09💬 cs.CL

HART: Data-Driven Hallucination Attribution and Evidence-Based Tracing for Large Language Models

Le papier présente HART, un cadre de recherche d'informations et d'attribution des hallucinations à granularité fine pour les grands modèles de langage, qui formalise le traçage des erreurs en quatre étapes structurées et introduit un nouveau jeu de données annoté pour améliorer l'interprétabilité et la traçabilité des preuves factuelles.

Shize Liang, Hongzhi Wang2026-03-09💬 cs.CL

Test-Time Adaptation via Many-Shot Prompting: Benefits, Limits, and Pitfalls

Cette étude empirique examine les avantages, les limites et les pièges de l'adaptation au moment du test par le biais du prompting à plusieurs exemples, révélant que cette méthode est efficace pour les tâches structurées mais sensible à la stratégie de sélection et souvent peu bénéfique pour les tâches de génération ouverte.

Shubhangi Upasani, Chen Wu, Jay Rainton, Bo Li, Changran Hu, Qizheng Zhang, Urmish Thakker2026-03-09🤖 cs.LG

← Précédent Suivant →