cs.CL articles | Gist.Science

The EpisTwin: A Knowledge Graph-Grounded Neuro-Symbolic Architecture for Personal AI

L'article présente EpisTwin, une architecture neuro-symbolique qui surmonte la fragmentation des données personnelles en ancrant le raisonnement génératif dans un graphe de connaissances personnel vérifiable, enrichi par des modèles multimodaux et un agent de coordination pour une compréhension holistique et contextuelle.

Giovanni Servedio, Potito Aghilar, Alessio Mattiace, Gianni Carmosino, Francesco Musicco, Gabriele Conte, Vito Walter Anelli, Tommaso Di Noia, Francesco Maria Donini2026-03-09🤖 cs.AI

Continual Adaptation for Pacific Indigenous Speech Recognition

Cette étude empirique démontre que l'adaptation des modèles de reconnaissance vocale aux langues autochtones du Pacifique, bien que cruciale pour pallier le manque de données, se heurte à un dilemme entre plasticité et stabilité, où des méthodes comme LoRA échouent à éviter l'oubli catastrophique lors de l'apprentissage continu de multiples langues.

Yang Xiao, Aso Mahmudi, Nick Thieberger, Eliathamby Ambikairajah, Eun-Jung Holden, Ting Dang2026-03-09💬 cs.CL

The Art That Poses Back: Assessing AI Pastiches after Contemporary Artworks

Cette étude évalue la capacité de ChatGPT à pasticher des œuvres d'art contemporaines, révélant un écart significatif entre les similarités visuelles et la perte de dimensionnalité, de contexte et d'intentionnalité perçue par les artistes originaux, ce qui plaide pour l'adoption d'un tableau de bord de métriques complémentaires plutôt que d'une mesure unique.

Anca Dinu, Andreiana Mihail, Andra-Maria Florescu, Claudiu Creanga2026-03-09💬 cs.CL

SAHOO: Safeguarded Alignment for High-Order Optimization Objectives in Recursive Self-Improvement

Le papier présente SAHOO, un cadre pratique qui garantit l'alignement lors de l'amélioration récursive de soi en surveillant la dérive des objectifs grâce à trois mécanismes de sécurité, tout en démontrant des gains de performance significatifs dans des tâches de codage et de raisonnement sans compromettre la sécurité.

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-09🤖 cs.AI

Transparent AI for Mathematics: Transformer-Based Large Language Models for Mathematical Entity Relationship Extraction with XAI

Cette étude propose un cadre interprétable pour l'extraction des relations entre entités mathématiques en utilisant des modèles BERT atteignant 99,39 % de précision, renforcés par des techniques d'intelligence artificielle explicable (SHAP) pour garantir la transparence des prédictions.

Tanjim Taharat Aurpa2026-03-09💬 cs.CL

Evaluation of Deontic Conditional Reasoning in Large Language Models: The Case of Wason's Selection Task

Cette étude introduit un nouveau jeu de données pour évaluer le raisonnement déontique des grands modèles de langage via la tâche de sélection de Wason, révélant qu'ils surpassent leur performance dans les contextes normatifs et présentent des biais d'appariement similaires à ceux observés chez les humains.

Hirohiko Abe, Kentaro Ozeki, Risako Ando, Takanobu Morishita, Koji Mineshima, Mitsuhiro Okada2026-03-09💬 cs.CL

From Prompting to Preference Optimization: A Comparative Study of LLM-based Automated Essay Scoring

Cette étude présente une comparaison unifiée des principales approches d'évaluation automatique des essais par les grands modèles de langage pour l'anglais langue seconde, démontrant que la combinaison du fine-tuning supervisé et de l'optimisation des préférences avec la génération augmentée par récupération (RAG) atteint les meilleurs résultats avec un score F1 de 93 %.

Minh Hoang Nguyen, Vu Hoang Pham, Xuan Thanh Huynh, Phuc Hong Mai, Vinh The Nguyen, Quang Nhut Huynh, Huy Tien Nguyen, Tung Le2026-03-09💬 cs.CL

Abductive Reasoning with Syllogistic Forms in Large Language Models

Cet article examine la capacité des grands modèles de langage à effectuer un raisonnement abductif, défini comme l'inverse du syllogisme, afin de déterminer s'ils présentent des biais similaires à ceux des humains et d'identifier des pistes pour améliorer leur raisonnement contextuel au-delà de la déduction formelle.

Hirohiko Abe, Risako Ando, Takanobu Morishita Kentaro Ozeki, Koji Mineshima, Mitsuhiro Okada2026-03-09🤖 cs.AI

PONTE: Personalized Orchestration for Natural Language Trustworthy Explanations

Le papier présente PONTE, un cadre d'IA explicable intégrant l'humain dans la boucle qui génère des explications naturelles personnalisées et fiables en combinant un modèle de préférences, un générateur conditionné et des modules de vérification, surpassant ainsi les approches traditionnelles dans les domaines de la santé et de la finance.

Vittoria Vineis, Matteo Silvestri, Lorenzo Antonelli, Filippo Betello, Gabriele Tolomei2026-03-09🤖 cs.AI

NOBLE: Accelerating Transformers with Nonlinear Low-Rank Branches

Le papier présente NOBLE, une architecture d'augmentation permanente intégrant des branches non linéaires de faible rang dans les couches linéaires des transformateurs pour accélérer l'entraînement à partir de zéro avec un surcoût paramétrique minimal, offrant jusqu'à 1,22 fois une accélération nette du temps d'exécution tout en améliorant l'efficacité sur divers modèles comme les LLM, BERT et ViT.

Ethan Smith (Canva Research)2026-03-09🤖 cs.AI

COLD-Steer: Steering Large Language Models via In-Context One-step Learning Dynamics

Le papier présente COLD-Steer, un cadre d'entraînement gratuit qui contrôle le comportement des grands modèles de langage en approxifiant les changements d'activation résultant d'une descente de gradient sur des exemples en contexte, permettant ainsi un pilotage efficace avec jusqu'à 50 fois moins d'échantillons que les méthodes existantes.

Kartik Sharma, Rakshit S. Trivedi2026-03-09🤖 cs.AI

Beyond Rows to Reasoning: Agentic Retrieval for Multimodal Spreadsheet Understanding and Editing

Le papier présente BRTR, un cadre agentique multimodal qui améliore la compréhension et l'édition de feuilles de calcul d'entreprise complexes en remplaçant la récupération unique par une boucle itérative d'appels d'outils, atteignant ainsi des performances de pointe sur plusieurs benchmarks grâce à une approche auditable et optimisée.

Anmol Gulati, Sahil Sen, Waqar Sarguroh, Kevin Paul2026-03-09💬 cs.CL

Speak in Context: Multilingual ASR with Speech Context Alignment via Contrastive Learning

Cet article présente un cadre ASR multilingue contextuel qui améliore la qualité de la transcription en alignant les représentations de la parole et du contexte via un apprentissage par contraste, permettant ainsi de gérer efficacement plus de 1 500 heures de conversations dans 11 langues et 5 dialectes anglais.

Yuchen Zhang, Haralambos Mouratidis, Ravi Shekhar2026-03-09💬 cs.CL

KCLarity at SemEval-2026 Task 6: Encoder and Zero-Shot Approaches to Political Evasion Detection

Ce papier présente la participation de l'équipe KCLarity à la tâche CLARITY de SemEval 2026, où ils comparent des approches d'encodage et de zéro-shot pour détecter l'évasion politique, révélant que si RoBERTa-large excelle sur l'ensemble de test public, le modèle GPT-5.2 en zéro-shot généralise mieux sur l'ensemble d'évaluation caché.

Archie Sage, Salvatore Greco2026-03-09💬 cs.CL

EHRSQL: A Practical Text-to-SQL Benchmark for Electronic Health Records

Ce papier présente EHRSQL, un nouveau benchmark pratique texte-vers-SQL pour les dossiers médicaux électroniques, construit à partir de données réelles collectées auprès de personnel hospitalier et adapté aux défis spécifiques du secteur de la santé tels que la complexité des requêtes, la gestion du temps et la détection des questions sans réponse.

Gyubok Lee, Hyeonji Hwang, Seongsu Bae + 6 more2026-03-06💻 cs

Large Language Models are Contrastive Reasoners

Ce papier démontre que l'ajout d'une simple instruction demandant au modèle de fournir une réponse correcte et une réponse erronée (prompting contrastif) améliore considérablement les capacités de raisonnement des grands modèles de langage sur diverses tâches, surpassant souvent les méthodes d'inférence en zéro ou quelques coups existantes.

Liang Yao2026-03-06💻 cs

INMS: Memory Sharing for Large Language Model based Agents

L'article présente INMS, un cadre de partage de mémoire asynchrone qui améliore les performances des agents basés sur les grands modèles de langage en établissant un pool de mémoire conversationnelle partagée pour faciliter l'échange dynamique de connaissances et l'auto-amélioration collective.

Hang Gao, Yongfeng Zhang2026-03-06💻 cs

EasyAnimate: High-Performance Video Generation Framework with Hybrid Windows Attention and Reward Backpropagation

Ce papier présente EasyAnimate, un cadre de génération vidéo haute performance qui combine l'attention hybride par fenêtres, la rétropropagation de récompense et des stratégies d'entraînement innovantes pour atteindre des résultats de pointe en qualité et en efficacité.

Jiaqi Xu, Kunzhe Huang, Xinyi Zou + 5 more2026-03-06💻 cs

Vector Retrieval with Similarity and Diversity: How Hard Is It?

Cet article présente une nouvelle approche théorique et algorithmique pour la récupération de vecteurs équilibrant similarité et diversité, prouvant la complexité NP-complète du problème et proposant un heuristique sans paramètre qui surpasse les méthodes existantes comme MMR et k-DPP.

Hang Gao, Dong Deng, Yongfeng Zhang2026-03-06💻 cs

Enhancing Pancreatic Cancer Staging with Large Language Models: The Role of Retrieval-Augmented Generation

Cette étude démontre que l'utilisation de la génération augmentée par la récupération (RAG) dans NotebookLM améliore significativement la précision du stadification du cancer du pancréas par rapport au modèle Gemini 2.0 Flash seul, tout en offrant une transparence clinique grâce à la présentation des sources de connaissances externes.

Hisashi Johno, Yuki Johno, Akitomo Amakawa + 9 more2026-03-06💻 cs

← Précédent Suivant →