cs.CL articles | Gist.Science

Towards Self-Robust LLMs: Intrinsic Prompt Noise Resistance via CoIPO

Cet article propose CoIPO, une méthode d'optimisation des préférences inverses basée sur l'apprentissage contrastif qui améliore la robustesse intrinsèque des grands modèles de langage face aux variations de prompts en minimisant l'écart entre les logits générés par des prompts propres et bruyants, validée par de nouveaux benchmarks et jeux de données.

Xin Yang, Letian Li, Abudukelimu Wuerkaixi + 5 more2026-03-05🤖 cs.AI

M-QUEST -- Meme Question-Understanding Evaluation on Semantics and Toxicity

Ce papier présente M-QUEST, un cadre sémantique et un benchmark de 609 paires question-réponse conçus pour évaluer la capacité des modèles de langage à interpréter la toxicité des mèmes en intégrant dix dimensions clés, révélant que les modèles avec instruction tuning surpassent les autres tout en restant limités sur les inférences pragmatiques.

Stefano De Giorgis, Ting-Chih Chen, Filip Ilievski2026-03-05🤖 cs.AI

The Influence of Iconicity in Transfer Learning for Sign Language Recognition

Cette étude démontre que l'utilisation de la transférence d'apprentissage basée sur l'iconicité entre des paires de langues des signes spécifiques (chinois-arabe et grec-flamand) améliore significativement les performances de reconnaissance, avec des gains allant jusqu'à 7,02 % pour l'arabe.

Keren Artiaga, Conor Lynch, Haithem Afli + 1 more2026-03-05🤖 cs.AI

Retcon -- a Prompt-Based Technique for Precise Control of LLMs in Conversations

Ce papier présente Retcon, une technique de promptage par quelques exemples conçue pour offrir un contrôle précis au niveau de chaque tour de parole dans les conversations avec les grands modèles de langage, surpassant ainsi les méthodes de promptage zero-shot et few-shot traditionnels.

David Kogan, Sam Nguyen, Masanori Suzuki + 1 more2026-03-05💬 cs.CL

Quantum-Inspired Self-Attention in a Large Language Model

Cette étude propose l'intégration inédite d'un mécanisme d'auto-attention inspiré du quantum (QISA) dans le modèle GPT-1, démontrant des performances nettement supérieures aux méthodes classiques sur les métriques d'erreur et de perte, au prix d'un temps d'inférence légèrement accru.

Nikita Kuznetsov, Niyaz Ismagilov, Ernesto Campos2026-03-05⚛️ quant-ph

Automated Concept Discovery for LLM-as-a-Judge Preference Analysis

Cette étude propose une méthode d'extraction de concepts basée sur des auto-encodeurs parcimonieux pour découvrir automatiquement les facteurs inconnus influençant les préférences des modèles de langage utilisés comme juges, révélant ainsi des biais systématiques tels que la préférence pour la concrétude, l'empathie et le formalisme, tout en validant des tendances existantes comme le refus accru des demandes sensibles.

James Wedgwood, Chhavi Yadav, Virginia Smith2026-03-05🤖 cs.AI

From We to Me: Theory Informed Narrative Shift with Abductive Reasoning

Cet article propose une approche neurosymbolique fondée sur la théorie des sciences sociales et le raisonnement abductif pour permettre aux grands modèles de langage d'effectuer des transformations narratives efficaces (par exemple, du « nous » au « je ») tout en préservant la fidélité du message original.

Jaikrishna Manojkumar Patil, Divyagna Bavikadi, Kaustuv Mukherji + 5 more2026-03-05🤖 cs.AI

DIALEVAL: Automated Type-Theoretic Evaluation of LLM Instruction Following

Le papier présente DIALEVAL, un cadre théorique de types automatisé utilisant des agents LLM duaux pour décomposer les instructions en prédicats typés et évaluer leur satisfaction avec des critères différenciés, améliorant ainsi la précision et la corrélation avec le jugement humain par rapport aux méthodes existantes.

Nardine Basta, Dali Kaafar2026-03-05🤖 cs.AI

Can Large Language Models Derive New Knowledge? A Dynamic Benchmark for Biological Knowledge Discovery

Cet article présente DBench-Bio, un benchmark dynamique et automatisé conçu pour évaluer la capacité des modèles de langage à découvrir de nouvelles connaissances biologiques, en surmontant les limites des évaluations statiques et la contamination des données grâce à un pipeline de mise à jour mensuelle couvrant douze sous-domaines biomédicaux.

Chaoqun Yang, Xinyu Lin, Shulin Li + 4 more2026-03-05🤖 cs.AI

Discern Truth from Falsehood: Reducing Over-Refusal via Contrastive Refinement

Ce papier propose DCR, une méthode d'alignement par raffinement contrastif qui permet aux grands modèles de langage de mieux distinguer les contenus véritablement toxiques des demandes bénignes, réduisant ainsi les refus excessifs tout en préservant leur sécurité et leurs capacités générales.

Yuxiao Lu, Lin Xu, Yang Sun + 2 more2026-03-05🤖 cs.AI

Controlling Chat Style in Language Models via Single-Direction Editing

Cet article propose une méthode légère et sans entraînement pour contrôler précisément le style des grands modèles de langage en exploitant l'hypothèse que les attributs stylistiques sont encodés comme des directions linéaires dans l'espace d'activation, permettant ainsi une composition flexible et une amélioration de la sécurité avec un coût computationnel minimal.

Zhenyu Xu, Victor S. Sheng2026-03-05🤖 cs.AI

IntPro: A Proxy Agent for Context-Aware Intent Understanding via Retrieval-conditioned Inference

L'article présente IntPro, un agent proxy qui améliore la compréhension contextuelle des intentions utilisateur en apprenant à adapter ses inférences à des modèles historiques individuels via un mécanisme de récupération et un entraînement par optimisation de politique.

Guanming Liu, Meng Wu, Peng Zhang + 8 more2026-03-05🤖 cs.AI

Controllable and explainable personality sliders for LLMs at inference time

Cet article propose un cadre modulaire innovant utilisant le « Sequential Adaptive Steering » pour contrôler de manière continue et explicable plusieurs traits de personnalité dans les grands modèles de langage au moment de l'inférence, en orthogonalisant les vecteurs de guidage afin d'éviter les interférences destructrices et d'éviter un réentraînement coûteux.

Florian Hoppe, David Khachaturov, Robert Mullins + 1 more2026-03-05🤖 cs.AI

A benchmark for joint dialogue satisfaction, emotion recognition, and emotion state transition prediction

Cet article présente la construction d'un ensemble de données chinois multi-tâches et multi-étiquettes conçu pour améliorer la prédiction de la satisfaction utilisateur en intégrant la reconnaissance des émotions et la prédiction de leurs transitions au sein de dialogues multi-tours.

Jing Bian, Haoxiang Su, Liting Jiang + 6 more2026-03-05🤖 cs.AI

StructLens: A Structural Lens for Language Models via Maximum Spanning Trees

Le papier présente StructLens, un cadre d'analyse qui utilise des arbres couvrants maximaux sur les représentations sémantiques des modèles de langage pour révéler des relations structurelles globales entre les couches, offrant ainsi une métrique de similarité distincte et utile pour des tâches pratiques comme l'élagage.

Haruki Sakajo, Frederikus Hudi, Yusuke Sakai + 2 more2026-03-05🤖 cs.AI

AutoHarness: improving LLM agents by automatically synthesizing a code harness

L'article présente AutoHarness, une méthode permettant à un modèle de langage plus petit de générer automatiquement des harnesses de code ou des politiques complètes pour éviter les actions interdites dans des environnements interactifs, surpassant ainsi des modèles plus grands en termes de performance et de coût.

Xinghua Lou, Miguel Lázaro-Gredilla, Antoine Dedieu + 3 more2026-03-05🤖 cs.AI

Certainty robustness: Evaluating LLM stability under self-challenging prompts

Cet article présente le « Certainty Robustness Benchmark », un cadre d'évaluation à deux tours qui révèle que la stabilité des grands modèles de langage face aux remises en question interactives constitue une dimension critique distincte de leur simple précision, mettant en lumière des écarts significatifs dans leur fiabilité et leur alignement.

Mohammadreza Saadat, Steve Nemzer2026-03-05🤖 cs.AI

PulseLM: A Foundation Dataset and Benchmark for PPG-Text Learning

Ce travail présente PulseLM, un vaste ensemble de données et un benchmark unifiés reliant des signaux de photopléthysmographie (PPG) à des questions-réponses en langage naturel pour faciliter le développement de modèles de fondation multimodaux capables de raisonnement physiologique.

Hung Manh Pham, Jinyang Wu, Xiao Ma + 6 more2026-03-05🤖 cs.AI

Fragile Thoughts: How Large Language Models Handle Chain-of-Thought Perturbations

Cette étude évalue la robustesse de 13 grands modèles de langage face à cinq types de perturbations dans le raisonnement par chaîne de pensée, révélant des vulnérabilités hétérogènes où l'augmentation de la taille du modèle atténue certaines erreurs mathématiques mais offre une protection limitée contre les problèmes de conversion d'unités.

Ashwath Vaithinathan Aravindan, Mayank Kejriwal2026-03-05🤖 cs.AI

Training-free Dropout Sampling for Semantic Token Acceptance in Speculative Decoding

Le papier présente DropMatch, une méthode sans entraînement pour le décodage spéculatif qui utilise le dropout Monte Carlo sur la tête du modèle cible pour évaluer et accepter les jetons proposés par un modèle léger, améliorant ainsi la vitesse d'inférence tout en préservant les performances.

Jeongtae Lee, Minjung Jo, Hyunjoon Jeong + 5 more2026-03-05💬 cs.CL

← Précédent Suivant →