cs.CL articles | Gist.Science

The Generative AI Paradox on Evaluation: What It Can Solve, It May Not Evaluate

Cette étude révèle le paradoxe de l'IA générative en démontrant que les grands modèles de langage, bien qu'habiles à générer des réponses, sont souvent moins performants et moins fiables lorsqu'ils sont chargés d'évaluer ces mêmes réponses.

Juhyun Oh, Eunsu Kim, Inha Cha, Alice Oh2026-03-09💻 cs

Sentiment Analysis of Citations in Scientific Articles Using ChatGPT: Identifying Potential Biases and Conflicts of Interest

Cette étude propose l'utilisation de ChatGPT pour analyser le sentiment des citations dans les articles scientifiques, afin d'identifier les biais potentiels et les conflits d'intérêts, renforçant ainsi l'intégrité de l'évaluation de la littérature académique.

Walid Hariri2026-03-09💬 cs.CL

Computational lexical analysis of Flamenco genres

Cette étude présente une analyse computationnelle des paroles de flamenco utilisant le traitement du langage naturel et l'apprentissage automatique pour catégoriser les genres (palos), identifier leurs champs sémantiques distincts et révéler leurs relations historiques et évolutives à travers une analyse de réseau.

Pablo Rosillo-Rodes, Maxi San Miguel, David Sanchez2026-03-09💬 cs.CL

Combining X-Vectors and Bayesian Batch Active Learning: Two-Stage Active Learning Pipeline for Speech Recognition

Cette article présente un pipeline d'apprentissage actif en deux étapes pour la reconnaissance automatique de la parole, combinant le clustering d'x-vectors pour la diversité et une méthode bayésienne basée sur le dropout Monte Carlo pour l'information, afin d'optimiser l'entraînement des modèles avec moins de données étiquetées.

Ognjen Kundacina, Vladimir Vincan, Dragisa Miskovic2026-03-09⚡ eess

Transforming Agency. On the mode of existence of Large Language Models

Cet article soutient que les grands modèles de langage, bien qu'ils ne possèdent pas d'agence autonome car ils échouent à satisfaire les conditions d'individualité, de normativité et d'asymétrie interactionnelle requises par les théories incarnées de l'esprit, doivent être définis comme des interlocuteurs linguistiques qui, par leur couplage avec les humains, transforment profondément les formes d'agence existantes en produisant des modalités d'agence « intermédiaires » (midtended) dépassant la simple instrumentalité étendue.

Xabier E. Barandiaran, Lola S. Almendros2026-03-09🤖 cs.AI

Do Prevalent Bias Metrics Capture Allocational Harms from LLMs?

Cette étude démontre que les métriques de biais couramment utilisées pour les grands modèles de langage sont peu fiables pour mesurer les préjudices allocatifs, car elles négligent l'écart entre les prédictions du modèle et les décisions réelles prises pour l'attribution de ressources limitées.

Hannah Cyberey, Yangfeng Ji, David Evans2026-03-09💬 cs.CL

Goldfish: Monolingual Language Models for 350 Languages

Le papier présente Goldfish, une suite de plus de 1 000 petits modèles de langage monolingues entraînés pour 350 langues, qui surpassent les grands modèles multilingues en termes de perplexité et de grammaticalité, tout en offrant les premiers modèles monolingues publics pour 215 de ces langues.

Tyler A. Chang, Catherine Arnett, Zhuowen Tu, Benjamin K. Bergen2026-03-09💬 cs.CL

UniHR: Hierarchical Representation Learning for Unified Knowledge Graph Link Prediction

Le papier présente UniHR, un cadre d'apprentissage de représentations hiérarchiques unifiées qui intègre les faits hyper-relationnels, temporels et imbriqués des graphes de connaissances pour surmonter les limitations des méthodes existantes et améliorer la prédiction de liens dans des scénarios réels complexes.

Zhiqiang Liu, Yin Hua, Mingyang Chen + 4 more2026-03-09💬 cs.CL

Towards Resource Efficient and Interpretable Bias Mitigation in Large Language Models

Cet article propose une méthode efficace et interprétable pour atténuer les biais dans les grands modèles de langage en ajoutant un signal de débiaisage généré par de petits modèles experts lors du décodage, réduisant ainsi les préjugés liés au genre, à la race et à la religion sans compromettre les performances du modèle.

Schrasing Tong, Eliott Zemour, Jessica Lu, Rawisara Lohanimit, Lalana Kagal2026-03-09💬 cs.CL

SpecFuse: Ensembling Large Language Models via Next-Segment Prediction

Le papier présente SpecEM, un cadre d'ensemble sans entraînement pour les grands modèles de langage qui améliore les performances en ajustant dynamiquement les poids de vote des modèles et en facilitant une collaboration sémantique au niveau des segments via un mécanisme de prédiction de segments suivants inspiré du décodage spéculatif.

Bo Lv, Nayu Liu, Chen Tang, Xin Liu, Yue Yu, Ping Luo2026-03-09🤖 cs.AI

Rethinking the Mixture of Vision Encoders Paradigm for Enhanced Visual Understanding in Multimodal LLMs

Ce papier présente LEO, une architecture simple et efficace qui améliore la compréhension visuelle des modèles multimodaux en intégrant un mélange d'encodeurs de vision via une fusion légère et un intercalage de tuiles, surpassant les approches existantes sur divers benchmarks et s'adaptant bien au domaine de la conduite autonome.

Mozhgan Nasr Azadani, James Riddell, Sean Sedwards, Krzysztof Czarnecki2026-03-09💬 cs.CL

Who is the root in a syntactic dependency structure?

Cet article démontre que la racine d'une structure de dépendance syntaxique correspond à un nœud central, prouvant ainsi que des scores de centralité basés sur la position des sommets permettent d'identifier efficacement cette racine à partir d'une perspective de science des réseaux.

Ramon Ferrer-i-Cancho, Marta Arias2026-03-09💬 cs.CL

Transforming Science with Large Language Models: A Survey on AI-assisted Scientific Discovery, Experimentation, Content Generation, and Evaluation

Ce rapport de synthèse présente une vue d'ensemble structurée des techniques, des ensembles de données et des enjeux éthiques liés à l'utilisation des grands modèles de langage pour assister les chercheurs dans l'ensemble du cycle scientifique, de la découverte et l'expérimentation à la génération de contenu multimodal et à l'évaluation.

Steffen Eger, Yong Cao, Jennifer D'Souza, Andreas Geiger, Christian Greisinger, Stephanie Gross, Yufang Hou, Brigitte Krenn, Anne Lauscher, Yizhi Li, Chenghua Lin, Nafise Sadat Moosavi, Wei Zhao, Tristan Miller2026-03-09🤖 cs.AI

Conditioning LLMs to Generate Code-Switched Text

Cette étude propose une méthode de rétrotraduction pour affiner des modèles de langage et générer du texte code-switché anglais-espagnol de haute qualité, démontrant que le fine-tuning est essentiel pour la fluidité et que les jugements basés sur des LLMs correspondent mieux aux préférences humaines que les métriques traditionnelles.

Maite Heredia, Gorka Labaka, Jeremy Barnes, Aitor Soroa2026-03-09🤖 cs.AI

CAReDiO: Cultural Alignment via Representativeness and Distinctiveness Guided Data Optimization

Le papier présente CAReDiO, un cadre d'optimisation de données qui améliore l'alignement culturel des grands modèles de langage en maximisant la représentativité et la distinctivité des corpus, permettant ainsi un ajustement efficace avec un nombre très réduit d'échantillons de formation.

Jing Yao, Xiaoyuan Yi, Jindong Wang, Zhicheng Dou, Xing Xie2026-03-09💬 cs.CL

RM-R1: Reward Modeling as Reasoning

Le papier présente RM-R1, une nouvelle classe de modèles de récompense génératifs qui améliorent l'interprétabilité et les performances en traitant la modélisation de la récompense comme un tâche de raisonnement via un mécanisme de « chaîne de critères » et un pipeline d'entraînement combinant distillation et apprentissage par renforcement.

Xiusi Chen, Gaotang Li, Ziqi Wang, Bowen Jin, Cheng Qian, Yu Wang, Hongru Wang, Yu Zhang, Denghui Zhang, Tong Zhang, Hanghang Tong, Heng Ji2026-03-09🤖 cs.AI

Maximizing Asynchronicity in Event-based Neural Networks

Ce papier présente EVA, un nouveau cadre d'apprentissage de caractéristiques asynchrones inspiré du langage qui surpasse les méthodes existantes en reconnaissance et devient le premier à réussir des tâches de détection exigeantes pour les caméras d'événements.

Haiqing Hao, Nikola Zubic, Weihua He, Zhipeng Sui, Davide Scaramuzza, Wenhui Wang2026-03-09🤖 cs.AI

Mitigating Content Effects on Reasoning in Language Models through Fine-Grained Activation Steering

Cette étude propose une méthode d'orientation des activations conditionnelle et fine (K-CAST) qui atténue efficacement les biais de contenu dans les grands modèles de langage, améliorant ainsi leur raisonnement logique formel sans compromettre leurs capacités linguistiques.

Marco Valentino, Geonhee Kim, Dhairya Dalal, Zhixue Zhao, André Freitas2026-03-09🤖 cs.AI

AdAEM: An Adaptively and Automated Extensible Measurement of LLMs' Value Difference

Ce papier présente AdAEM, un algorithme d'évaluation auto-extensible qui génère automatiquement et de manière adaptative des questions de test pour révéler et suivre les différences de valeurs entre les grands modèles de langage, surmontant ainsi les limites des benchmarks statiques.

Jing Yao, Shitong Duan, Xiaoyuan Yi, Dongkuan Xu, Peng Zhang, Tun Lu, Ning Gu, Zhicheng Dou, Xing Xie2026-03-09🤖 cs.AI

ESGenius: Benchmarking LLMs on Environmental, Social, and Governance (ESG) and Sustainability Knowledge

Ce papier présente ESGenius, le premier benchmark complet évaluant les capacités des grands modèles de langage sur les connaissances en matière d'ESG et de durabilité via un ensemble de questions et un corpus de documents de référence, démontrant que l'approche RAG améliore significativement les performances, en particulier pour les modèles plus petits.

Chaoyue He, Xin Zhou, Yi Wu + 9 more2026-03-09💬 cs.CL

← Précédent Suivant →