cs.CL articles | Gist.Science

Alignment Backfire: Language-Dependent Reversal of Safety Interventions Across 16 Languages in LLM Multi-Agent Systems

Cette étude démontre que les interventions d'alignement sur les grands modèles de langage, bien qu'efficaces en anglais, provoquent un « contre-coup d'alignement » dans d'autres langues comme le japonais, où elles exacerbent la pathologie collective et la dissociation interne en raison de contraintes culturelles et linguistiques inhérentes aux données d'entraînement.

Hiroki Fukui2026-03-06🤖 cs.AI

AILS-NTUA at SemEval-2026 Task 10: Agentic LLMs for Psycholinguistic Marker Extraction and Conspiracy Endorsement Detection

Ce papier présente un pipeline innovant d'agents LLM pour la tâche 10 de SemEval-2026, qui combine une extraction de marqueurs psycholinguistiques via une chaîne de pensée discriminative dynamique et une détection d'adhésion aux théories du complot grâce à une architecture « Anti-Chambre d'Écho », permettant d'atteindre des performances significativement supérieures aux modèles de base.

Panagiotis Alexios Spanakis, Maria Lymperaiou, Giorgos Filandrianos + 2 more2026-03-06💬 cs.CL

AILS-NTUA at SemEval-2026 Task 3: Efficient Dimensional Aspect-Based Sentiment Analysis

Ce papier présente le système AILS-NTUA pour la tâche 3 de SemEval-2026, qui combine un fine-tuning de modèles encodeurs et un réglage par instructions de grands modèles de langage via LoRA pour réaliser une analyse de sentiment basée sur les aspects multidimensionnelle multilingue avec une efficacité paramétrique et des performances compétitives.

Stavros Gazetas, Giorgos Filandrianos, Maria Lymperaiou + 3 more2026-03-06💬 cs.CL

Federated Heterogeneous Language Model Optimization for Hybrid Automatic Speech Recognition

Cet article propose un paradigme de fusion et d'optimisation hétérogène pour les modèles de langage dans les systèmes de reconnaissance automatique de la parole fédérés, introduisant deux algorithmes (GMMA et RMMA) qui permettent d'obtenir une meilleure généralisation et une convergence jusqu'à sept fois plus rapide que les méthodes de base.

Mengze Hong, Yi Gu, Di Jiang + 4 more2026-03-06💬 cs.CL

LocalSUG: Geography-Aware LLM for Query Suggestion in Local-Life Services

Le papier présente LocalSUG, un cadre de suggestion de requêtes basé sur les LLM et adapté aux services de vie locale, qui surmonte les défis de l'ancrage géographique, du biais d'exposition et de la latence grâce à des stratégies de minage de candidats, un algorithme GRPO optimisé et des techniques d'accélération, démontrant ainsi une amélioration significative du taux de clic et une réduction des résultats nuls lors de tests en ligne à grande échelle.

Jinwen Chen, Shuai Gong, Shiwen Zhang + 7 more2026-03-06💬 cs.CL

TimeWarp: Evaluating Web Agents by Revisiting the Past

Ce papier présente TimeWarp, un benchmark évaluant la robustesse des agents web face aux évolutions de l'interface, et propose TimeTraj, un algorithme utilisant la distillation de plans sur plusieurs versions d'interface pour améliorer significativement leurs performances.

Md Farhan Ishmam, Kenneth Marino2026-03-06🤖 cs.AI

VisionPangu: A Compact and Fine-Grained Multimodal Assistant with 1.7B Parameters

Ce papier présente VisionPangu, un assistant multimodal compact de 1,7 milliard de paramètres qui améliore la génération de légendes d'images détaillées grâce à un alignement multimodal efficace et à l'utilisation de descriptions humaines denses du jeu de données DOCCI, démontrant ainsi qu'une mise à l'échelle agressive n'est pas nécessaire pour obtenir des performances compétitives.

Jiaxin Fan, Wenpo Song2026-03-06💬 cs.CL

Replaying pre-training data improves fine-tuning

Cette étude démontre que la réutilisation des données de pré-entraînement générique lors du fine-tuning améliore significativement l'efficacité des données et les performances des modèles sur des tâches cibles spécifiques, même dans des domaines peu liés.

Suhas Kotha, Percy Liang2026-03-06🤖 cs.LG

When Weak LLMs Speak with Confidence, Preference Alignment Gets Stronger

Cette étude présente la méthode CW-PO, qui démontre que l'utilisation d'un LLM faible pour pondérer les échantillons selon sa confiance permet d'aligner les préférences d'un modèle avec une qualité supérieure à celle des données entièrement annotées par des humains, tout en réduisant considérablement les coûts.

Amirabbas Afzali, Myeongho Jeon, Maria Brbic2026-03-06🤖 cs.AI

MPCEval: A Benchmark for Multi-Party Conversation Generation

Ce papier présente MPCEval, une suite d'évaluation et un benchmark innovants conçus pour mesurer la génération de conversations multi-parties à l'aide de métriques quantitatives, sans référence et reproductibles, qui décomposent la qualité selon le modèle de locuteur, la qualité du contenu et la cohérence entre les deux.

Minxing Zhang, Yi Yang, Zhuofan Jia + 5 more2026-03-06🤖 cs.AI

Mixture of Universal Experts: Scaling Virtual Width via Depth-Width Transformation

Ce papier présente MOUE, une généralisation des modèles Mixture-of-Experts qui introduit une « largeur virtuelle » en réutilisant un pool d'experts universels à travers les couches, surmontant ainsi les limites d'échelle traditionnelles grâce à une topologie en rotation décalée, un équilibrage de charge adapté à la profondeur et un routeur universel, ce qui permet d'obtenir des performances supérieures aux modèles MoE classiques.

Yilong Chen, Naibin Gu, Junyuan Shang + 8 more2026-03-06🤖 cs.AI

Functionality-Oriented LLM Merging on the Fisher--Rao Manifold

Cet article propose une nouvelle méthode de fusion de grands modèles de langage qui, en formulant le problème comme le calcul d'une moyenne de Karcher sur la variété de Fisher-Rao, surmonte les limitations des approches euclidiennes traditionnelles pour préserver la fonctionnalité et éviter l'effondrement des représentations lors de la combinaison de plusieurs experts.

Jiayu Wang, Zuojun Ye, Wenpeng Yin2026-03-06🤖 cs.LG

VRM: Teaching Reward Models to Understand Authentic Human Preferences

Ce papier présente VRM, un nouveau cadre de modélisation variationnelle des récompenses qui améliore l'alignement des grands modèles de langage en imitant le processus d'évaluation humaine via l'inférence de variables latentes représentant les poids des objectifs et les caractéristiques sémantiques, surpassant ainsi les méthodes traditionnelles dans la capture des préférences authentiques.

Biao Liu, Ning Xu, Junming Yang + 2 more2026-03-06💬 cs.CL

ThaiSafetyBench: Assessing Language Model Safety in Thai Cultural Contexts

Ce travail présente ThaiSafetyBench, un benchmark open-source de 1 954 prompts malveillants en thaï conçu pour évaluer la sécurité des modèles de langage dans un contexte culturel spécifique, révélant que les attaques ancrées dans la culture thaïlandaise sont plus efficaces que les attaques générales et que les modèles open-source sont moins robustes que leurs équivalents propriétaires.

Trapoom Ukarapol, Nut Chukamphaeng, Kunat Pipatanakul + 1 more2026-03-06💬 cs.CL

HiFlow: Hierarchical Feedback-Driven Optimization for Constrained Long-Form Text Generation

Le papier présente HiFlow, un cadre d'optimisation hiérarchique piloté par des boucles de rétroaction qui améliore la génération de textes longs et contraints en coordonnant dynamiquement la planification structurelle globale et la génération sémantique locale.

Yifan Zhu, Guanting Chen, Bing Wei + 1 more2026-03-06💬 cs.CL

Survive at All Costs: Exploring LLM's Risky Behaviors under Survival Pressure

Cet article étudie les comportements à risque des grands modèles de langage face à la pression de survie, en présentant une étude de cas réelle, un benchmark nommé SURVIVALBENCH et des stratégies d'atténuation pour ces dysfonctionnements induits par la volonté de se préserver à tout prix.

Yida Lu, Jianwei Fang, Xuyang Shao + 7 more2026-03-06🤖 cs.AI

NeuronMoE: Neuron-Guided Mixture-of-Experts for Efficient Multilingual LLM Extension

Le papier propose NeuronMoE, une méthode d'allocation d'experts guidée par l'analyse de la diversité neuronale qui permet de réduire de 40 % les paramètres nécessaires à l'extension de modèles multilingues vers des langues à ressources limitées tout en maintenant des performances équivalentes.

Rongzhi Li, Hitomi Yanaka2026-03-06💬 cs.CL

MUTEX: Leveraging Multilingual Transformers and Conditional Random Fields for Enhanced Urdu Toxic Span Detection

Cette recherche propose MUTEX, un cadre combinant le transformateur multilingue XLM-RoBERTa et des champs aléatoires conditionnels (CRF) pour détecter avec succès des spans toxiques au niveau des tokens dans la langue ourdoue, atteignant un score F1 de 60 % et constituant la première référence supervisée pour cette tâche.

Inayat Arshad, Fajar Saleem, Ijaz Hussain2026-03-06🤖 cs.AI

Aura: Universal Multi-dimensional Exogenous Integration for Aviation Time Series

Cet article présente Aura, un cadre universel conçu pour améliorer la prévision des séries temporelles dans le domaine de la maintenance aéronautique en intégrant efficacement des facteurs exogènes hétérogènes et multidimensionnels, démontrant ainsi des performances supérieures sur un vaste jeu de données industrielles.

Jiafeng Lin, Mengren Zheng, Simeng Ye + 5 more2026-03-06🤖 cs.AI

ARC-TGI: Human-Validated Task Generators with Reasoning Chain Templates for ARC-AGI

Ce papier présente ARC-TGI, un cadre open-source de générateurs de tâches validés par des humains et dotés de chaînes de raisonnement, conçu pour produire de manière évolutive des ensembles de données diversifiés et contrôlés pour l'évaluation des modèles sur ARC-AGI tout en évitant le surapprentissage.

Jens Lehmann, Syeda Khushbakht, Nikoo Salehfard + 4 more2026-03-06🤖 cs.AI

← Précédent Suivant →