cs.CL articles | Gist.Science

StarWhisper Telescope: An AI framework for automating end-to-end astronomical observations

Le système StarWhisper Telescope est un cadre d'agents intelligents qui automatise l'ensemble du processus d'observation astronomique, de la planification à l'analyse des données et au déclenchement de suivis, démontrant son efficacité sur un réseau de télescopes amateurs et offrant une architecture évolutive pour les futurs grands projets astronomiques.

Cunshi Wang, Yu Zhang, Yuyang Li + 25 more2026-03-04🔭 astro-ph

A Survey of Query Optimization in Large Language Models

Cette étude propose une analyse systématique de l'optimisation des requêtes dans les grands modèles de langage, introduisant un cadre de cycle de vie unifié, une taxonomie de complexité et une revue approfondie des techniques clés pour améliorer les systèmes de génération augmentée par la récupération (RAG).

Mingyang Song, Mao Zheng2026-03-04💬 cs.CL

Evaluating Spoken Language as a Biomarker for Automated Screening of Cognitive Impairment

Cette étude démontre que l'utilisation de modèles d'apprentissage automatique interprétables sur des biomarqueurs linguistiques permet un dépistage automatisé et une stratification des risques de troubles neurocognitifs, offrant ainsi une solution évolutive et non invasive pour le suivi de la santé cognitive à domicile.

Maria R. Lima, Alexander Capstick, Fatemeh Geranmayeh + 4 more2026-03-04💬 cs.CL

Hallucination, Monofacts, and Miscalibration: An Empirical Investigation

Cette étude empirique démontre que l'augmentation sélective de la fréquence de quelques exemples d'entraînement, en introduisant une miscalibration contrôlée, réduit considérablement les hallucinations dans les modèles de langage tout en préservant leur précision, remettant ainsi en question les politiques universelles de déduplication.

Miranda Muqing Miao, Michael Kearns2026-03-04🤖 cs.AI

Make LoRA Great Again: Boosting LoRA with Adaptive Singular Values and Mixture-of-Experts Optimization Alignment

Le papier présente GOAT, un cadre qui améliore les performances du LoRA en intégrant des priors SVD adaptatifs via une architecture Mixture-of-Experts et en alignant l'optimisation grâce à un facteur d'échelle théorique, permettant ainsi de combler l'écart avec le fine-tuning complet sur une large gamme de tâches.

Chenghao Fan, Zhenyi Lu, Sichen Liu + 4 more2026-03-04💬 cs.CL

$\texttt{SEM-CTRL}$ : Semantically Controlled Decoding

Ce papier présente \texttt{SEM-CTRL}, une approche unifiée qui garantit la validité syntaxique et sémantique des sorties de tout grand modèle de langage sans fine-tuning en intégrant une recherche arborescente Monte Carlo guidée par des contraintes exprimées via des grammaires de réponses logiques.

Mohammad Albinhassan, Pranava Madhyastha, Alessandra Russo2026-03-04🤖 cs.AI

LINGOLY-TOO: Disentangling Reasoning from Knowledge with Templatised Orthographic Obfuscation

Ce papier présente LINGOLY-TOO, un nouveau benchmark de raisonnement linguistique qui utilise l'obfuscation orthographique pour isoler les véritables capacités de raisonnement des modèles d'IA en éliminant les raccourcis basés sur la mémorisation.

Jude Khouja, Lingyi Yang, Karolina Korgul + 6 more2026-03-04🤖 cs.AI

BioChemInsight: An Online Platform for Automated Extraction of Chemical Structures and Activity Data from Patents

BioChemInsight est une plateforme open-source qui automatise l'extraction des structures chimiques et des données d'activité biologique à partir de brevets, comblant ainsi les lacunes des bases de données publiques comme ChEMBL et accélérant considérablement la découverte de médicaments.

Zhe Wang, Fangtian Fu, Wei Zhang + 10 more2026-03-04🧬 q-bio

Param $Δ$ for Direct Weight Mixing: Post-Train Large Language Model at Zero Cost

Ce papier présente Param $Î$ , une méthode novatrice permettant de transférer les capacités d'un modèle post-entraîné vers une nouvelle version de base sans aucun coût de calcul supplémentaire, en exploitant simplement la différence de poids entre les modèles.

Sheng Cao, Mingrui Wu, Karthik Prasad + 2 more2026-03-04🤖 cs.AI

Adaptive Social Learning via Mode Policy Optimization for Language Agents

Cet article propose le cadre ASL, qui utilise l'algorithme AMPO pour permettre aux agents linguistiques d'adapter dynamiquement la profondeur de leur raisonnement dans les interactions sociales, améliorant ainsi les performances de la tâche tout en réduisant significativement l'utilisation des jetons par rapport aux méthodes existantes.

Minzheng Wang, Yongbin Li, Haobo Wang + 6 more2026-03-04🤖 cs.AI

Talk to Your Slides: High-Efficiency Slide Editing via Language-Driven Structured Data Manipulation

Ce papier présente Talk-to-Your-Slides, un agent d'édition de diapositives haute efficacité qui, contrairement aux approches visuelles coûteuses, manipule directement les données structurées via le langage pour offrir une précision accrue, une fidélité aux instructions améliorée et des coûts réduits, le tout validé par le nouveau benchmark TSBench.

Kyudan Jung, Hojun Cho, Jooyeol Yun + 3 more2026-03-04💬 cs.CL

Efficient Agent Training for Computer Use

Le papier présente PC Agent-E, un cadre d'entraînement efficace qui, en combinant un nombre limité de démonstrations humaines avec une synthèse de données par l'IA, permet d'obtenir des agents informatiques surpassant à la fois les modèles entraînés uniquement sur des données humaines et le modèle Claude 3.7 Sonnet lui-même.

Yanheng He, Jiahe Jin, Pengfei Liu2026-03-04🤖 cs.AI

REFLEX: Metacognitive Reasoning for Reflective Zero-Shot Robotic Planning with Large Language Models

Le papier présente REFLEX, un cadre intégrant l'apprentissage métacognitif dans les modèles de langage pour permettre à des agents robotiques de décomposer les compétences, de réfléchir sur leurs échecs et de générer de nouvelles solutions créatives en situation zéro-shot, surpassant ainsi les méthodes existantes.

Wenjie Lin, Jin Wei-Kocsis, Jiansong Zhang + 4 more2026-03-04💬 cs.CL

BitBypass: A New Direction in Jailbreaking Aligned Large Language Models with Bitstream Camouflage

Ce papier présente BitBypass, une nouvelle attaque de contournement en boîte noire qui exploite le camouflage de flux de bits pour contourner les mécanismes de sécurité des grands modèles de langage alignés et les amener à générer du contenu nuisible, surpassant ainsi les méthodes d'attaque existantes en termes de furtivité et de taux de réussite.

Kalyan Nakka, Nitesh Saxena2026-03-04💬 cs.CL

DiaBlo: Diagonal Blocks Are Sufficient For Finetuning

DiaBlo est une méthode de fine-tuning efficace en paramètres qui met à jour uniquement les blocs diagonaux des matrices de poids, offrant une convergence stable et des performances compétitives sans nécessiter de produits matriciels de faible rang ni de stratégies d'initialisation auxiliaires.

Selcuk Gurses, Aozhong Zhang, Yanxia Deng + 5 more2026-03-04🤖 cs.AI

Go-Browse: Training Web Agents with Structured Exploration

Le papier présente Go-Browse, une méthode d'exploration structurée des environnements web qui permet de collecter à grande échelle des données d'entraînement pour agents, améliorant ainsi significativement les performances des modèles de langage de moins de 10 milliards de paramètres sur le benchmark WebArena.

Apurva Gandhi, Graham Neubig2026-03-04💬 cs.CL

HSSBench: Benchmarking Humanities and Social Sciences Ability for Multimodal Large Language Models

Cet article présente HSSBench, un benchmark multilingue de plus de 13 000 échantillons conçu pour évaluer et stimuler les capacités de raisonnement interdisciplinaire des modèles de langage multimodaux dans le domaine des sciences humaines et sociales, comblant ainsi une lacune majeure des évaluations actuelles axées sur les STEM.

Zhaolu Kang, Junhao Gong, Jiaxu Yan + 15 more2026-03-04🤖 cs.AI

Search Arena: Analyzing Search-Augmented LLMs

Ce travail présente Search Arena, un jeu de données à grande échelle et crowdsourcé de plus de 24 000 interactions multi-tours avec des modèles de langage augmentés par la recherche, qui révèle les biais des utilisateurs envers les citations et les sources, tout en démontrant que l'intégration de la recherche web améliore les performances sans les dégrader dans des contextes non dédiés.

Mihran Miroyan, Tsung-Han Wu, Logan King + 8 more2026-03-04💬 cs.CL

You Only Fine-tune Once: Many-Shot In-Context Fine-Tuning for Large Language Models

Ce papier propose une nouvelle méthode appelée Many-Shot In-Context Fine-tuning (ManyICL) qui, en traitant chaque exemple de contexte comme une cible d'apprentissage supervisé, permet aux grands modèles de langage de combler l'écart de performance avec l'ajustement fin dédié tout en atténuant l'oubli catastrophique.

Wenchong He, Liqian Peng, Zhe Jiang + 1 more2026-03-04🤖 cs.AI

LLM Probability Concentration: How Alignment Shrinks the Generative Horizon

Cette étude introduit le facteur de branchement comme mesure de la concentration des probabilités pour démontrer que l'alignement des grands modèles de langage réduit drastiquement la diversité de leurs générations en les orientant vers des trajectoires à faible entropie, un mécanisme que le raisonnement en chaîne exploite pour stabiliser les sorties.

Chenghao Yang, Sida Li, Ari Holtzman2026-03-04🤖 cs.AI

← Précédent Suivant →

cs.CL