cs.AI articles | Gist.Science

Information Capacity: Evaluating the Efficiency of Large Language Models via Text Compression

Cet article propose la « capacité d'information », une nouvelle métrique évaluant l'efficacité des grands modèles de langage via la compression de texte et l'efficacité des tokenizers, permettant ainsi de prédire les performances et d'identifier des biais linguistiques tout en guidant le développement futur de modèles plus efficaces.

Cheng Yuan, Jiawei Shao, Xuelong Li2026-03-11💬 cs.CL

Lightweight Time Series Data Valuation on Time Series Foundation Models via In-Context Finetuning

Ce papier propose LTSV, une méthode légère d'évaluation de la qualité des données temporelles pour les modèles fondationnels, qui utilise un ajustement fin en contexte et une agrégation de blocs temporels pour estimer efficacement la contribution des échantillons tout en préservant les dépendances temporelles.

Shunyu Wu, Tianyue Li, Yixuan Leng, Jingyi Suo, Jian Lou, Dan Li, See-Kiong Ng2026-03-11🤖 cs.AI

MediRound: Multi-Round Entity-Level Reasoning Segmentation in Medical Images

Ce papier présente MediRound, un modèle de base et un nouveau jeu de données MR-MedSeg conçus pour la tâche de segmentation médicale par raisonnement multi-tours, permettant une interaction éducative progressive avec un mécanisme de correction pour limiter la propagation des erreurs.

Qinyue Tong, Ziqian Lu, Jun Liu, Rui Zuo, Zheming Lu2026-03-11🤖 cs.AI

TSFM in-context learning for time-series classification of bearing-health status

Cet article présente une méthode de classification de l'état de santé des roulements par apprentissage en contexte utilisant des modèles de base pour séries temporelles, permettant d'identifier des défauts dans des données vibratoires sans nécessiter de fine-tuning du modèle ni d'entraînement d'un classifieur traditionnel.

Michel Tokic, Slobodan Djukanovic, Anja von Beuningen, Cheng Feng2026-03-11🤖 cs.AI

Research and Prototyping Study of an LLM-Based Chatbot for Electromagnetic Simulations

Cette étude présente un chatbot basé sur le modèle de langage Google Gemini 2.0 Flash qui automatise la génération, la résolution et l'analyse post-traitement de modèles de simulation électromagnétique bidimensionnels via Gmsh et GetDP, afin de réduire le temps de configuration des modèles.

Albert Piwonski, Mirsad Hadžiefendic2026-03-11🤖 cs.AI

Mitigating Long-Tail Bias in HOI Detection via Adaptive Diversity Cache

Cet article propose le module Adaptive Diversity Cache (ADC), une méthode sans entraînement et plug-and-play qui atténue le biais à longue traîne dans la détection d'interactions humain-objet en accumulant des représentations de caractéristiques diversifiées et en allouant dynamiquement la capacité des caches pour améliorer la détection des catégories rares.

Yuqiu Jiang, Xiaozhen Qiao, Yifan Chen, Ye Zheng, Zhe Sun, Xuelong Li2026-03-11🤖 cs.AI

Periodic Asynchrony: An On-Policy Approach for Accelerating LLM Reinforcement Learning

Cet article propose une approche périodiquement asynchrone qui accélère l'apprentissage par renforcement des grands modèles de langage en séparant l'inférence et l'entraînement dans un pipeline producteur-consommateur, garantissant ainsi une correction strictement on-policy tout en multipliant le débit d'entraînement par trois à cinq fois.

Jian Lu2026-03-11🤖 cs.AI

When Robots Obey the Patch: Universal Transferable Patch Attacks on Vision-Language-Action Models

Ce papier présente UPA-RFAS, un cadre unifié qui génère des patches adversariaux universels et transférables capables de compromettre divers modèles Vision-Language-Action (VLA) dans des scénarios boîte noire et des transitions simulation-réalité en exploitant des mécanismes spécifiques aux caractéristiques, à l'attention et à la sémantique.

Hui Lu, Yi Yu, Yiming Yang, Chenyu Yi, Qixin Zhang, Bingquan Shen, Alex C. Kot, Xudong Jiang2026-03-11🤖 cs.AI

Multi-Agent Reinforcement Learning with Communication-Constrained Priors

Cet article propose un cadre d'apprentissage par renforcement multi-agent généralisé qui utilise des priors contraints par la communication et un estimateur d'information mutuelle dual pour distinguer les messages perdus des messages intacts, afin d'améliorer la robustesse et l'évolutivité des politiques coopératives dans des environnements réels complexes.

Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang Gao2026-03-11🤖 cs.AI

Enhancing Retrieval-Augmented Generation with Entity Linking for Educational Platforms

Cette étude propose ELERAG, une architecture de génération augmentée par la récupération intégrant le lien d'entités et une stratégie de réordonnancement hybride, qui démontre une précision factuelle supérieure aux méthodes de l'état de l'art dans des contextes éducatifs spécialisés en italien, tout en révélant l'importance d'adapter les stratégies au domaine pour éviter les biais de distribution.

Francesco Granata, Francesco Poggi, Misael Mongiovì2026-03-11🤖 cs.AI

EMFusion: Conditional Diffusion Framework for Trustworthy Frequency Selective EMF Forecasting in Wireless Networks

Cet article présente EMFusion, un cadre de diffusion conditionnelle probabiliste qui améliore la fiabilité des prévisions de champs électromagnétiques sélectifs en fréquence pour les réseaux sans fil en intégrant des facteurs contextuels, en fournissant des estimations d'incertitude explicites et en surpassant les modèles de base existants.

Zijiang Yan, Yixiang Huang, Jianhua Pei, Hina Tabassum, Luca Chiaraviglio2026-03-11🤖 cs.AI

Small Language Models for Efficient Agentic Tool Calling: Outperforming Large Models with Targeted Fine-tuning

Cette étude démontre qu'un petit modèle de langage (SLM) de 350 millions de paramètres, finement ajusté avec une seule époque, surpasse significativement les grands modèles (LLM) et les approches basées sur le raisonnement en chaîne (CoT) dans les tâches d'appel d'outils, atteignant un taux de réussite de 77,55 % sur ToolBench et offrant ainsi une solution rentable pour l'intégration de l'IA générative en entreprise.

Polaris Jhandi, Owais Kazi, Shreyas Subramanian, Neel Sendas2026-03-11🤖 cs.AI

Reinforcement Learning for Self-Improving Agent with Skill Library

Ce papier propose SAGE, un cadre d'apprentissage par renforcement innovant qui améliore l'autonomie des agents LLM en intégrant une bibliothèque de compétences via des déroulements séquentiels et une récompense adaptée, permettant d'atteindre de meilleures performances et une efficacité accrue sur la plateforme AppWorld.

Jiongxiao Wang, Qiaojing Yan, Yawei Wang, Yijun Tian, Soumya Smruti Mishra, Zhichao Xu, Megha Gandhi, Panpan Xu, Lin Lee Cheong2026-03-11🤖 cs.AI

MCGI: Manifold-Consistent Graph Indexing for Billion-Scale Disk-Resident Vector Search

Ce papier présente MCGI, une méthode d'indexation géométrique résidente sur disque qui utilise la dimension intrinsèque locale pour adapter dynamiquement la recherche de voisins les plus proches, surpassant ainsi les solutions de l'état de l'art en termes de débit et de latence à l'échelle du milliard de vecteurs.

Dongfang Zhao2026-03-11🤖 cs.AI

CRANE: Causal Relevance Analysis of Language-Specific Neurons in Multilingual Large Language Models

Le papier propose CRANE, un cadre d'analyse basé sur la pertinence fonctionnelle qui identifie avec plus de précision les neurones spécifiques à chaque langue dans les grands modèles multilingues en utilisant des interventions ciblées, révélant ainsi des spécialisations sélectives mais non exclusives que les méthodes traditionnelles basées sur l'activation ne parviennent pas à distinguer.

Yifan Le, Yunliang Li2026-03-11🤖 cs.AI

An AI-powered Bayesian Generative Modeling Approach for Arbitrary Conditional Inference

Ce papier présente la modélisation générative bayésienne (BGM), un cadre unifié alimenté par l'IA qui permet d'effectuer des inférences conditionnelles sur n'importe quelle partition de variables avec quantification rigoureuse de l'incertitude, sans nécessiter de réentraînement du modèle.

Qiao Liu, Wing Hung Wong2026-03-11🤖 cs.AI

Empowering All-in-Loop Health Management of Spacecraft Power System in the Mega-Constellation Era via Human-AI Collaboration

Cet article propose SpaceHMchat, un cadre open-source de collaboration humain-IA basé sur le principe d'alignement des capacités sous-jacentes, conçu pour gérer la santé des systèmes de puissance des satellites dans l'ère des méga-constellations en couvrant l'ensemble du cycle de diagnostic et de maintenance, tout en validant son efficacité via une plateforme expérimentale réaliste et un jeu de données inédit.

Yi Di, Zhibin Zhao, Fujin Wang, Xue Liu, Jiafeng Tang, Jiaxin Ren, Zhi Zhai, Xuefeng Chen2026-03-11🤖 cs.AI

CLEAR-Mamba:Towards Accurate, Adaptive and Trustworthy Multi-Sequence Ophthalmic Angiography Classification

L'article présente CLEAR-Mamba, un cadre amélioré basé sur MedMamba intégrant une couche d'adaptation hyper-réseau (HaC) et un schéma de prédiction fiable (RaP) pour surmonter les limites de généralisation et de confiance dans la classification des angiographies oculaires multi-séquences FFA et ICGA, démontrant ainsi des performances supérieures sur un nouveau jeu de données à grande échelle.

Zhuonan Wang, Wenjie Yan, Wenqiao Zhang, Xiaohui Song, Jian Ma, Ke Yao, Yibo Yu, Beng Chin Ooi2026-03-11🤖 cs.AI

Automating Forecasting Question Generation and Resolution for AI Evaluation

Cet article présente un système automatisé utilisant des agents de recherche web pilotés par des LLM pour générer et résoudre à grande échelle des questions de prévision réalistes et diversifiées, démontrant une haute fiabilité et la capacité à améliorer les performances des modèles d'IA grâce à des stratégies de décomposition de questions.

Nikos I. Bosse, Peter Mühlbacher, Jack Wildman, Lawrence Phillips, Dan Schwarz2026-03-11🤖 cs.AI

From Self-Evolving Synthetic Data to Verifiable-Reward RL: Post-Training Multi-turn Interactive Tool-Using Agents

Ce papier propose EigenData, un cadre unifié combinant un agent de données auto-évolutif et un apprentissage par renforcement à récompense vérifiable, permettant de générer efficacement des agents interactifs d'outils performants sans annotation humaine coûteuse.

Jiaxuan Gao, Jiaao Chen, Chuyi He, Shusheng Xu, Di Jin, Yi Wu2026-03-11🤖 cs.AI

← Précédent Suivant →