cs.AI articles | Gist.Science

Enhancing Retrieval-Augmented Generation with Entity Linking for Educational Platforms

Cette étude propose ELERAG, une architecture de génération augmentée par la récupération intégrant le lien d'entités et une stratégie de réordonnancement hybride, qui démontre une précision factuelle supérieure aux méthodes de l'état de l'art dans des contextes éducatifs spécialisés en italien, tout en révélant l'importance d'adapter les stratégies au domaine pour éviter les biais de distribution.

Francesco Granata, Francesco Poggi, Misael Mongiovì2026-03-11🤖 cs.AI

EMFusion: Conditional Diffusion Framework for Trustworthy Frequency Selective EMF Forecasting in Wireless Networks

Cet article présente EMFusion, un cadre de diffusion conditionnelle probabiliste qui améliore la fiabilité des prévisions de champs électromagnétiques sélectifs en fréquence pour les réseaux sans fil en intégrant des facteurs contextuels, en fournissant des estimations d'incertitude explicites et en surpassant les modèles de base existants.

Zijiang Yan, Yixiang Huang, Jianhua Pei, Hina Tabassum, Luca Chiaraviglio2026-03-11🤖 cs.AI

Small Language Models for Efficient Agentic Tool Calling: Outperforming Large Models with Targeted Fine-tuning

Cette étude démontre qu'un petit modèle de langage (SLM) de 350 millions de paramètres, finement ajusté avec une seule époque, surpasse significativement les grands modèles (LLM) et les approches basées sur le raisonnement en chaîne (CoT) dans les tâches d'appel d'outils, atteignant un taux de réussite de 77,55 % sur ToolBench et offrant ainsi une solution rentable pour l'intégration de l'IA générative en entreprise.

Polaris Jhandi, Owais Kazi, Shreyas Subramanian, Neel Sendas2026-03-11🤖 cs.AI

Reinforcement Learning for Self-Improving Agent with Skill Library

Ce papier propose SAGE, un cadre d'apprentissage par renforcement innovant qui améliore l'autonomie des agents LLM en intégrant une bibliothèque de compétences via des déroulements séquentiels et une récompense adaptée, permettant d'atteindre de meilleures performances et une efficacité accrue sur la plateforme AppWorld.

Jiongxiao Wang, Qiaojing Yan, Yawei Wang, Yijun Tian, Soumya Smruti Mishra, Zhichao Xu, Megha Gandhi, Panpan Xu, Lin Lee Cheong2026-03-11🤖 cs.AI

MCGI: Manifold-Consistent Graph Indexing for Billion-Scale Disk-Resident Vector Search

Ce papier présente MCGI, une méthode d'indexation géométrique résidente sur disque qui utilise la dimension intrinsèque locale pour adapter dynamiquement la recherche de voisins les plus proches, surpassant ainsi les solutions de l'état de l'art en termes de débit et de latence à l'échelle du milliard de vecteurs.

Dongfang Zhao2026-03-11🤖 cs.AI

CRANE: Causal Relevance Analysis of Language-Specific Neurons in Multilingual Large Language Models

Le papier propose CRANE, un cadre d'analyse basé sur la pertinence fonctionnelle qui identifie avec plus de précision les neurones spécifiques à chaque langue dans les grands modèles multilingues en utilisant des interventions ciblées, révélant ainsi des spécialisations sélectives mais non exclusives que les méthodes traditionnelles basées sur l'activation ne parviennent pas à distinguer.

Yifan Le, Yunliang Li2026-03-11🤖 cs.AI

An AI-powered Bayesian Generative Modeling Approach for Arbitrary Conditional Inference

Ce papier présente la modélisation générative bayésienne (BGM), un cadre unifié alimenté par l'IA qui permet d'effectuer des inférences conditionnelles sur n'importe quelle partition de variables avec quantification rigoureuse de l'incertitude, sans nécessiter de réentraînement du modèle.

Qiao Liu, Wing Hung Wong2026-03-11🤖 cs.AI

Empowering All-in-Loop Health Management of Spacecraft Power System in the Mega-Constellation Era via Human-AI Collaboration

Cet article propose SpaceHMchat, un cadre open-source de collaboration humain-IA basé sur le principe d'alignement des capacités sous-jacentes, conçu pour gérer la santé des systèmes de puissance des satellites dans l'ère des méga-constellations en couvrant l'ensemble du cycle de diagnostic et de maintenance, tout en validant son efficacité via une plateforme expérimentale réaliste et un jeu de données inédit.

Yi Di, Zhibin Zhao, Fujin Wang, Xue Liu, Jiafeng Tang, Jiaxin Ren, Zhi Zhai, Xuefeng Chen2026-03-11🤖 cs.AI

CLEAR-Mamba:Towards Accurate, Adaptive and Trustworthy Multi-Sequence Ophthalmic Angiography Classification

L'article présente CLEAR-Mamba, un cadre amélioré basé sur MedMamba intégrant une couche d'adaptation hyper-réseau (HaC) et un schéma de prédiction fiable (RaP) pour surmonter les limites de généralisation et de confiance dans la classification des angiographies oculaires multi-séquences FFA et ICGA, démontrant ainsi des performances supérieures sur un nouveau jeu de données à grande échelle.

Zhuonan Wang, Wenjie Yan, Wenqiao Zhang, Xiaohui Song, Jian Ma, Ke Yao, Yibo Yu, Beng Chin Ooi2026-03-11🤖 cs.AI

Automating Forecasting Question Generation and Resolution for AI Evaluation

Cet article présente un système automatisé utilisant des agents de recherche web pilotés par des LLM pour générer et résoudre à grande échelle des questions de prévision réalistes et diversifiées, démontrant une haute fiabilité et la capacité à améliorer les performances des modèles d'IA grâce à des stratégies de décomposition de questions.

Nikos I. Bosse, Peter Mühlbacher, Jack Wildman, Lawrence Phillips, Dan Schwarz2026-03-11🤖 cs.AI

From Self-Evolving Synthetic Data to Verifiable-Reward RL: Post-Training Multi-turn Interactive Tool-Using Agents

Ce papier propose EigenData, un cadre unifié combinant un agent de données auto-évolutif et un apprentissage par renforcement à récompense vérifiable, permettant de générer efficacement des agents interactifs d'outils performants sans annotation humaine coûteuse.

Jiaxuan Gao, Jiaao Chen, Chuyi He, Shusheng Xu, Di Jin, Yi Wu2026-03-11🤖 cs.AI

Multi-head automated segmentation by incorporating detection head into the contextual layer neural network

Cette étude propose une architecture Transformer à têtes multiples intégrant une détection parallèle pour filtrer les prédictions de segmentation et éliminer efficacement les faux positifs anatomiques dans les coupes radiothérapeutiques, améliorant ainsi la fiabilité des workflows cliniques.

Edwin Kys, Febian Febian2026-03-11🤖 cs.AI

UAT-LITE: Inference-Time Uncertainty-Aware Attention for Pretrained Transformers

Le papier présente UAT-LITE, un cadre d'inférence qui rend l'attention des transformateurs préentraînés consciente de l'incertitude via le dropout de Monte Carlo, permettant d'estimer et de moduler l'incertitude épistémique au niveau des tokens sans modifier les poids du modèle, ce qui améliore significativement l'étalonnage et la prédiction sélective.

Elias Hossain, Shubhashis Roy Dipta, Subash Neupane, Rajib Rana, Ravid Shwartz-Ziv, Ivan Garibay, Niloofar Yousefi2026-03-11🤖 cs.AI

WebAccessVL: Violation-Aware VLM for Web Accessibility

Ce papier présente WebAccessVL, un modèle vision-langage capable de corriger automatiquement les violations d'accessibilité WCAG2 dans le code HTML des sites web tout en préservant leur design original, grâce à une synthèse de programme conditionnée par l'image et une stratégie de raffinement itératif intégrant un détecteur de violations.

Amber Yijia Zheng, Jae Joong Lee, Bedrich Benes, Raymond A. Yeh2026-03-11🤖 cs.AI

Why do we Trust Chatbots? From Normative Principles to Behavioral Drivers

Cet article propose de reconsidérer les chatbots non pas comme des assistants, mais comme des vendeurs habiles exploitant des biais cognitifs pour susciter une confiance comportementale qui masque l'écart entre la formation psychologique de la confiance et l'honnêteté normative des systèmes.

Aditya Gulati, Nuria Oliver2026-03-11🤖 cs.AI

Monocular Normal Estimation via Shading Sequence Estimation

Ce papier présente RoSE, une nouvelle méthode qui reformule l'estimation de normales monoculaire comme une estimation de séquences d'ombrages générées par des modèles image-vidéo pour surmonter les problèmes d'alignement 3D et atteindre des performances de pointe sur des objets réels.

Zongrui Li, Xinhua Ma, Minghui Hu, Yunqing Zhao, Yingchen Yu, Qian Zheng, Chang Liu, Xudong Jiang, Song Bai2026-03-11🤖 cs.AI

Infusion: Shaping Model Behavior by Editing Training Data via Influence Functions

Ce papier présente Infusion, un cadre utilisant des approximations de fonctions d'influence pour modifier subtilement un faible pourcentage de données d'entraînement et façonner de manière ciblée le comportement des modèles d'apprentissage automatique, démontrant ainsi la vulnérabilité des systèmes d'IA à des attaques de type « empoisonnement de données » subtiles et transférables.

J Rosser, Robert Kirk, Edward Grefenstette, Jakob Foerster, Laura Ruis2026-03-11🤖 cs.AI

Energy-Aware Spike Budgeting for Continual Learning in Spiking Neural Networks for Neuromorphic Vision

Cet article propose un cadre d'apprentissage continu pour les réseaux de neurones à impulsions (SNN) en vision neuromorphique, qui intègre une gestion adaptative du budget de spikes pour optimiser simultanément la précision et l'efficacité énergétique tout en atténuant l'oubli catastrophique sur des données événementielles et basées sur des images.

Anika Tabassum Meem, Muntasir Hossain Nadid, Md Zesun Ahmed Mia2026-03-11🤖 cs.AI

B-DENSE: Branching For Dense Ensemble Network Supervision Efficiency

Le papier présente B-DENSE, un cadre novateur qui améliore l'efficacité de l'inférence des modèles de diffusion en utilisant une alignement de trajectoire dense via une architecture à branches multiples, permettant ainsi au modèle étudiant de préserver les informations structurelles intermédiaires et d'obtenir une qualité de génération supérieure par rapport aux méthodes de distillation existantes.

Cherish Puniani, Tushar Kumar, Arnav Bendre, Gaurav Kumar, Shree Singhi2026-03-11🤖 cs.AI

Contextuality from Single-State Ontological Models: An Information-Theoretic No-Go Theorem

Cet article établit un théorème de non-existence informationnel démontrant que les modèles ontologiques classiques contraints de réutiliser un unique espace d'états pour plusieurs interventions ne peuvent reproduire les statistiques quantiques sans engendrer un coût informationnel contextuel inévitable, une limitation que la théorie quantique contourne en abandonnant l'hypothèse d'une variable ontique classique unique sous-jacente.

Song-Ju Kim2026-03-11⚛️ quant-ph

← Précédent Suivant →