Enhancing Retrieval-Augmented Generation with Entity Linking for Educational Platforms

Cette étude propose ELERAG, une architecture de génération augmentée par la récupération intégrant le lien d'entités et une stratégie de réordonnancement hybride, qui démontre une précision factuelle supérieure aux méthodes de l'état de l'art dans des contextes éducatifs spécialisés en italien, tout en révélant l'importance d'adapter les stratégies au domaine pour éviter les biais de distribution.

Francesco Granata, Francesco Poggi, Misael Mongiovì2026-03-11🤖 cs.AI

EMFusion: Conditional Diffusion Framework for Trustworthy Frequency Selective EMF Forecasting in Wireless Networks

Cet article présente EMFusion, un cadre de diffusion conditionnelle probabiliste qui améliore la fiabilité des prévisions de champs électromagnétiques sélectifs en fréquence pour les réseaux sans fil en intégrant des facteurs contextuels, en fournissant des estimations d'incertitude explicites et en surpassant les modèles de base existants.

Zijiang Yan, Yixiang Huang, Jianhua Pei, Hina Tabassum, Luca Chiaraviglio2026-03-11🤖 cs.AI

Small Language Models for Efficient Agentic Tool Calling: Outperforming Large Models with Targeted Fine-tuning

Cette étude démontre qu'un petit modèle de langage (SLM) de 350 millions de paramètres, finement ajusté avec une seule époque, surpasse significativement les grands modèles (LLM) et les approches basées sur le raisonnement en chaîne (CoT) dans les tâches d'appel d'outils, atteignant un taux de réussite de 77,55 % sur ToolBench et offrant ainsi une solution rentable pour l'intégration de l'IA générative en entreprise.

Polaris Jhandi, Owais Kazi, Shreyas Subramanian, Neel Sendas2026-03-11🤖 cs.AI

Reinforcement Learning for Self-Improving Agent with Skill Library

Ce papier propose SAGE, un cadre d'apprentissage par renforcement innovant qui améliore l'autonomie des agents LLM en intégrant une bibliothèque de compétences via des déroulements séquentiels et une récompense adaptée, permettant d'atteindre de meilleures performances et une efficacité accrue sur la plateforme AppWorld.

Jiongxiao Wang, Qiaojing Yan, Yawei Wang, Yijun Tian, Soumya Smruti Mishra, Zhichao Xu, Megha Gandhi, Panpan Xu, Lin Lee Cheong2026-03-11🤖 cs.AI

CRANE: Causal Relevance Analysis of Language-Specific Neurons in Multilingual Large Language Models

Le papier propose CRANE, un cadre d'analyse basé sur la pertinence fonctionnelle qui identifie avec plus de précision les neurones spécifiques à chaque langue dans les grands modèles multilingues en utilisant des interventions ciblées, révélant ainsi des spécialisations sélectives mais non exclusives que les méthodes traditionnelles basées sur l'activation ne parviennent pas à distinguer.

Yifan Le, Yunliang Li2026-03-11🤖 cs.AI

Empowering All-in-Loop Health Management of Spacecraft Power System in the Mega-Constellation Era via Human-AI Collaboration

Cet article propose SpaceHMchat, un cadre open-source de collaboration humain-IA basé sur le principe d'alignement des capacités sous-jacentes, conçu pour gérer la santé des systèmes de puissance des satellites dans l'ère des méga-constellations en couvrant l'ensemble du cycle de diagnostic et de maintenance, tout en validant son efficacité via une plateforme expérimentale réaliste et un jeu de données inédit.

Yi Di, Zhibin Zhao, Fujin Wang, Xue Liu, Jiafeng Tang, Jiaxin Ren, Zhi Zhai, Xuefeng Chen2026-03-11🤖 cs.AI

CLEAR-Mamba:Towards Accurate, Adaptive and Trustworthy Multi-Sequence Ophthalmic Angiography Classification

L'article présente CLEAR-Mamba, un cadre amélioré basé sur MedMamba intégrant une couche d'adaptation hyper-réseau (HaC) et un schéma de prédiction fiable (RaP) pour surmonter les limites de généralisation et de confiance dans la classification des angiographies oculaires multi-séquences FFA et ICGA, démontrant ainsi des performances supérieures sur un nouveau jeu de données à grande échelle.

Zhuonan Wang, Wenjie Yan, Wenqiao Zhang, Xiaohui Song, Jian Ma, Ke Yao, Yibo Yu, Beng Chin Ooi2026-03-11🤖 cs.AI

Automating Forecasting Question Generation and Resolution for AI Evaluation

Cet article présente un système automatisé utilisant des agents de recherche web pilotés par des LLM pour générer et résoudre à grande échelle des questions de prévision réalistes et diversifiées, démontrant une haute fiabilité et la capacité à améliorer les performances des modèles d'IA grâce à des stratégies de décomposition de questions.

Nikos I. Bosse, Peter Mühlbacher, Jack Wildman, Lawrence Phillips, Dan Schwarz2026-03-11🤖 cs.AI

UAT-LITE: Inference-Time Uncertainty-Aware Attention for Pretrained Transformers

Le papier présente UAT-LITE, un cadre d'inférence qui rend l'attention des transformateurs préentraînés consciente de l'incertitude via le dropout de Monte Carlo, permettant d'estimer et de moduler l'incertitude épistémique au niveau des tokens sans modifier les poids du modèle, ce qui améliore significativement l'étalonnage et la prédiction sélective.

Elias Hossain, Shubhashis Roy Dipta, Subash Neupane, Rajib Rana, Ravid Shwartz-Ziv, Ivan Garibay, Niloofar Yousefi2026-03-11🤖 cs.AI

Infusion: Shaping Model Behavior by Editing Training Data via Influence Functions

Ce papier présente Infusion, un cadre utilisant des approximations de fonctions d'influence pour modifier subtilement un faible pourcentage de données d'entraînement et façonner de manière ciblée le comportement des modèles d'apprentissage automatique, démontrant ainsi la vulnérabilité des systèmes d'IA à des attaques de type « empoisonnement de données » subtiles et transférables.

J Rosser, Robert Kirk, Edward Grefenstette, Jakob Foerster, Laura Ruis2026-03-11🤖 cs.AI

Energy-Aware Spike Budgeting for Continual Learning in Spiking Neural Networks for Neuromorphic Vision

Cet article propose un cadre d'apprentissage continu pour les réseaux de neurones à impulsions (SNN) en vision neuromorphique, qui intègre une gestion adaptative du budget de spikes pour optimiser simultanément la précision et l'efficacité énergétique tout en atténuant l'oubli catastrophique sur des données événementielles et basées sur des images.

Anika Tabassum Meem, Muntasir Hossain Nadid, Md Zesun Ahmed Mia2026-03-11🤖 cs.AI

B-DENSE: Branching For Dense Ensemble Network Supervision Efficiency

Le papier présente B-DENSE, un cadre novateur qui améliore l'efficacité de l'inférence des modèles de diffusion en utilisant une alignement de trajectoire dense via une architecture à branches multiples, permettant ainsi au modèle étudiant de préserver les informations structurelles intermédiaires et d'obtenir une qualité de génération supérieure par rapport aux méthodes de distillation existantes.

Cherish Puniani, Tushar Kumar, Arnav Bendre, Gaurav Kumar, Shree Singhi2026-03-11🤖 cs.AI

Contextuality from Single-State Ontological Models: An Information-Theoretic No-Go Theorem

Cet article établit un théorème de non-existence informationnel démontrant que les modèles ontologiques classiques contraints de réutiliser un unique espace d'états pour plusieurs interventions ne peuvent reproduire les statistiques quantiques sans engendrer un coût informationnel contextuel inévitable, une limitation que la théorie quantique contourne en abandonnant l'hypothèse d'une variable ontique classique unique sous-jacente.

Song-Ju Kim2026-03-11⚛️ quant-ph