cs.AI articles | Gist.Science

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

Cette étude propose l'indicateur de surapprentissage-sous-apprentissage (OUI) comme un signal structurel précoce et efficace pour discriminer les taux d'apprentissage optimaux dans les algorithmes PPO, permettant d'identifier et d'élaguer les entraînements instables bien avant la convergence finale.

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ortí2026-03-11🤖 cs.AI

Towards a Neural Debugger for Python

Cet article présente les « neural debuggers », des modèles de langage capables d'émuler les fonctionnalités interactives des débogueurs traditionnels pour prédire l'exécution de programmes Python, ouvrant ainsi la voie à des systèmes de codage autonomes plus performants.

Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel Synnaeve2026-03-11🤖 cs.AI

Think Before You Lie: How Reasoning Improves Honesty

Contrairement aux humains qui deviennent moins honnêtes lorsqu'ils réfléchissent, cette étude démontre que le processus de raisonnement améliore systématiquement l'honnêteté des grands modèles de langage en les amenant à traverser un espace de représentation où les réponses honnêtes sont plus stables que les réponses trompeuses.

Ann Yuan, Asma Ghandeharioun, Carter Blum, Alicia Machado, Jessica Hoffmann, Daphne Ippolito, Martin Wattenberg, Lucas Dixon, Katja Filippova2026-03-11🤖 cs.AI

BEACON: Language-Conditioned Navigation Affordance Prediction under Occlusion

Le papier propose BEACON, une méthode qui améliore la navigation robotique conditionnée par le langage en présence d'obstacles en prédisant une carte de chaleur d'affordance en vue aérienne (BEV) à partir d'observations RGB-D et d'instructions textuelles, surpassant ainsi les approches basées sur l'espace image pour localiser des cibles occluses.

Xinyu Gao, Gang Chen, Javier Alonso-Mora2026-03-11🤖 cs.AI

Emotional Modulation in Swarm Decision Dynamics

Cet article étend l'équation des abeilles à un modèle basé sur des agents où la valence et l'éveil émotionnels modulent les taux d'interaction, démontrant ainsi comment la contagion émotionnelle et les points de bascule structurels influencent la formation du consensus dans les décisions collectives.

David Freire-Obregón2026-03-11🤖 cs.AI

Understanding the Use of a Large Language Model-Powered Guide to Make Virtual Reality Accessible for Blind and Low Vision People

Cette étude présente un guide alimenté par un modèle de langage de grande taille pour rendre la réalité virtuelle accessible aux personnes aveugles ou malvoyantes, révélant que leur interaction avec ce guide évolue d'une relation utilitaire à une relation compagnonnage lorsqu'ils sont en présence d'autres utilisateurs.

Jazmin Collins, Sharon Y Lin, Tianqi Liu, Andrea Stevenson Won, Shiri Azenkot2026-03-11🤖 cs.AI

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

En introduisant le cadre contrôlé de la superposition de type « sac de mots » (BOWS), cette étude démontre que les corrélations entre caractéristiques permettent d'organiser géométriquement les interférences de manière constructive dans les réseaux de neurones, expliquant ainsi la formation de clusters sémantiques et de structures cycliques observées dans les modèles de langage réels, ce que la vision traditionnelle de la superposition basée sur des caractéristiques non corrélées ne parvenait pas à prédire.

Lucas Prieto, Edward Stevinson, Melih Barsbey, Tolga Birdal, Pedro A. M. Mediano2026-03-11🤖 cs.AI

Online Neural Networks for Change-Point Detection

Cet article présente deux approches de détection de points de changement basées sur les réseaux de neurones et l'apprentissage en ligne, qui offrent une complexité computationnelle linéaire, surpassent les méthodes existantes sur divers jeux de données et garantissent une convergence vers des solutions optimales.

Mikhail Hushchyn, Kenenbek Arzymatov, Denis Derkach2026-03-10🤖 cs.LG

Automated Reinforcement Learning: An Overview

Cet article présente un aperçu de l'apprentissage par renforcement automatisé (AutoRL), en examinant la littérature existante, les techniques récentes basées sur les grands modèles de langage, ainsi que les défis et les perspectives de recherche dans ce domaine.

Reza Refaei Afshar, Joaquin Vanschoren, Uzay Kaymak, Rui Zhang, Yaoxin Wu, Wen Song, Yingqian Zhang2026-03-10🤖 cs.LG

Explainable classification of astronomical uncertain time series

Cet article propose un modèle de classification de séries temporelles incertaines en astrophysique, conçu pour être intrinsèquement explicable et intégrer l'incertitude des données en tant qu'entrée supplémentaire, atteignant ainsi des performances comparables aux méthodes de pointe tout en offrant aux experts la capacité d'inspecter et d'interpréter les prédictions.

Michael Franklin Mbouopda (LIMOS, UCA), Emille E. O. Ishida (LIMOS, UCA), Engelbert Mephu Nguifo (LIMOS, UCA), Emmanuel Gangler (LPC, UCA)2026-03-10🔭 astro-ph

A Survey of Large Language Models

Ce document de synthèse examine les récents progrès des grands modèles de langage (LLM), en se concentrant sur leurs quatre aspects majeurs que sont le pré-entraînement, le réglage par adaptation, l'utilisation et l'évaluation des capacités, tout en présentant les ressources disponibles et en discutant des défis futurs.

Wayne Xin Zhao, Kun Zhou, Junyi Li + 19 more2026-03-10💬 cs.CL

Utility Theory based Cognitive Modeling in the Application of Robotics: A Survey

Cette étude de synthèse examine l'application de la théorie de l'utilité au modèle cognitif en robotique, en retraçant son évolution depuis la robotique basée sur le comportement jusqu'aux systèmes de valeurs actuels, tout en identifiant les défis ouverts et les perspectives de recherche pour les systèmes mono et multi-agents.

Qin Yang2026-03-10💻 cs

Online Dispatching and Routing for Automated Guided Vehicles in Pickup and Delivery Systems on Loop-Based Graphs

Cet article présente un algorithme en boucle pour la planification et le routage en temps réel de véhicules guidés automatisés (AGV) sur des graphes en boucle, démontrant expérimentalement sa supériorité ou son équivalence en termes de qualité de solution par rapport à d'autres méthodes, tout en réduisant considérablement le temps de calcul.

Louis Stubbe, Jens Goemaere, Jan Goedgebeur2026-03-10💻 cs

Agent-OM: Leveraging LLM Agents for Ontology Matching

Cet article présente Agent-OM, un nouveau cadre générique exploitant des agents de modèles de langage pour l'appariement d'ontologies, qui démontre des performances compétitives sur des tâches simples et une amélioration significative sur des tâches complexes et en contexte de few-shot par rapport aux systèmes de l'état de l'art.

Zhangcheng Qiang, Weiqing Wang, Kerry Taylor2026-03-10💬 cs.CL

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Cet article propose une revue de la littérature sur les tests adaptatifs informatisés sous l'angle de l'apprentissage automatique, en examinant comment ces techniques peuvent optimiser les modèles de mesure, la sélection des questions et le contrôle des tests pour créer des systèmes d'évaluation plus robustes, équitables et efficaces.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong Chen2026-03-10🤖 cs.LG

Fast Explanations via Policy Gradient-Optimized Explainer

Ce papier présente FEX, un nouveau cadre d'explication rapide basé sur le gradient de politique qui représente les attributions par des distributions de probabilité, permettant de réduire le temps d'inférence de plus de 97 % et l'utilisation de la mémoire de 70 % tout en maintenant une haute qualité d'explication pour des tâches de classification d'images et de texte.

Deng Pan, Nuno Moniz, Nitesh Chawla2026-03-10🤖 cs.LG

Exploring Diffusion Models' Corruption Stage in Few-Shot Fine-tuning and Mitigating with Bayesian Neural Networks

Cet article identifie et modélise théoriquement une phase de « corruption » lors du fine-tuning à peu d'exemples de modèles de diffusion, puis propose une solution basée sur les réseaux de neurones bayésiens qui atténue ce phénomène et améliore la fidélité et la diversité des images générées sans coût d'inférence supplémentaire.

Xiaoyu Wu, Jiaru Zhang, Yang Hua, Bohan Lyu, Hao Wang, Tao Song, Haibing Guan2026-03-10🤖 cs.LG

LAMBDA: A Large Model Based Data Agent

LAMBDA est un agent de données open-source et sans code basé sur des modèles de langage, qui orchestre un programmeur et un inspecteur pour générer et déboguer automatiquement du code, tout en permettant une intervention humaine et l'intégration de connaissances externes pour faciliter l'analyse de données.

Maojun Sun, Ruijian Han, Binyan Jiang + 4 more2026-03-10🤖 cs.AI

OTAD: An Optimal Transport-Induced Robust Model for Agnostic Adversarial Attack

Ce papier présente OTAD, un nouveau modèle de défense robuste qui combine l'entraînement de réseaux de neurones avec une régularisation par transport optimal et l'interpolation via un problème d'intégration convexe pour garantir une continuité de Lipschitz locale tout en maintenant une grande expressivité.

Kuo Gai, Sicong Wang, Shihua Zhang2026-03-10🤖 cs.LG

Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

Cet article propose une méthode d'échantillonnage par importance recuit (AIS) couplée à une reparamétrisation efficace pour surmonter les limitations des modèles latents à processus gaussiens (GPLVM) dans les espaces de grande dimension, permettant ainsi d'obtenir des bornes variationnelles plus serrées et une convergence plus robuste que les méthodes actuelles.

Jian Xu, Shian Du, Junmei Yang, Qianli Ma, Delu Zeng, John Paisley2026-03-10🤖 cs.LG

← Précédent Suivant →