cs.LG articles | Gist.Science

A Multi-Agent Framework for Interpreting Multivariate Physiological Time Series

Cette étude présente Vivaldi, un système multi-agents pour l'interprétation de séries temporelles physiologiques, révélant que l'orchestration d'agents améliore la justesse des explications pour les modèles non-déductifs mais dégrade leur pertinence pour les modèles de réflexion, soulignant ainsi que la valeur de l'IA agentique en milieu critique réside dans l'externalisation sélective du calcul plutôt que dans la complexité maximale du raisonnement.

Davide Gabrielli, Paola Velardi, Stefano Faralli + 1 more2026-03-05🤖 cs.LG

Learning Hip Exoskeleton Control Policy via Predictive Neuromusculoskeletal Simulation

Cette étude présente un cadre d'apprentissage basé sur la simulation neuromusculosquelettique qui permet de développer et de déployer une politique de contrôle pour un exosquelette de hanche sans données de capture de mouvement, démontrant ainsi une réduction de l'activation musculaire en simulation et une transfert efficace vers le matériel réel sans réglage supplémentaire.

Ilseung Park, Changseob Song, Inseung Kang2026-03-05🤖 cs.LG

CodeTaste: Can LLMs Generate Human-Level Code Refactorings?

Le papier présente CodeTaste, une nouvelle norme d'évaluation révélant que, bien que les agents LLM puissent exécuter des refactorisations lorsqu'elles sont spécifiées en détail, ils peinent à identifier spontanément les choix humains, une lacune que l'approche « proposer puis implémenter » permet de combler.

Alex Thillen, Niels Mündler, Veselin Raychev + 1 more2026-03-05🤖 cs.AI

Architectural Proprioception in State Space Models: Thermodynamic Training Induces Anticipatory Halt Detection

Cette étude démontre que l'entraînement thermodynamique induit chez les modèles d'espace d'état (SSM) une « proprioception architecturale » permettant une détection anticipée de l'arrêt via un couplage entre l'entropie de l'état et la confiance, un phénomène absent chez les Transformers qui révèle une forme de méta-cognition computationnelle native.

Jay Noon2026-03-05🤖 cs.AI

REDNET-ML: A Multi-Sensor Machine Learning Pipeline for Harmful Algal Bloom Risk Detection Along the Omani Coast

Le projet REDNET-ML développe un pipeline d'apprentissage automatique reproductible qui fusionne des données multi-capteurs satellitaires et des modèles de détection d'objets pour évaluer les risques de blooms algaux nuisibles le long des côtes omanaises.

Ameer Alhashemi2026-03-05🤖 cs.LG

Noise-aware Client Selection for carbon-efficient Federated Learning via Gradient Norm Thresholding

Cet article propose une approche modulaire intégrant un filtrage par seuillage de la norme du gradient pour améliorer la sélection des clients dans l'apprentissage fédéré éco-responsable, permettant ainsi de filtrer les données bruyantes et d'optimiser l'efficacité carbone tout en garantissant la convergence du modèle.

Patrick Wilhelm, Inese Yilmaz, Odej Kao2026-03-05🤖 cs.AI

Stable and Steerable Sparse Autoencoders with Weight Regularization

En introduisant une régularisation L2 des poids dans les autoencodeurs parcimonieux, cette étude démontre une amélioration significative de la stabilité des caractéristiques apprises et de l'efficacité du pilotage (steering) des modèles de langage, tout en renforçant la corrélation entre les explications sémantiques et le contrôle fonctionnel.

Piotr Jedryszek, Oliver M. Crook2026-03-05🤖 cs.LG

Bayesian Adversarial Privacy

Cet article propose une nouvelle notion quantitative de confidentialité, fondée sur la théorie de décision bayésienne et conçue pour être plus contextuelle et rigoureuse que la confidentialité différentielle ou la théorie du divulgation statistique, en exigeant que les décisions de divulgation soient prises du point de vue de la distribution a priori.

Cameron Bell, Timothy Johnston, Antoine Luciano + 1 more2026-03-05🤖 cs.LG

Beyond Mixtures and Products for Ensemble Aggregation: A Likelihood Perspective on Generalized Means

Cet article propose une justification théorique fondée sur la vraisemblance pour l'agrégation d'ensembles via les moyennes généralisées, démontrant que seules les configurations d'ordre $r \in [0,1]$ garantissent systématiquement une amélioration par rapport aux distributions individuelles, ce qui valide ainsi les pratiques courantes de pooling linéaire et géométrique.

Raphaël Razafindralambo, Rémy Sun, Frédéric Precioso + 2 more2026-03-05🤖 cs.LG

Beyond Edge Deletion: A Comprehensive Approach to Counterfactual Explanation in Graph Neural Networks

Cet article présente XPlore, une méthode innovante de génération d'explications contrefactuelles pour les réseaux de neurones graphiques qui, contrairement aux approches antérieures limitées à la suppression d'arêtes, optimise conjointement l'ajout d'arêtes et la perturbation des caractéristiques des nœuds via un cadre basé sur le gradient, permettant ainsi d'obtenir des explications plus valides et fidèles avec une amélioration significative par rapport aux méthodes de l'état de l'art.

Matteo De Sanctis, Riccardo De Sanctis, Stefano Faralli + 2 more2026-03-05🤖 cs.LG

Semi-Supervised Generative Learning via Latent Space Distribution Matching

Cet article présente le cadre LSDM, une méthode d'apprentissage génératif semi-supervisé qui améliore la qualité et la fidélité géométrique des images générées en apprenant un espace latent à partir de données appariées et non appariées avant d'y effectuer un appariement de distributions, tout en offrant une perspective théorique unifiée reliant cette approche aux modèles de diffusion latents.

Kwong Yu Chong, Long Feng2026-03-05🤖 cs.LG

Nearest-Neighbor Density Estimation for Dependency Suppression

Cet article propose une méthode d'estimation de densité par plus proches voisins intégrée à un autoencodeur variationnel pour supprimer les dépendances indésirables dans les données, surpassant les techniques existantes en équilibrant efficacement l'effacement d'informations sensibles et la préservation de l'utilité des données.

Kathleen Anderson, Thomas Martinetz2026-03-05🤖 cs.LG

Agentics 2.0: Logical Transduction Algebra for Agentic Data Workflows

Le papier présente Agentics 2.0, un framework Python natif léger qui formalise les inférences de modèles de langage comme des transformations sémantiques typées via une algèbre de transduction logique, permettant ainsi de construire des flux de travail agentic fiables, observables et évolutifs pour des tâches complexes telles que la découverte de données et le parsing NL-to-SQL.

Alfio Massimiliano Gliozzo, Junkyu Lee, Nahuel Defosse2026-03-05🤖 cs.AI

Online Learning for Multi-Layer Hierarchical Inference under Partial and Policy-Dependent Feedback

Cet article propose un algorithme d'apprentissage en ligne à variance réduite, combinant une méthode EXP4 et une optimisation de Lyapunov, pour optimiser les politiques de routage dans les systèmes d'inférence hiérarchique multicouches face à des retours partiels et dépendants de la politique, tout en garantissant la stabilité et des performances proches de l'optimum sous contraintes de ressources.

Haoran Zhang, Seohyeon Cha, Hasan Burhan Beytur + 3 more2026-03-05🤖 cs.AI

Memex(RL): Scaling Long-Horizon LLM Agents via Indexed Experience Memory

Ce papier présente Memex, un mécanisme de mémoire indexée optimisé par apprentissage par renforcement (MemexRL) qui permet aux agents LLM d'exécuter des tâches à long horizon en conservant des preuves complètes dans une base externe tout en maintenant un contexte de travail compact, surmontant ainsi les limites des fenêtres de contexte traditionnelles sans perte d'information.

Zhenting Wang, Huancheng Chen, Jiayun Wang + 1 more2026-03-05🤖 cs.LG

Causality Elicitation from Large Language Models

Cet article propose un pipeline pour extraire des hypothèses causales plausibles encodées dans les grands modèles de langage en générant des documents, en y identifiant des événements normalisés et en appliquant des méthodes de découverte causale pour construire des graphes candidats inspectables.

Takashi Kameyama, Masahiro Kato, Yasuko Hio + 2 more2026-03-05🤖 cs.AI

IPD: Boosting Sequential Policy with Imaginary Planning Distillation in Offline Reinforcement Learning

Ce papier propose IPD, un cadre novateur qui améliore les politiques séquentielles en apprentissage par renforcement hors ligne en intégrant une planification imaginaire via un modèle du monde et une fonction de valeur quasi-optimale pour enrichir les données d'entraînement et guider l'inférence, surpassant ainsi les méthodes de l'état de l'art sur le benchmark D4RL.

Yihao Qin, Yuanfei Wang, Hang Zhou + 3 more2026-03-05🤖 cs.AI

LabelBuddy: An Open Source Music and Audio Language Annotation Tagging Tool Using AI Assistance

Ce papier présente LabelBuddy, un outil open-source collaboratif d'annotation audio assistée par l'IA qui comble le fossé entre l'intention humaine et la compréhension machine en permettant l'intégration de modèles personnalisés via des backends conteneurisés pour surmonter les limites des outils d'étiquetage statiques.

Ioannis Prokopiou, Ioannis Sina, Agisilaos Kounelis + 2 more2026-03-05🤖 cs.AI

LUMINA: Foundation Models for Topology Transferable ACOPF

Ce papier présente LUMINA, un cadre fondé sur des principes de conception empiriques pour développer des modèles de base capables de transférer l'apprentissage vers des problèmes d'optimisation de flux de puissance alternatif (ACOPF) tout en garantissant le respect strict des lois physiques et des contraintes de sécurité.

Yijiang Li, Zeeshan Memon, Hongwei Jin + 7 more2026-03-05🤖 cs.LG

Activation Outliers in Transformer Quantization: Reproduction, Statistical Analysis, and Deployment Tradeoffs

Cette étude démontre que la dégradation des performances lors de la quantification post-entraînement des transformateurs est principalement causée par des valeurs aberrantes d'activation structurées, et montre que des stratégies de précision mixte ou de regroupement par canal sont nécessaires pour restaurer la précision sans impact significatif sur les performances matérielles.

Pranav Kumar Kaliaperumal2026-03-05🤖 cs.AI

← Précédent Suivant →