Beyond Edge Deletion: A Comprehensive Approach to Counterfactual Explanation in Graph Neural Networks

Cet article présente XPlore, une méthode innovante de génération d'explications contrefactuelles pour les réseaux de neurones graphiques qui, contrairement aux approches antérieures limitées à la suppression d'arêtes, optimise conjointement l'ajout d'arêtes et la perturbation des caractéristiques des nœuds via un cadre basé sur le gradient, permettant ainsi d'obtenir des explications plus valides et fidèles avec une amélioration significative par rapport aux méthodes de l'état de l'art.

Matteo De Sanctis, Riccardo De Sanctis, Stefano Faralli + 2 more2026-03-05🤖 cs.LG

Semi-Supervised Generative Learning via Latent Space Distribution Matching

Cet article présente le cadre LSDM, une méthode d'apprentissage génératif semi-supervisé qui améliore la qualité et la fidélité géométrique des images générées en apprenant un espace latent à partir de données appariées et non appariées avant d'y effectuer un appariement de distributions, tout en offrant une perspective théorique unifiée reliant cette approche aux modèles de diffusion latents.

Kwong Yu Chong, Long Feng2026-03-05🤖 cs.LG

Agentics 2.0: Logical Transduction Algebra for Agentic Data Workflows

Le papier présente Agentics 2.0, un framework Python natif léger qui formalise les inférences de modèles de langage comme des transformations sémantiques typées via une algèbre de transduction logique, permettant ainsi de construire des flux de travail agentic fiables, observables et évolutifs pour des tâches complexes telles que la découverte de données et le parsing NL-to-SQL.

Alfio Massimiliano Gliozzo, Junkyu Lee, Nahuel Defosse2026-03-05🤖 cs.AI

Online Learning for Multi-Layer Hierarchical Inference under Partial and Policy-Dependent Feedback

Cet article propose un algorithme d'apprentissage en ligne à variance réduite, combinant une méthode EXP4 et une optimisation de Lyapunov, pour optimiser les politiques de routage dans les systèmes d'inférence hiérarchique multicouches face à des retours partiels et dépendants de la politique, tout en garantissant la stabilité et des performances proches de l'optimum sous contraintes de ressources.

Haoran Zhang, Seohyeon Cha, Hasan Burhan Beytur + 3 more2026-03-05🤖 cs.AI

Memex(RL): Scaling Long-Horizon LLM Agents via Indexed Experience Memory

Ce papier présente Memex, un mécanisme de mémoire indexée optimisé par apprentissage par renforcement (MemexRL) qui permet aux agents LLM d'exécuter des tâches à long horizon en conservant des preuves complètes dans une base externe tout en maintenant un contexte de travail compact, surmontant ainsi les limites des fenêtres de contexte traditionnelles sans perte d'information.

Zhenting Wang, Huancheng Chen, Jiayun Wang + 1 more2026-03-05🤖 cs.LG

IPD: Boosting Sequential Policy with Imaginary Planning Distillation in Offline Reinforcement Learning

Ce papier propose IPD, un cadre novateur qui améliore les politiques séquentielles en apprentissage par renforcement hors ligne en intégrant une planification imaginaire via un modèle du monde et une fonction de valeur quasi-optimale pour enrichir les données d'entraînement et guider l'inférence, surpassant ainsi les méthodes de l'état de l'art sur le benchmark D4RL.

Yihao Qin, Yuanfei Wang, Hang Zhou + 3 more2026-03-05🤖 cs.AI

LabelBuddy: An Open Source Music and Audio Language Annotation Tagging Tool Using AI Assistance

Ce papier présente LabelBuddy, un outil open-source collaboratif d'annotation audio assistée par l'IA qui comble le fossé entre l'intention humaine et la compréhension machine en permettant l'intégration de modèles personnalisés via des backends conteneurisés pour surmonter les limites des outils d'étiquetage statiques.

Ioannis Prokopiou, Ioannis Sina, Agisilaos Kounelis + 2 more2026-03-05🤖 cs.AI

Activation Outliers in Transformer Quantization: Reproduction, Statistical Analysis, and Deployment Tradeoffs

Cette étude démontre que la dégradation des performances lors de la quantification post-entraînement des transformateurs est principalement causée par des valeurs aberrantes d'activation structurées, et montre que des stratégies de précision mixte ou de regroupement par canal sont nécessaires pour restaurer la précision sans impact significatif sur les performances matérielles.

Pranav Kumar Kaliaperumal2026-03-05🤖 cs.AI

World Properties without World Models: Recovering Spatial and Temporal Structure from Co-occurrence Statistics in Static Word Embeddings

Cette étude démontre que la récupération linéaire de structures spatiales et temporelles dans les représentations internes des modèles de langage ne prouve pas l'existence de modèles du monde internes, car une grande partie de cette structure est déjà latente dans les statistiques de co-occurrence des mots des embeddings statiques.

Elan Barenholtz2026-03-05🤖 cs.AI

PTOPOFL: Privacy-Preserving Personalised Federated Learning via Persistent Homology

Le papier présente PTOPOFL, un cadre d'apprentissage fédéré personnalisé qui remplace l'échange de gradients par des descripteurs topologiques issus de l'homologie persistante pour garantir une confidentialité accrue et améliorer la convergence dans des environnements de données non indépendants et non identiquement distribués (non-IID).

Kelly L Vomo-Donfack, Adryel Hoszu, Grégory Ginot + 1 more2026-03-05🤖 cs.LG

Algorithmic Compliance and Regulatory Loss in Digital Assets

Cette étude démontre que les métriques de classification statiques surestiment l'efficacité réelle des systèmes d'application de la loi contre le blanchiment d'argent dans les crypto-monnaies, car la non-stationnarité temporelle des marchés entraîne une instabilité des seuils de décision et des pertes réglementaires excessives dues à une mauvaise calibration plutôt qu'à une baisse de la précision prédictive.

Khem Raj Bhatt, Krishna Sharma2026-03-05🤖 cs.LG

Balancing Fidelity, Utility, and Privacy in Synthetic Cardiac MRI Generation: A Comparative Study

Cette étude compare trois architectures génératives pour la création d'IRM cardiaques synthétiques et démontre que les modèles de diffusion, en particulier les DDPM, offrent le meilleur équilibre entre fidélité, utilité pour la segmentation et protection de la vie privée dans des conditions de données limitées.

Madhura Edirisooriya, Dasuni Kawya, Ishan Kumarasinghe + 5 more2026-03-05🤖 cs.LG