cs.LG articles | Gist.Science

Divide and Predict: An Architecture for Input Space Partitioning and Enhanced Accuracy

Les auteurs proposent une architecture qui partitionne l'espace d'entrée en exploitant une mesure de variance intrinsèque pour quantifier l'hétérogénéité des données d'entraînement, permettant ainsi d'améliorer significativement la précision des modèles grâce à une purification des données et un apprentissage par blocs.

Fenix W. Huang, Henning S. Mortveit, Christian M. Reidys2026-03-10🤖 cs.LG

Group Entropies and Mirror Duality: A Class of Flexible Mirror Descent Updates for Machine Learning

Cet article propose un cadre théorique et algorithmique novateur qui intègre la théorie des groupes et les entropies de groupe pour créer une famille infinie et flexible d'algorithmes de Descente Miroir, permettant d'adapter les mises à jour d'optimisation aux propriétés statistiques des données grâce à une nouvelle notion de « dualité miroir ».

Andrzej Cichocki, Piergiulio Tempesta2026-03-10🤖 cs.LG

Context-free Self-Conditioned GAN for Trajectory Forecasting

Cet article présente une approche non supervisée et sans contexte basée sur un GAN auto-conditionné qui apprend différents modes de mouvement à partir de trajectoires 2D, surpassant les méthodes existantes dans la prédiction de trajectoires pour les mouvements humains et les agents routiers.

Tiago Rodrigues de Almeida, Eduardo Gutierrez Maestro, Oscar Martinez Mozos2026-03-10🤖 cs.LG

How Far Can Unsupervised RLVR Scale LLM Training?

Cette étude analyse les limites théoriques et pratiques de l'apprentissage par renforcement non supervisé avec récompenses vérifiables (URLVR), révélant que les méthodes intrinsèques conduisent inévitablement à un effondrement du modèle lorsque la confiance initiale est mal alignée avec la justesse, tout en identifiant des pistes prometteuses via des récompenses externes basées sur l'asymétrie computationnelle.

Bingxiang He, Yuxin Zuo, Zeyuan Liu, Shangziqi Zhao, Zixuan Fu, Junlin Yang, Cheng Qian, Kaiyan Zhang, Yuchen Fan, Ganqu Cui, Xiusi Chen, Youbang Sun, Xingtai Lv, Xuekai Zhu, Li Sheng, Ran Li, Huan-ang Gao, Yuchen Zhang, Bowen Zhou, Zhiyuan Liu, Ning Ding2026-03-10🤖 cs.LG

Characterization and upgrade of a quantum graph neural network for charged particle tracking

Cet article présente la caractérisation et l'amélioration d'une architecture hybride de réseau de neurones graphiques quantiques (QGNN) destinée à reconstruire les trajectoires de particules chargées dans les futures expériences du LHC à haute luminosité, en démontrant une convergence d'entraînement accrue grâce à l'intercalage de circuits quantiques paramétrés et de réseaux classiques.

Matteo Argenton, Laura Cappelli, Concezio Bozzi2026-03-10⚛️ quant-ph

Momentum SVGD-EM for Accelerated Maximum Marginal Likelihood Estimation

Ce papier propose une version accélérée de l'algorithme SVGD-EM, baptisée Momentum SVGD-EM, qui intègre l'accélération de Nesterov dans les mises à jour des paramètres et des mesures de probabilité pour améliorer la convergence de l'estimation du maximum de vraisemblance marginale.

Adam Rozzio, Rafael Athanasiades, O. Deniz Akyildiz2026-03-10🤖 cs.LG

A New Lower Bound for the Random Offerer Mechanism in Bilateral Trade using AI-Guided Evolutionary Search

En utilisant le cadre de recherche évolutionnaire guidée par l'IA nommé AlphaEvolve, cette étude établit une nouvelle borne inférieure de 2,0749 pour le rapport entre l'efficacité optimale et celle du mécanisme de l'offreur aléatoire dans le commerce bilatéral, démontrant ainsi un écart d'efficacité plus large que prévu.

Yang Cai, Vineet Gupta, Zun Li, Aranyak Mehta2026-03-10🤖 cs.LG

Structural Causal Bottleneck Models

Cet article introduit les modèles de goulot d'étranglement causaux structurels (SCBMs), une nouvelle classe de modèles causaux qui postulent que les effets entre variables de haute dimension dépendent uniquement de statistiques résumées de basse dimension, offrant ainsi un cadre flexible pour la réduction de dimension et l'estimation d'effets dans des contextes de transfert à faible échantillonnage.

Simon Bing, Jonas Wahl, Jakob Runge2026-03-10🤖 cs.LG

Benchmarking Language Modeling for Lossless Compression of Full-Fidelity Audio

Ce papier présente Trilobyte, une méthode de tokenisation au niveau du byte permettant pour la première fois la compression audio sans perte par modèles de langage sur des fichiers haute fidélité (jusqu'à 24 bits), bien que les gains de compression par rapport aux codecs existants diminuent à mesure que la profondeur de bits augmente.

Phillip Long, Zachary Novack, Chris Donahue2026-03-10🤖 cs.LG

Split Federated Learning Architectures for High-Accuracy and Low-Delay Model Training

Cet article propose une approche d'optimisation conjointe des couches de partitionnement et des affectations clients-agrégateurs dans l'apprentissage fédéré fractionné hiérarchique, démontrant par des heuristiques novatrices une amélioration de la précision de 3 % et une réduction de 20 % du délai et de 50 % de la surcharge par rapport aux méthodes de l'état de l'art.

Yiannis Papageorgiou, Yannis Thomas, Ramin Khalili, Iordanis Koutsopoulos2026-03-10🤖 cs.LG

Agentic Critical Training

L'article propose l'Agentic Critical Training (ACT), une méthode d'apprentissage par renforcement qui permet aux agents de développer un raisonnement autonome sur la qualité de leurs actions plutôt que d'imiter des réflexions préconçues, améliorant ainsi significativement leurs performances et leur capacité de généralisation.

Weize Liu, Minghui Liu, Sy-Tuyen Ho, Souradip Chakraborty, Xiyao Wang, Furong Huang2026-03-10🤖 cs.LG

Impermanent: A Live Benchmark for Temporal Generalization in Time Series Forecasting

Ce papier présente Impermanent, un benchmark en direct évaluant la généralisation temporelle des modèles de prévision de séries temporelles sur des flux de données continus et non stationnaires (basés sur l'activité GitHub), afin de dépasser les limites des évaluations statiques traditionnelles et de mesurer la robustesse face aux changements de distribution dans le temps.

Azul Garza, Renée Rosillo, Rodrigo Mendoza-Smith, David Salinas, Andrew Robert Williams, Arjun Ashok, Mononito Goswami, José Martín Juárez2026-03-10🤖 cs.LG

A mixed-frequency approach for exchange rates predictions

Cet article propose une approche basée sur des modèles à fréquences mixtes pour prédire le taux de change CAD/USD, démontrant ainsi son efficacité pour surmonter les limites de l'agrégation temporelle et résoudre le problème de l'imprévisibilité des taux de change.

Raffaele Mattera, Michelangelo Misuraca, Germana Scepi, Maria Spano2026-03-09🤖 cs.LG

A Cognitive Explainer for Fetal ultrasound images classifier Based on Medical Concepts

Cet article propose un cadre interprétable basé sur des concepts médicaux clés et un réseau de convolution graphique (GCN) pour expliquer les décisions des classificateurs d'images échographiques fœtales selon la cognition clinique, surmontant ainsi le manque de transparence des réseaux de neurones profonds traditionnels.

Yingni Wanga, Yunxiao Liua, Licong Dongc, Xuzhou Wua, Huabin Zhangb, Qiongyu Yed, Desheng Sunc, Xiaobo Zhoue, Kehong Yuan2026-03-09🤖 cs.AI

Correlations Between COVID-19 and Dengue

Ce papier présente un modèle de corrélation basé sur des réseaux de neurones et des LSTM intégrant des données sur la COVID-19, la dengue et des facteurs externes, démontrant des tendances similaires entre les deux maladies et permettant d'estimer les cas de dengue dans les pays où les données sont insuffisantes.

Paula Bergero, Laura P. Schaposnik, Grace Wang2026-03-09🧬 q-bio

Graph Neural Networks on Factor Graphs for Robust, Fast, and Scalable Linear State Estimation with PMUs

Cet article présente une méthode innovante utilisant des réseaux de neurones à graphes appliqués à des graphes de facteurs pour réaliser une estimation d'état linéaire rapide, évolutive et robuste dans les réseaux de transmission équipés d'unités de mesure phasoriques (PMU), garantissant une précision élevée et une résilience locale face aux défaillances des capteurs.

Ognjen Kundacina, Mirsad Cosovic, Dragisa Miskovic + 1 more2026-03-09⚡ eess

Expert-Aided Causal Discovery of Ancestral Graphs

Cet article présente Ancestral GFlowNet (AGFN), un algorithme d'apprentissage par renforcement qui permet d'inférer la distribution des graphes ancestraux en intégrant de manière itérative des connaissances d'experts incertaines, tant a priori qu'a posteriori, pour affiner la découverte causale en présence de confondants latents.

Tiago da Silva, Bruna Bazaluk, Eliezer de Souza da Silva, António Góis, Salem Lahlou, Dominik Heider, Samuel Kaski, Diego Mesquita, Adèle Helena Ribeiro2026-03-09🤖 cs.LG

A unified framework for learning with nonlinear model classes from arbitrary linear samples

Cet article propose un cadre unifié pour l'apprentissage d'objets inconnus à partir de mesures linéaires arbitraires via des modèles non linéaires généraux, établissant de nouvelles garanties de généralisation optimales basées sur la variation du modèle et l'intégrale d'entropie, tout en unifiant et en étendant des résultats existants tels que le compressed sensing avec des modèles génératifs.

Ben Adcock, Juan M. Cardenas, Nick Dexter2026-03-09🤖 cs.LG

Estimation of Energy-dissipation Lower-bounds for Neuromorphic Learning-in-memory

Cet article établit des bornes inférieures théoriques pour l'énergie nécessaire à la résolution de problèmes par des optimiseurs neuromorphiques utilisant l'apprentissage en mémoire, en modélisant la thermodynamique hors équilibre de ces systèmes pour en déduire une efficacité énergétique dépendant uniquement du nombre d'opérations, de la taille du modèle, de la vitesse de convergence et de la précision.

Zihao Chen, Faiek Ahsan, Johannes Leugering, Gert Cauwenberghs, Shantanu Chakrabartty2026-03-09🤖 cs.AI

Make VLM Recognize Visual Hallucination on Cartoon Character Image with Pose Information

Cet article propose un système de détection d'hallucinations visuelles dans les images de personnages de dessins animés générés par IA, utilisant un modèle vision-langage enrichi par des informations de pose et l'apprentissage en contexte pour améliorer significativement la précision par rapport aux méthodes basées uniquement sur les images RVB.

Bumsoo Kim, Wonseop Shin, Kyuchul Lee, Yonghoon Jung, Sanghyun Seo2026-03-09🤖 cs.AI

← Précédent Suivant →