cs.LG articles | Gist.Science

XConv: Low-memory stochastic backpropagation for convolutional layers

L'article présente XConv, une méthode de rétropropagation stochastique pour les couches de convolution qui réduit considérablement l'utilisation de la mémoire tout en conservant les performances et l'intégration logicielle des méthodes exactes, sans imposer de contraintes architecturales.

Anirudh Thatipelli, Jeffrey Sam, Mathias Louboutin, Ali Siahkoohi, Rongrong Wang, Felix J. HerrmannWed, 11 Ma🤖 cs.LG

A Survey on Decentralized Federated Learning

Ce sondage examine systématiquement les méthodes d'apprentissage fédéré décentralisé (DFL) jusqu'en 2026, en les classant selon deux architectures, en proposant une taxonomie centrée sur les défis, en évaluant les pratiques actuelles et en identifiant des axes de recherche prioritaires pour renforcer la sécurité, la vie privée et les mécanismes d'incitation dans des environnements sans coordinateur central.

Edoardo Gabrielli, Anthony Di Pietro, Dario Fenoglio, Giovanni Pica, Gabriele TolomeiWed, 11 Ma🤖 cs.LG

Polynomially Over-Parameterized Convolutional Neural Networks Contain Structured Strong Winning Lottery Tickets

En surmontant les limitations des outils mathématiques précédents grâce à une généralisation multidimensionnelle du problème de la somme de sous-ensembles, cet article démontre l'existence de « tickets gagnants » structurés dans des réseaux de neurones convolutifs sur-paramétrés, prouvant ainsi qu'ils peuvent approximer des réseaux plus petits sans entraînement.

Arthur da Cunha, Francesco d'Amore, Emanuele NataleWed, 11 Ma🤖 cs.LG

Provable Filter for Real-world Graph Clustering

Cet article propose une méthode de clustering graphique novatrice et théoriquement fondée, capable de gérer simultanément les graphes homophiles et hétérophiles en construisant des graphes filtrés et en utilisant un mécanisme d'attention pour surpasser les méthodes actuelles.

Xuanting Xie, Erlin Pan, Zhao Kang, Wenyu Chen, Bingheng LiWed, 11 Ma🤖 cs.LG

Enhancing Computational Efficiency in Multiscale Systems Using Deep Learning of Coordinates and Flow Maps

Cet article présente un cadre d'apprentissage profond combinant la découverte de coordonnées et de cartes de flux pour améliorer l'efficacité computationnelle et la précision des simulations de systèmes multi-échelles complexes, comme démontré sur les modèles de FitzHugh-Nagumo et de Kuramoto-Sivashinsky.

Asif Hamid, Danish Rafiq, Shahkar Ahmad Nahvi, Mohammad Abid BazazWed, 11 Ma🤖 cs.LG

Sparse Variational Student-t Processes for Heavy-tailed Modeling

Cet article présente les Processus de Student-t Variationnels Épars (SVTP), un cadre novateur qui étend la méthode des points d'induction aux processus de Student-t pour offrir une modélisation robuste des queues lourdes et des valeurs aberrantes, surpassant les processus gaussiens épars en précision et en vitesse de convergence tout en restant efficace sur de grands jeux de données.

Jian Xu, Delu Zeng, John PaisleyWed, 11 Ma🤖 cs.AI

HYGENE: A Diffusion-based Hypergraph Generation Method

Ce papier présente HYGENE, la première méthode d'apprentissage profond basée sur la diffusion pour générer des hypergraphes réalistes et diversifiés en utilisant une approche d'expansion progressive locale sur leur représentation bipartite.

Dorian Gailhard, Enzo Tartaglione, Lirida Naviner, Jhony H. GiraldoWed, 11 Ma🤖 cs.LG

Robust Training of Neural Networks at Arbitrary Precision and Sparsity

Ce papier propose un cadre unifié qui modélise la quantification et l'éparpillement comme du bruit additif et introduit une transformée de déquantification débruyante pour établir un chemin de gradient explicite, permettant ainsi l'entraînement robuste de réseaux de neurones à des précisions arbitraires et à des niveaux d'éparpillement extrêmes, y compris en dessous d'un bit.

Chengxi Ye, Grace Chu, Yanfeng Liu, Yichi Zhang, Lukasz Lew, Li Zhang, Mark Sandler, Andrew HowardWed, 11 Ma🤖 cs.AI

ARLBench: Flexible and Efficient Benchmarking for Hyperparameter Optimization in Reinforcement Learning

Le papier propose ARLBench, un benchmark flexible et efficace pour l'optimisation des hyperparamètres en apprentissage par renforcement, conçu pour permettre des comparaisons fiables entre différentes méthodes d'AutoRL tout en réduisant considérablement les besoins en ressources de calcul.

Jannis Becktepe, Julian Dierkes, Carolin Benjamins, Aditya Mohan, David Salinas, Raghu Rajan, Frank Hutter, Holger Hoos, Marius Lindauer, Theresa EimerWed, 11 Ma🤖 cs.LG

DRUPI: Dataset Reduction Using Privileged Information

Le papier présente DRUPI, une méthode de condensation de dataset qui améliore l'efficacité de l'apprentissage en synthétisant, en plus des données réduites, des informations privilégiées (telles que des étiquettes de caractéristiques ou d'attention) servant de supervision auxiliaire.

Shaobo Wang, Youxin Jiang, Tianle Niu, Yantai Yang, Ruiji Zhang, Shuhao Hu, Shuaiyu Zhang, Chenghao Sun, Weiya Li, Conghui He, Xuming Hu, Linfeng ZhangWed, 11 Ma🤖 cs.AI

Unsupervised Representation Learning from Sparse Transformation Analysis

Ce papier propose une méthode d'apprentissage de représentations non supervisé qui factorise les transformations des variables latentes en composantes sparses via un modèle de flot de probabilité, permettant d'obtenir des représentations décorrélées basées sur des primitives de transformation apprises et d'atteindre des performances de pointe en termes de vraisemblance des données et d'équivariance approximative.

Yue Song, Thomas Anderson Keller, Yisong Yue, Pietro Perona, Max WellingWed, 11 Ma🤖 cs.LG

Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

Cet article propose une approche d'optimisation différentiable basée sur les fonctions de barrière de contrôle pour apprendre de manière interprétable, à partir de données, comment les agents multi-agents allouent leur responsabilité afin d'assurer des interactions sûres et efficaces.

Isaac Remy, David Fridovich-Keil, Karen LeungWed, 11 Ma🤖 cs.LG

Calabi-Yau metrics through Grassmannian learning and Donaldson's algorithm

Cet article présente une nouvelle approche combinant l'algorithme de Donaldson et l'apprentissage automatique via la descente de gradient sur une variété de Grassmann pour obtenir des approximations de métriques de Kähler plates en Ricci, en appliquant cette méthode à la famille de Dwork de trois-variétés.

Carl Henrik Ek, Oisin Kim, Challenger MishraWed, 11 Ma🤖 cs.LG

Adaptive and Stratified Subsampling for High-Dimensional Robust Estimation

Ce papier propose et analyse théoriquement deux estimateurs par sous-échantillonnage, l'échantillonnage d'importance adaptatif et le sous-échantillonnage stratifié, pour réaliser une régression robuste en haute dimension sous des hypothèses de bruit à variance finie, de contamination et de dépendance temporelle, tout en fournissant des intervalles de confiance valides et démontrant des performances empiriques supérieures.

Prateek Mittal, Joohi ChauhanWed, 11 Ma🤖 cs.LG

Scalable Message Passing Neural Networks: No Need for Attention in Large Graph Representation Learning

Les auteurs proposent les Scalable Message Passing Neural Networks (SMPNNs), une architecture de réseaux de neurones graphiques profonds qui remplace le mécanisme d'attention par des convolutions standard intégrées à des blocs de type Transformer avec normalisation pré-couche, permettant ainsi d'atteindre des performances compétitives sur de grands graphes tout en évitant le sur-ajustement et les coûts computationnels élevés.

Haitz Sáez de Ocáriz Borde, Artem Lukoianov, Anastasis Kratsios, Michael Bronstein, Xiaowen DongWed, 11 Ma🤖 cs.LG

SPDIM: Source-Free Unsupervised Conditional and Label Shift Adaptation in EEG

Ce papier propose SPDIM, une méthode d'adaptation de domaine sans source et non supervisée basée sur l'optimisation géométrique sur la variété des matrices définies positives, qui surpasse les approches existantes pour gérer les décalages de distribution, y compris les décalages d'étiquettes, dans les données EEG.

Shanglin Li, Motoaki Kawanabe, Reinmar J. KoblerWed, 11 Ma🤖 cs.LG

Prognostics for Autonomous Deep-Space Habitat Health Management under Multiple Unknown Failure Modes

Cet article propose un cadre de prognostique non supervisé permettant de prédire la durée de vie utile résiduelle des habitats spatiaux profonds en identifiant simultanément des modes de défaillance inconnus et en sélectionnant les capteurs pertinents à partir de données non étiquetées.

Benjamin Peters, Ayush Mohanty, Xiaolei Fang, Stephen K. Robinson, Nagi GebraeelWed, 11 Ma🤖 cs.LG

Morphological-Symmetry-Equivariant Heterogeneous Graph Neural Network for Robotic Dynamics Learning

Cet article présente le MS-HGNN, un réseau de neurones sur graphes hétérogènes équivariant aux symétries morphologiques qui intègre les structures cinématiques et les symétries des robots pour apprendre efficacement leur dynamique avec une grande généralisabilité, comme validé par des expériences sur des robots quadrupèdes.

Fengze Xie, Sizhe Wei, Yue Song, Yisong Yue, Lu GanWed, 11 Ma🤖 cs.LG

CuriousBot: Interactive Mobile Exploration via Actionable 3D Relational Object Graph

Ce papier présente CuriousBot, un système de robotique mobile qui utilise un graphe d'objets relationnels 3D pour surmonter les limites des méthodes actuelles en permettant une exploration interactive et généralisable au-delà des scènes de table, surpassant ainsi les approches basées uniquement sur les modèles vision-langage.

Yixuan Wang, Leonor Fermoselle, Tarik Kelestemur, Jiuguang Wang, Yunzhu LiWed, 11 Ma🤖 cs.LG

Molecular Fingerprints Are Strong Models for Peptide Function Prediction

Cette étude démontre que des empreintes moléculaires simples et interprétables, combinées à des modèles d'apprentissage automatique légers, surpassent les approches complexes basées sur les graphes et les transformateurs pour la prédiction des propriétés des peptides, remettant ainsi en question la nécessité de modéliser les interactions à longue portée.

Jakub Adamczyk, Piotr Ludynia, Wojciech CzechWed, 11 Ma🤖 cs.LG