stat.ML articles | Gist.Science

The Role of Feature Interactions in Graph-based Tabular Deep Learning

En analysant des ensembles de données synthétiques, cette étude révèle que les méthodes d'apprentissage profond tabulaire basées sur des graphes échouent à reconstruire correctement les interactions entre caractéristiques, ce qui démontre que prioriser la modélisation précise de la structure du graphe est essentiel pour améliorer la précision prédictive.

Elias Dubbeldam, Reza Mohammadi, Marit Schoonhoven, S. Ilker BirbilTue, 10 Ma🤖 cs.LG

Wasserstein Gradient Flows for Scalable and Regularized Barycenter Computation

Cet article propose une nouvelle méthode d'échelle pour le calcul de barycentres de Wasserstein régularisés, basée sur des flots de gradient et l'optimisation par mini-lots, qui intègre efficacement des informations supervisées et établit un nouvel état de l'art sur des benchmarks variés.

Eduardo Fernandes Montesuma, Yassir Bendou, Mike GartrellTue, 10 Ma🤖 cs.LG

Bayesian neural networks with interpretable priors from Mercer kernels

Cet article présente une nouvelle classe de priors, appelés priors de Mercer, pour les réseaux de neurones bayésiens, qui permettent de définir des distributions sur les paramètres du réseau à partir de la représentation de Mercer d'un noyau de covariance afin que les échantillons du réseau approximent ceux d'un processus gaussien spécifié, combinant ainsi l'interprétabilité des processus gaussiens avec l'évolutivité des réseaux de neurones.

Alex Alberts, Ilias BilionisTue, 10 Ma🤖 cs.LG

Shortcut Invariance: Targeted Jacobian Regularization in Disentangled Latent Space

Cet article propose une méthode de régularisation ciblée dans l'espace latent, qui améliore la généralisation hors distribution en injectant du bruit anisotrope pour aplatir les frontières de décision le long des axes de raccourcis sans nécessiter d'étiquettes explicites ni d'exemples contradictoires.

Shivam Pal, Sakshi Varshney, Piyush RaiTue, 10 Ma🤖 cs.LG

Beyond Additivity: Sparse Isotonic Shapley Regression toward Nonlinear Explainability

Cet article présente la Régression Isotonique Shapley Sparse (SISR), un cadre unifié d'explication non linéaire qui apprend simultanément une transformation monotone pour restaurer l'additivité et impose une contrainte de parcimonie pour identifier efficacement les caractéristiques pertinentes, surmontant ainsi les limitations des valeurs de Shapley canoniques face aux dépendances entre variables et aux distributions non gaussiennes.

Jialai SheTue, 10 Ma🤖 cs.LG

Topological Spatial Graph Coarsening

Cet article propose une méthode sans paramètre pour la coarsening de graphes spatiaux qui réduit leur taille en repliant les arêtes courtes tout en préservant leurs caractéristiques topologiques grâce à une nouvelle filtration adaptée aux diagrammes de persistance.

Anna Calissano, Etienne LasalleTue, 10 Ma🤖 cs.LG

Sparse Offline Reinforcement Learning with Corruption Robustness

Ce papier propose des méthodes actor-critic avec des oracles d'estimation robustes et clairsemés pour obtenir les premières garanties non triviales d'apprentissage d'une politique quasi optimale dans des processus de décision markoviens haute dimension et clairsemés, même en présence de corruption forte des données et d'une couverture limitée à une seule politique.

Nam Phuong Tran, Andi Nika, Goran Radanovic, Long Tran-Thanh, Debmalya MandalTue, 10 Ma🤖 cs.LG

From Mice to Trains: Amortized Bayesian Inference on Graph Data

Cet article propose une méthode d'inférence bayésienne amortie adaptée aux données graphiques, combinant des encodeurs invariants par permutation et des estimateurs de posterior neuronaux pour effectuer une inférence rapide et sans vraisemblance sur des paramètres de nœuds, d'arêtes et de graphes dans des domaines variés allant de la biologie à la logistique.

Svenja Jedhoff, Elizaveta Semenova, Aura Raulo, Anne Meyer, Paul-Christian BürknerTue, 10 Ma🤖 cs.LG

Scalable multitask Gaussian processes for complex mechanical systems with functional covariates

Cet article propose un modèle de processus gaussien multitâche évolutif, doté d'une structure de noyau séparable et d'une quantification d'incertitude, capable de traiter efficacement des covariables fonctionnelles et des tâches corrélées pour des systèmes mécaniques complexes, comme démontré par son application à une assemblage riveté nécessitant peu d'échantillons pour des prédictions précises.

Razak Christophe Sabi Gninkou (UPHF, INSA Hauts-De-France, CERAMATHS), Andrés F. López-Lopera (IMAG, LEMON, UM), Franck Massa (LAMIH, INSA Hauts-De-France, UPHF), Rodolphe Le Riche (LIMOS, UCA [2017-2020], ENSM ST-ETIENNE, CNRS)Tue, 10 Ma🔢 math

The Partition Principle Revisited: Non-Equal Volume Designs Achieve Minimal Expected Star Discrepancy

Cet article établit que des partitions de volumes inégaux permettent de générer des ensembles de points par échantillonnage stratifié dont la discrépance étoile attendue est inférieure à celle de l'échantillonnage jittered classique, tout en fournissant de nouvelles bornes supérieures explicites qui renforcent la base théorique de l'intégration numérique en haute dimension.

Xiaoda XuTue, 10 Ma🤖 cs.LG

Khatri-Rao Clustering for Data Summarization

Cet article propose une nouvelle approche de clustering, dite « Khatri-Rao », qui améliore la concision des résumés de données sans sacrifier leur précision en modélisant les centroïdes comme des interactions de protocentroïdes, et démontre son efficacité supérieure sur les algorithmes k-Means et le clustering profond.

Martino Ciaperoni, Collin Leiber, Aristides Gionis, Heikki MannilaTue, 10 Ma🤖 cs.LG

Latent Autoencoder Ensemble Kalman Filter for Data assimilation

Cet article propose le LAE-EnKF, une méthode d'assimilation de données qui améliore la précision et la stabilité des systèmes dynamiques non linéaires en reformulant le problème dans un espace latent appris où les évolutions sont linéaires et stables, tout en maintenant un coût computationnel comparable à celui du filtre de Kalman par ensemble standard.

Xin T. Tong, Yanyan Wang, Liang YanTue, 10 Ma🤖 cs.LG

NEST: Network- and Memory-Aware Device Placement For Distributed Deep Learning

Le papier présente NEST, un cadre de placement de dispositifs pour l'apprentissage profond distribué qui unifie la modélisation du parallélisme, de la mémoire et de la topologie réseau via une programmation dynamique structurée, permettant d'optimiser conjointement la latence, la viabilité mémoire et le débit jusqu'à 2,43 fois supérieur aux méthodes de l'état de l'art.

Irene Wang, Vishnu Varma Venkata, Arvind Krishnamurthy, Divya MahajanTue, 10 Ma🤖 cs.LG

CREDO: Epistemic-Aware Conformalized Credal Envelopes for Regression

Le papier présente CREDO, une méthode innovante qui combine des enveloppes crédales interprétables pour capturer l'incertitude épistémique avec une calibration conforme pour garantir une couverture marginale, produisant ainsi des intervalles de prédiction en régression à la fois valides et adaptatifs.

Luben M. C. Cabezas, Sabina J. Sloman, Bruno M. Resende, Fanyi Wu, Michele Caprio, Rafael IzbickiTue, 10 Ma🤖 cs.LG

Bilateral Trade Under Heavy-Tailed Valuations: Minimax Regret with Infinite Variance

Cet article établit le taux de regret minimax optimal pour le commerce bilatéral contextuel avec des valorisations à variance infinie, en démontrant qu'un algorithme basé sur l'estimation de moyenne tronquée atteint ce taux en interpolant entre les régimes de moments finis et infinis.

Hangyi ZhaoTue, 10 Ma🤖 cs.LG

Kernel Methods for Some Transport Equations with Application to Learning Kernels for the Approximation of Koopman Eigenfunctions: A Unified Approach via Variational Methods, Green's Functions and the Method of Characteristics

Cet article présente un cadre unifié combinant des principes variationnels, des fonctions de Green et la méthode des caractéristiques pour construire des noyaux d'apprentissage adaptés aux équations de transport, permettant ainsi l'approximation précise et robuste des fonctions propres de l'opérateur de Koopman via une optimisation convexe sans maillage.

Boumediene Hamzi, Houman Owhadi, Umesh VaidyaTue, 10 Ma🔢 math

Fairness May Backfire: When Leveling-Down Occurs in Fair Machine Learning

Ce papier démontre que, contrairement au cadre de décision attribut-conscient où la justice algorithmique améliore systématiquement les résultats du groupe défavorisé, le cadre attribut-aveugle peut entraîner un « nivellement par le bas » préjudiciable à tous les groupes selon la distribution des données.

Yi Yang, Xiangyu Chang, Pei-yu ChenTue, 10 Ma🤖 cs.LG

Post-Training with Policy Gradients: Optimality and the Base Model Barrier

Cet article démontre que l'entraînement par renforcement avec des récompenses de processus permet de surmonter la barrière de support du modèle de base et d'éviter la malédiction de la dimensionnalité, contrairement aux récompenses de résultats qui peuvent nécessiter un nombre exponentiel de requêtes pour dépasser le support initial.

Alireza Mousavi-Hosseini, Murat A. ErdogduTue, 10 Ma🤖 cs.LG

Masked Unfairness: Hiding Causality within Zero ATE

Cet article démontre que la régulation de l'équité basée uniquement sur l'absence d'effet moyen de traitement (ATE) peut masquer des inégalités causales significatives via un problème d'optimisation linéaire, soulignant la nécessité de passer d'une régulation au niveau des décisions à une régulation au niveau des modèles pour détecter ces biais cachés.

Zou Yang, Sophia Xiao, Bijan MazaheriTue, 10 Ma🤖 cs.LG

Combinatorial Allocation Bandits with Nonlinear Arm Utility

Cet article propose un nouveau problème d'apprentissage en ligne appelé « Combinatorial Allocation Bandits » (CAB) pour les plateformes de mise en correspondance, qui vise à maximiser la satisfaction globale des utilisateurs plutôt que le simple nombre de correspondances, en développant et en évaluant des algorithmes basés sur la borne de confiance supérieure et l'échantillonnage de Thompson.

Yuki Shibukawa, Koichi Tanaka, Yuta Saito, Shinji ItoTue, 10 Ma🤖 cs.LG

← Précédent Suivant →