stat.ML articles | Gist.Science

Randomized Kriging Believer for Parallel Bayesian Optimization with Regret Bounds

Cet article propose une méthode d'optimisation bayésienne parallèle appelée « Randomized Kriging Believer », qui combine une faible complexité computationnelle et une grande flexibilité pratique avec des garanties théoriques de regret bayésien pour l'optimisation de fonctions coûteuses évaluables en parallèle.

Shuhei Sugiura, Ichiro Takeuchi, Shion TakenoFri, 13 Ma📊 stat

Partition-Based Functional Ridge Regression for High-Dimensional Data

Cet article propose un cadre de régression ridge fonctionnelle basé sur une partition pour traiter la multicolinéarité et le surajustement dans les modèles linéaires fonctionnels de haute dimension, en décomposant les effets fonctionnels pour appliquer une pénalisation différentielle qui améliore la stabilité numérique et l'interprétabilité sans recourir à une sélection explicite de variables.

Shaista Ashraf, Ismail Shah, Farrukh JavedFri, 13 Ma📊 stat

Co-Diffusion: An Affinity-Aware Two-Stage Latent Diffusion Framework for Generalizable Drug-Target Affinity Prediction

Ce papier présente Co-Diffusion, un cadre novateur à deux étapes basé sur la diffusion latente qui améliore la prédiction de l'affinité médicament-cible et la généralisation en régime de démarrage à froid en alignant les représentations et en régularisant le processus par un débruitage stochastique.

Yining Qian, Pengjie Wang, Yixiao Li, An-Yang Lu, Cheng Tan, Shuang Li, Lijun LiuFri, 13 Ma📊 stat

Efficient Approximation to Analytic and $L^p$ functions by Height-Augmented ReLU Networks

Ce papier démontre qu'une architecture de réseau de neurones à trois dimensions utilisant des fonctions d'activation ReLU augmentées en hauteur permet d'atteindre des taux d'approximation exponentiels améliorés pour les fonctions analytiques et une approximation quantitative non asymptotique d'ordre élevé pour les fonctions $L^p$ , offrant ainsi une voie théorique pour concevoir des réseaux plus économes en paramètres.

ZeYu Li, FengLei Fan, TieYong ZengFri, 13 Ma📊 stat

Deep regression learning from dependent observations with minimum error entropy principle

Cet article propose une approche de régression non paramétrique basée sur des réseaux de neurones profonds et le principe de l'entropie minimale de l'erreur pour des observations fortement dépendantes, démontrant que les estimateurs pénalisés et non pénalisés atteignent des taux de convergence minimax optimaux.

William Kengne, Modou WadeFri, 13 Ma📊 stat

Algorithmic Capture, Computational Complexity, and Inductive Bias of Infinite Transformers

Ce papier définit formellement la capture algorithmique et démontre que les transformateurs infinis, bien que universellement expressifs, possèdent un biais inductif les limitant à l'apprentissage d'algorithmes de faible complexité au sein de la classe EPTHS, empêchant ainsi la généralisation à des tâches plus complexes.

Orit Davidovich, Zohar RingelFri, 13 Ma🤖 cs.LG

Trustworthy predictive distributions for rare events via diagnostic transport maps

Cet article propose l'utilisation de cartes de transport diagnostiques pour recalibrer des distributions prédictives de base et fournir des diagnostics locaux en temps réel, améliorant ainsi la fiabilité des prévisions d'événements rares comme l'intensification rapide des cyclones tropicaux.

Elizabeth Cucuzzella, Rafael Izbicki, Ann B. LeeFri, 13 Ma📊 stat

RIE-Greedy: Regularization-Induced Exploration for Contextual Bandits

Ce papier propose RIE-Greedy, une stratégie de sélection d'actions purement gourmande qui exploite la stochasticité inhérente au processus d'ajustement des modèles régularisés pour induire une exploration efficace, offrant une alternative théoriquement équivalente à l'échantillonnage de Thompson et empiriquement supérieure aux méthodes de référence dans les environnements à grande échelle.

Tong Li, Thiago de Queiroz Casanova, Eric M. Schwartz, Victor Kostyuk, Dehan Kong, Joseph J. WilliamsFri, 13 Ma📊 stat

Outrigger local polynomial regression

Cet article présente l'estimateur « outrigger » par régression polynomiale locale, une méthode adaptative qui modifie l'estimation standard en intégrant la fonction de score conditionnelle des erreurs pour atteindre l'optimalité minimax sur les classes de Hölder sans hypothèses restrictives sur la distribution des erreurs ou l'indépendance des covariables.

Elliot H. Young, Rajen D. Shah, Richard J. SamworthFri, 13 Ma📊 stat

Worst-case low-rank approximations

Cet article présente le cadre unifié wcPCA pour l'approximation de rang faible, qui garantit des performances optimales dans le pire des cas sur des domaines hétérogènes en étendant cette approche à d'autres objectifs et à la complétion de matrices, tout en démontrant son efficacité supérieure sur des données réelles.

Anya Fries, Markus Reichstein, David Blei, Jonas PetersFri, 13 Ma📊 stat

On the Robustness of Langevin Dynamics to Score Function Error

Ce papier démontre que, contrairement aux modèles de diffusion, la dynamique de Langevin n'est pas robuste aux erreurs d'estimation de la fonction de score, produisant même pour des distributions simples en haute dimension des échantillons très éloignés de la distribution cible en distance de variation totale, quelle que soit la petitesse de l'erreur.

Daniel Yiming Cao, August Y. Chen, Karthik Sridharan, Yuchen WuFri, 13 Ma🤖 cs.LG

Spatially Robust Inference with Predicted and Missing at Random Labels

Cet article propose un estimateur doublement robuste corrigé par une méthode jackknife HAC pour assurer une inférence spatiale valide et des intervalles de confiance fiables dans des scénarios de données manquantes au hasard et de dépendance spatiale, où les méthodes traditionnelles échouent en raison de la corrélation induite par le cross-fitting.

Stephen Salerno, Zhenke Wu, Tyler McCormickFri, 13 Ma📈 econ

Decomposing Observational Multiplicity in Decision Trees: Leaf and Structural Regret

Cet article propose un cadre théorique décomposant la multiplicité observationnelle dans les arbres de décision en deux composantes, le regret de feuille et le regret structurel, démontrant que ce dernier est le principal facteur de variabilité et qu'il peut être exploité pour améliorer la sécurité des prédictions via un mécanisme d'abstention.

Mustafa CavusFri, 13 Ma📊 stat

Exploiting Expertise of Non-Expert and Diverse Agents in Social Bandit Learning: A Free Energy Approach

Cet article propose un algorithme d'apprentissage par bandit social fondé sur l'énergie libre qui permet à un agent d'identifier et d'exploiter efficacement les compétences d'agents non experts et diversifiés sans connaissance de leurs récompenses, garantissant ainsi une convergence théorique vers la politique optimale et une amélioration significative des performances d'apprentissage individuel.

Erfan Mirzaei, Seyed Pooya Shariatpanahi, Alireza Tavakoli, Reshad Hosseini, Majid Nili AhmadabadiFri, 13 Ma📊 stat

A Further Efficient Algorithm with Best-of-Both-Worlds Guarantees for $m$ -Set Semi-Bandit Problem

Cet article démontre que la politique Follow-the-Perturbed-Leader (FTPL) couplée à un échantillonnage géométrique conditionnel résout le problème des semi-bandes à $m$ -ensembles avec une complexité réduite et des garanties de regret optimales dans les deux régimes, adversaire et stochastique.

Botao Chen, Jongyeong Lee, Chansoo Kim, Junya HondaFri, 13 Ma📊 stat

Language Generation with Replay: A Learning-Theoretic View of Model Collapse

Cet article propose une analyse théorique de l'effondrement des modèles en génération de langage, démontrant qu'un adversaire de réutilisation des sorties passées limite fondamentalement l'apprentissage dans certains cadres théoriques tout en validant ou en mettant en échec les stratégies pratiques courantes comme le nettoyage des données et le filigrane.

Giorgio Racca, Michal Valko, Amartya SanyalFri, 13 Ma📊 stat

Hypercomplex Widely Linear Processing: Fundamentals for Quaternion Machine Learning

Ce chapitre établit les fondements de l'apprentissage automatique quaternionien en présentant les statistiques augmentées, les modèles largement linéaires, le calcul quaternionique et l'estimation par erreur quadratique moyenne pour exploiter le potentiel des rotations 3D dans ce domaine émergent.

Sayed Pouria Talebi, Clive Cheong TookFri, 13 Ma📊 stat

Data Fusion with Distributional Equivalence Test-then-pool

Cet article propose un nouveau cadre de test-then-pool pour la fusion de données d'essais cliniques, qui utilise le test d'équivalence et la divergence maximale de moyenne (MMD) pour emprunter des données de contrôle historiques tout en garantissant un contrôle rigoureux du taux d'erreur de type I et une puissance accrue par rapport aux méthodes standard.

Linying Yang, Xing Liu, Robin J. EvansFri, 13 Ma📊 stat

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

Ce papier présente EnTransformer, un cadre de prévision génératif profond qui combine l'engression et les Transformers pour produire des prévisions probabilistes multivariées bien calibrées et cohérentes, surpassant les modèles de référence sur plusieurs benchmarks sans imposer d'hypothèses paramétriques restrictives.

Rajdeep Pathak, Rahul Goswami, Madhurima Panja, Palash Ghosh, Tanujit ChakrabortyFri, 13 Ma📊 stat

Uncovering Locally Low-dimensional Structure in Networks by Locally Optimal Spectral Embedding

Cet article propose l'Embedding Spectral Adjacency Local (LASE), une méthode qui révèle la structure localement de faible dimension des réseaux en surmontant les limites des hypothèses globales de l'ASE grâce à une décomposition spectrale pondérée, offrant ainsi de meilleures performances de reconstruction et de visualisation.

Hannah Sansford, Nick Whiteley, Patrick Rubin-DelanchyFri, 13 Ma📊 stat

← Précédent Suivant →

stat.ML