A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

Cet article propose une méthode de programmation quadratique séquentielle stochastique à région de confiance et points intérieurs (TR-IP-SSQP) pour résoudre des problèmes d'optimisation avec une fonction objectif stochastique et des contraintes non linéaires déterministes, en établissant sa convergence globale presque sûre et en validant ses performances pratiques sur des benchmarks et des problèmes de régression logistique.

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad LavaeiThu, 12 Ma🔢 math

On The Complexity of Best-Arm Identification in Non-Stationary Linear Bandits

Cet article résout le problème d'identification du meilleur bras dans des bandits linéaires non stationnaires en établissant une borne inférieure dépendante de l'ensemble des bras et en proposant l'algorithme Adjacent-BAI\textsf{Adjacent-BAI}, basé sur une conception optimale adjacente, qui atteint cette borne et affine ainsi la complexité de l'apprentissage au-delà des résultats minimax pessimistes.

Leo Maynard-Zhang, Zhihan Xiong, Kevin Jamieson, Maryam FazelThu, 12 Ma📊 stat

Adaptive Active Learning for Regression via Reinforcement Learning

Cet article propose WiGS, une méthode d'apprentissage actif pour la régression qui utilise l'apprentissage par renforcement pour adapter dynamiquement le compromis entre exploration et exploitation, surpassant ainsi les approches existantes en précision et en efficacité d'étiquetage, notamment dans les régions à densité de données irrégulière.

Simon D. Nguyen, Troy Russo, Kentaro Hoffman, Tyler H. McCormickThu, 12 Ma📊 stat

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Cette étude compare l'estimation d'incertitude par Dropout de Monte Carlo et la prédiction conforme sur des réseaux de neurones convolutifs entraînés sur Fashion-MNIST, révélant que si le VGG16 est plus précis, le GoogLeNet offre une meilleure calibration et que la prédiction conforme garantit des ensembles de prédictions statistiquement valides pour des décisions à haut risque.

Sanne Ruijs, Alina Kosiakova, Farrukh JavedThu, 12 Ma📊 stat

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

Cet article présente un cadre de prédiction sélective pour la récupération de structures moléculaires à partir de spectres de masse, démontrant que l'utilisation de mesures de confiance simples et d'incertitudes aléatoires au niveau de la récupération permet d'abstenir les prédictions incertaines et de garantir des taux d'erreur contrôlés dans des applications à haut risque.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem WaegemanThu, 12 Ma📊 stat

Bayesian Optimization with Gaussian Processes to Accelerate Stationary Point Searches

Cet article présente un cadre unifié d'optimisation bayésienne utilisant des processus gaussiens pour accélérer la recherche de points stationnaires sur les surfaces d'énergie potentielle, en intégrant des extensions innovantes et un code pédagogique en Rust pour améliorer l'efficacité et la précision des calculs.

Rohit Goswami (Institute IMX and Lab-COSMO, École polytechnique fédérale de Lausanne)Thu, 12 Ma📊 stat

Expert-Aided Causal Discovery of Ancestral Graphs

Cet article présente Ancestral GFlowNet (AGFN), un algorithme d'apprentissage par renforcement qui permet d'inférer la distribution des graphes ancestraux en intégrant de manière itérative des connaissances d'experts incertaines, tant a priori qu'a posteriori, pour affiner la découverte causale en présence de confondants latents.

Tiago da Silva, Bruna Bazaluk, Eliezer de Souza da Silva, António Góis, Salem Lahlou, Dominik Heider, Samuel Kaski, Diego Mesquita, Adèle Helena RibeiroMon, 09 Ma🤖 cs.LG

Predictive Coding Networks and Inference Learning: Tutorial and Survey

Ce travail présente une revue complète et une spécification formelle des réseaux de codage prédictif, un cadre inspiré des neurosciences qui utilise l'apprentissage par inférence comme alternative biologiquement plausible et potentiellement plus efficace à la rétropropagation, tout en offrant une approche unifiée pour l'apprentissage supervisé et génératif.

Björn van Zwol, Ro Jefferson, Egon L. van den BroekMon, 09 Ma🤖 cs.AI

L0-Regularized Quadratic Surface Support Vector Machines

Cet article propose des variantes parcimonieuses des machines à vecteurs de support sur des surfaces quadratiques (QSVM) en imposant une contrainte de cardinalité via la norme 0\ell_0, et développe un algorithme de décomposition de pénalité efficace pour résoudre ce problème d'optimisation complexe tout en démontrant la supériorité du modèle sur des données de crédit réelles.

Ahmad Mousavi, Ramin Zandvakili, Zheming GaoMon, 09 Ma🤖 cs.LG