stat.ML articles | Gist.Science

SurvHTE-Bench: A Benchmark for Heterogeneous Treatment Effect Estimation in Survival Analysis

Ce papier présente SurvHTE-Bench, le premier benchmark complet pour l'estimation des effets de traitement hétérogènes sur des données de survie censurées, offrant une suite de données synthétiques, semi-synthétiques et réelles permettant une évaluation rigoureuse et reproductible des méthodes causales dans ce domaine.

Shahriar Noroozizadeh, Xiaobin Shen, Jeremy C. Weiss + 1 more2026-03-06🤖 cs.AI

Sample-Optimal Locally Private Hypothesis Selection and the Provable Benefits of Interactivity

Les auteurs proposent un algorithme de sélection d'hypothèses sous confidentialité différentielle locale qui, grâce à une interaction limitée, atteint une complexité en échantillons optimale de $\Theta(k)$ , brisant ainsi la barrière de $\Omega(k \log k)$ imposée aux méthodes non interactives.

Alireza F. Pour, Hassan Ashtiani, Shahab Asoodeh2026-03-05🤖 cs.LG

List Sample Compression and Uniform Convergence

Cet article démontre que, bien que l'uniforme convergence reste équivalente à l'apprenabilité dans le cadre de l'apprentissage par listes, la conjecture de compression d'échantillon de Littlestone et Warmuth échoue, car il existe des classes apprenables par listes qui ne peuvent pas être compressées, même avec des listes de reconstruction arbitrairement grandes.

Steve Hanneke, Shay Moran, Tom Waknine2026-03-05🤖 cs.LG

Tracking solutions of time-varying variational inequalities

Cet article étend les garanties de suivi des solutions d'inéquations variationnelles dépendantes du temps à des cas non monotones et périodiques, tout en démontrant que les systèmes dynamiques discrets associés peuvent soit converger soit présenter un comportement chaotique.

Hédi Hadiji, Sarah Sachs, Cristóbal Guzmán2026-03-05🤖 cs.LG

AuToMATo: An Out-Of-The-Box Persistence-Based Clustering Algorithm

Ce papier présente AuToMATo, un algorithme de clustering basé sur l'homologie persistante qui, grâce à des paramètres par défaut robustes et une procédure de bootstrapping, offre une solution « prête à l'emploi » surpassant souvent les meilleurs réglages d'autres méthodes et s'intégrant parfaitement à l'écosystème scikit-learn et à l'analyse de données topologiques.

Marius Huber, Sara Kalisnik, Patrick Schnider2026-03-05🤖 cs.LG

Low-Rank Contextual Reinforcement Learning from Heterogeneous Human Feedback

Ce papier propose le cadre LoCo-RLHF, qui intègre des informations contextuelles via une structure de faible rang et une politique pessimiste dans un sous-espace réduit pour surmonter l'hétérogénéité des retours humains et les décalages de distribution dans l'apprentissage par renforcement à partir de feedback humain.

Seong Jin Lee, Will Wei Sun, Yufeng Liu2026-03-05🤖 cs.LG

DCENWCNet: A Deep CNN Ensemble Network for White Blood Cell Classification with LIME-Based Explainability

Cet article propose le DCENWCNet, un réseau d'ensemble de CNN innovant combinant trois architectures pour améliorer la classification des globules blancs avec une précision supérieure et une interprétabilité accrue grâce à la méthode LIME.

Sibasish Dhibar2026-03-05🤖 cs.AI

Scalable physics-informed deep generative model for solving forward and inverse stochastic differential equations

Cet article présente le sPI-GeM, un modèle génératif profond physique-informé scalable capable de résoudre avec précision des équations différentielles stochastiques dans des espaces stochastiques et spatiaux de haute dimension.

Shaoqian Zhou, Wen You, Ling Guo + 1 more2026-03-05🔬 physics

Optimal Best-Arm Identification under Fixed Confidence with Multiple Optima

Cet article propose une borne inférieure informationnelle plus serrée et un algorithme modifié de type Track-and-Stop qui, en exploitant la connaissance préalable du nombre de bras optimaux, garantissent une identification asymptotiquement optimale dans le cadre de l'identification de bras sous confiance fixe.

Lan V. Truong2026-03-05🤖 cs.LG

Convergence, Sticking and Escape: Stochastic Dynamics Near Critical Points in SGD

Cet article analyse les propriétés de convergence et les dynamiques d'échappement de la descente de gradient stochastique dans des paysages unidimensionnels, en démontrant comment les caractéristiques du bruit et la géométrie du paysage influencent les échelles de temps de convergence vers les minima locaux et les probabilités d'échappement des maxima locaux.

Dmitry Dudukalov, Artem Logachov, Vladimir Lotov + 3 more2026-03-05🤖 cs.LG

A Copula Based Supervised Filter for Feature Selection in Diabetes Risk Prediction Using Machine Learning

Cet article propose un filtre supervisé efficace basé sur le score de concordance de queue supérieure (lambda U) d'une copule de Gumbel pour la sélection de caractéristiques dans la prédiction du risque de diabète, démontrant sa capacité à identifier des prédicteurs cliniquement pertinents et à réduire la dimensionnalité des données tout en maintenant des performances compétitives par rapport aux méthodes standards sur des ensembles de données publics et cliniques.

Agnideep Aich, Md Monzur Murshed, Sameera Hewage + 1 more2026-03-05🤖 cs.LG

Boosting In-Context Learning in LLMs Through the Lens of Classical Supervised Learning

Cet article propose la « Supervised Calibration », un cadre unificateur basé sur la minimisation de la perte qui améliore l'apprentissage en contexte des grands modèles de langage en apprenant des transformations affines optimales pour corriger les biais et réorienter les frontières de décision, surpassant ainsi les méthodes de calibration existantes sur plusieurs modèles et jeux de données.

Korel Gundem, Juncheng Dong, Dennis Zhang + 2 more2026-03-05🤖 cs.AI

Honesty in Causal Forests: When It Helps and When It Hurts

Cet article démontre que l'estimation honnête dans les forêts causales, bien qu'utile pour éviter le surajustement, peut nuire à la précision des effets de traitement individuels en favorisant le sous-ajustement, et recommande donc d'adapter son utilisation aux objectifs spécifiques plutôt que de l'appliquer systématiquement.

Yanfang Hou, Carlos Fernández-Loría2026-03-05🤖 cs.LG

Federated ADMM from Bayesian Duality

Les auteurs proposent une nouvelle approche bayésienne qui généralise l'ADMM fédéré en exploitant une structure de dualité des objectifs variationnels, permettant de retrouver les mises à jour classiques et d'obtenir des variantes novatrices (de type Newton ou Adam) offrant des gains de performance significatifs.

Thomas Möllenhoff, Siddharth Swaroop, Finale Doshi-Velez + 1 more2026-03-05🤖 cs.LG

Finite-Dimensional Gaussian Approximation for Deep Neural Networks: Universality in Random Weights

Cet article établit des bornes d'approximation gaussienne pour les distributions finies de réseaux de neurones profonds à poids aléatoires, démontrant une convergence vers la limite gaussienne avec des taux explicites lorsque les largeurs des couches tendent vers l'infini.

Krishnakumar Balasubramanian, Nathan Ross2026-03-05🤖 cs.LG

Best-of- $\infty$ -- Asymptotic Performance of Test-Time LLM Ensembling

Cet article propose une méthode d'inférence adaptative pour l'ensemblage de grands modèles de langage par vote majoritaire, qui étend l'analyse asymptotique du « meilleur parmi N » à l'infini et optimise les pondérations d'ensembles hétérogènes via un programme linéaire en nombres entiers pour maximiser les performances avec un budget de calcul limité.

Junpei Komiyama, Daisuke Oba, Masafumi Oyamada2026-03-05🤖 cs.AI

Learning in an Echo Chamber: Online Learning with Replay Adversary

Cet article introduit un cadre théorique pour l'apprentissage en ligne face à un adversaire de relecture, démontrant que la dimension de seuil étendue caractérise exactement la possibilité d'apprentissage et prouvant que ce scénario est strictement plus difficile que l'apprentissage classique, en particulier pour l'apprentissage propre.

Daniil Dmitriev, Harald Eskelund Franck, Carolin Heinzler + 1 more2026-03-05🤖 cs.LG

Buzz, Choose, Forget: A Meta-Bandit Framework for Bee-Like Decision Making

Cette étude présente MAYA, un modèle d'apprentissage par imitation séquentiel basé sur les bandits manchots qui reproduit avec succès les décisions de butinage des abeilles en tenant compte de leur mémoire limitée, surpassant ainsi les modèles existants tout en offrant une interprétabilité précieuse pour les applications écologiques.

Emmanuelle Claeys, Elena Kerjean, Jean-Michel Loubes2026-03-05🤖 cs.LG

Implicit Bias of Per-sample Adam on Separable Data: Departure from the Full-batch Regime

Cet article démontre que l'induction implicite de l'algorithme Adam en mode par échantillon sur des données séparables peut s'écarter de son comportement en lot complet pour converger vers un classifieur à marge maximale $\ell_2$ , contrairement à la tendance $\ell_\infty$ observée dans le régime par lot complet, tandis que l'optimiseur Signum conserve une convergence invariante vers la marge $\ell_\infty$ quelle que soit la taille du lot.

Beomhan Baek, Minhak Song, Chulhee Yun2026-03-05🤖 cs.AI

Implicit Bias of the JKO Scheme

Cet article caractérise le biais implicite du schéma JKO au second ordre en montrant qu'il équivaut à un flot de gradient de Wasserstein sur une énergie modifiée qui inclut un terme de courbure métrique, expliquant ainsi des biais connus tels que l'information de Fisher pour l'entropie.

Peter Halmos, Boris Hanin2026-03-05🤖 cs.AI

← Précédent Suivant →

stat.ML