Partition-Based Functional Ridge Regression for High-Dimensional Data

Cet article propose un cadre de régression ridge fonctionnelle basé sur une partition pour traiter la multicolinéarité et le surajustement dans les modèles linéaires fonctionnels de haute dimension, en décomposant les effets fonctionnels pour appliquer une pénalisation différentielle qui améliore la stabilité numérique et l'interprétabilité sans recourir à une sélection explicite de variables.

Shaista Ashraf, Ismail Shah, Farrukh JavedFri, 13 Ma📊 stat

Co-Diffusion: An Affinity-Aware Two-Stage Latent Diffusion Framework for Generalizable Drug-Target Affinity Prediction

Ce papier présente Co-Diffusion, un cadre novateur à deux étapes basé sur la diffusion latente qui améliore la prédiction de l'affinité médicament-cible et la généralisation en régime de démarrage à froid en alignant les représentations et en régularisant le processus par un débruitage stochastique.

Yining Qian, Pengjie Wang, Yixiao Li, An-Yang Lu, Cheng Tan, Shuang Li, Lijun LiuFri, 13 Ma📊 stat

Efficient Approximation to Analytic and LpL^p functions by Height-Augmented ReLU Networks

Ce papier démontre qu'une architecture de réseau de neurones à trois dimensions utilisant des fonctions d'activation ReLU augmentées en hauteur permet d'atteindre des taux d'approximation exponentiels améliorés pour les fonctions analytiques et une approximation quantitative non asymptotique d'ordre élevé pour les fonctions LpL^p, offrant ainsi une voie théorique pour concevoir des réseaux plus économes en paramètres.

ZeYu Li, FengLei Fan, TieYong ZengFri, 13 Ma📊 stat

RIE-Greedy: Regularization-Induced Exploration for Contextual Bandits

Ce papier propose RIE-Greedy, une stratégie de sélection d'actions purement gourmande qui exploite la stochasticité inhérente au processus d'ajustement des modèles régularisés pour induire une exploration efficace, offrant une alternative théoriquement équivalente à l'échantillonnage de Thompson et empiriquement supérieure aux méthodes de référence dans les environnements à grande échelle.

Tong Li, Thiago de Queiroz Casanova, Eric M. Schwartz, Victor Kostyuk, Dehan Kong, Joseph J. WilliamsFri, 13 Ma📊 stat

On the Robustness of Langevin Dynamics to Score Function Error

Ce papier démontre que, contrairement aux modèles de diffusion, la dynamique de Langevin n'est pas robuste aux erreurs d'estimation de la fonction de score, produisant même pour des distributions simples en haute dimension des échantillons très éloignés de la distribution cible en distance de variation totale, quelle que soit la petitesse de l'erreur.

Daniel Yiming Cao, August Y. Chen, Karthik Sridharan, Yuchen WuFri, 13 Ma🤖 cs.LG

Exploiting Expertise of Non-Expert and Diverse Agents in Social Bandit Learning: A Free Energy Approach

Cet article propose un algorithme d'apprentissage par bandit social fondé sur l'énergie libre qui permet à un agent d'identifier et d'exploiter efficacement les compétences d'agents non experts et diversifiés sans connaissance de leurs récompenses, garantissant ainsi une convergence théorique vers la politique optimale et une amélioration significative des performances d'apprentissage individuel.

Erfan Mirzaei, Seyed Pooya Shariatpanahi, Alireza Tavakoli, Reshad Hosseini, Majid Nili AhmadabadiFri, 13 Ma📊 stat

Language Generation with Replay: A Learning-Theoretic View of Model Collapse

Cet article propose une analyse théorique de l'effondrement des modèles en génération de langage, démontrant qu'un adversaire de réutilisation des sorties passées limite fondamentalement l'apprentissage dans certains cadres théoriques tout en validant ou en mettant en échec les stratégies pratiques courantes comme le nettoyage des données et le filigrane.

Giorgio Racca, Michal Valko, Amartya SanyalFri, 13 Ma📊 stat

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

Ce papier présente EnTransformer, un cadre de prévision génératif profond qui combine l'engression et les Transformers pour produire des prévisions probabilistes multivariées bien calibrées et cohérentes, surpassant les modèles de référence sur plusieurs benchmarks sans imposer d'hypothèses paramétriques restrictives.

Rajdeep Pathak, Rahul Goswami, Madhurima Panja, Palash Ghosh, Tanujit ChakrabortyFri, 13 Ma📊 stat

Uncovering Locally Low-dimensional Structure in Networks by Locally Optimal Spectral Embedding

Cet article propose l'Embedding Spectral Adjacency Local (LASE), une méthode qui révèle la structure localement de faible dimension des réseaux en surmontant les limites des hypothèses globales de l'ASE grâce à une décomposition spectrale pondérée, offrant ainsi de meilleures performances de reconstruction et de visualisation.

Hannah Sansford, Nick Whiteley, Patrick Rubin-DelanchyFri, 13 Ma📊 stat