cs.LG articles | Gist.Science

Automated Measurement of Geniohyoid Muscle Thickness During Speech Using Deep Learning and Ultrasound

Cette étude présente SMMA, un cadre d'apprentissage profond automatisé permettant une mesure précise et évolutive de l'épaisseur du muscle géniohyoïdien lors de la parole, validée par une forte corrélation avec l'annotation manuelle et révélant des variations systématiques liées aux voyelles et au sexe.

Alisher Myrgyyassov, Bruce Xiao Wang, Yu Sun + 4 more2026-03-05🤖 cs.LG

The Theory behind UMAP?

Cet article corrige les erreurs présentes dans la version originale de l'algorithme UMAP et fournit une dérivation complète et autonome des foncteurs de Spivak ainsi que de leur variante finie utilisée par McInnes et al.

David Wegmann2026-03-05🤖 cs.LG

Learning Order Forest for Qualitative-Attribute Data Clustering

Cet article propose une méthode de clustering pour les données à attributs qualitatifs, baptisée « Learning Order Forest », qui apprend conjointement une forêt d'arbres représentant les relations d'ordre locales entre les valeurs d'attributs afin d'optimiser la structure de distance pour un regroupement plus précis.

Mingjie Zhao, Sen Feng, Yiqun Zhang + 3 more2026-03-05🤖 cs.AI

Towards Improved Sentence Representations using Token Graphs

Ce papier présente GLOT, un module d'agrégation léger et structurellement conscient qui améliore les représentations de phrases en modélisant les relations entre les tokens via un graphe latent, surpassant ainsi les méthodes de pooling standard en robustesse et en efficacité tout en nécessitant beaucoup moins de paramètres ajustables.

Krishna Sri Ipsit Mantri, Carola-Bibiane Schönlieb, Zorah Lähner + 1 more2026-03-05🤖 cs.LG

Beyond Cross-Validation: Adaptive Parameter Selection for Kernel-Based Gradient Descents

Cet article propose une nouvelle stratégie de sélection de paramètres adaptative pour les descentes de gradient à noyau, fondée sur l'analyse biais-variance et la dimension effective empirique, qui garantit théoriquement des bornes d'erreur de généralisation optimales et surpassant les méthodes existantes.

Xiaotong Liu, Yunwen Lei, Xiangyu Chang + 1 more2026-03-05🤖 cs.LG

Heterogeneous Time Constants Improve Stability in Equilibrium Propagation

Cet article présente l'intégration de constantes de temps hétérogènes dans la propagation d'équilibre, une méthode d'apprentissage biologiquement plausible, démontrant que cette approche améliore la stabilité de l'entraînement tout en maintenant des performances compétitives.

Yoshimasa Kubo, Suhani Pragnesh Modi, Smit Patel2026-03-05🤖 cs.AI

Surprisal-Rényi Free Energy

Cet article introduit l'Énergie Libre de Surprisal-Rényi (SRFE), une fonctionnelle log-momentielle qui généralise les divergences de Kullback-Leibler en révélant un compromis explicite entre moyenne et variance, tout en offrant une caractérisation variationnelle de type Gibbs et une interprétation précise en termes de Longueur Minimale de Description pour contrôler les déviations extrêmes.

Shion Matsumoto, Raul Castillo, Benjamin Prada + 1 more2026-03-05🤖 cs.LG

A Short Note on a Variant of the Squint Algorithm

Cette note présente une variante simple de l'algorithme Squint et démontre, par une modification analogue de la preuve originale, qu'elle garantit une borne de regret similaire à celle obtenue récemment par Freund et al. pour une variante de l'algorithme NormalHedge.

Haipeng Luo2026-03-05🤖 cs.LG

Scalable Contrastive Causal Discovery under Unknown Soft Interventions

Cet article propose un modèle d'apprentissage causal évolutif et contrastif capable de découvrir des structures causales sous forme de PDAG maximales à partir de régimes observationnels et interventionnels appariés avec des interventions douces inconnues, garantissant une récupération théorique et une généralisation supérieures aux méthodes existantes.

Mingxuan Zhang, Khushi Desai, Sopho Kevlishvili + 1 more2026-03-05🤖 cs.LG

[Re] FairDICE: A Gap Between Theory And Practice

Cette étude de réplication révèle que bien que FairDICE soit théoriquement prometteur pour l'apprentissage par renforcement hors ligne multi-objectifs, une erreur de code et un manque de spécification des hyperparamètres ont initialement réduit son efficacité à un simple apprentissage par imitation, nécessitant des corrections et des ajustements pour valider son potentiel dans des environnements complexes.

Peter Adema, Karim Galliamov, Aleksey Evstratovskiy + 1 more2026-03-05🤖 cs.LG

Half the Nonlinearity Is Wasted: Measuring and Reallocating the Transformer's MLP Budget

Cette étude démontre que la majorité des non-linéarités des MLP dans les transformers sont redondantes et peuvent être remplacées par des surrogates linéaires contextuels ou des matrices gelées, permettant d'économiser jusqu'à la moitié des ressources de calcul tout en améliorant les performances du modèle.

Peter Balogh2026-03-05🤖 cs.LG

Graph Hopfield Networks: Energy-Based Node Classification with Associative Memory

Ce papier présente les Graph Hopfield Networks, une méthode de classification de nœuds basée sur l'énergie qui combine la récupération de mémoire associative et le lissage par Laplacien de graphe pour améliorer la précision et la robustesse sur divers benchmarks.

Abinav Rao, Alex Wa, Rishi Athavale2026-03-05🤖 cs.AI

Biased Generalization in Diffusion Models

Cette étude remet en question l'arrêt précoce des modèles de diffusion au minimum de la perte de test en révélant une phase de généralisation biaisée où le modèle génère des échantillons excessivement proches des données d'entraînement, un phénomène attribué à l'apprentissage séquentiel des caractéristiques qui pose des risques pour la vie privée.

Jerome Garnier-Brun, Luca Biggio, Davide Beltrame + 2 more2026-03-05🤖 cs.LG

When Shallow Wins: Silent Failures and the Depth-Accuracy Paradox in Latent Reasoning

Cette étude révèle que les modèles de raisonnement mathématique d'état de l'art, bien que performants en termes de précision, souffrent d'instabilités computationnelles fondamentales et de « silences » d'échec, démontrant ainsi que les métriques d'accuracy actuelles masquent une fiabilité insuffisante et nécessitent une réforme de l'évaluation.

Subramanyam Sahoo, Aman Chadha, Vinija Jain + 1 more2026-03-05🤖 cs.AI

Minimax Optimal Strategy for Delayed Observations in Online Reinforcement Learning

Cet article propose un algorithme combinant l'augmentation d'état et la borne de confiance supérieure pour atteindre une régression minimax optimale dans l'apprentissage par renforcement avec observations d'état retardées, en établissant à la fois une borne supérieure de regret et une borne inférieure correspondante.

Harin Lee, Kevin Jamieson2026-03-05🤖 cs.LG

Beyond Pixel Histories: World Models with Persistent 3D State

Le papier présente PERSIST, un nouveau modèle de monde qui simule l'évolution d'une scène 3D latente persistante (environnement, caméra et rendu) pour surmonter les limites de cohérence spatiale et de mémoire des modèles vidéo interactifs actuels, permettant ainsi une génération de mondes 3D cohérents et une édition géométrique fine.

Samuel Garcin, Thomas Walker, Steven McDonagh + 5 more2026-03-05🤖 cs.AI

Optimal trajectory-guided stochastic co-optimization for e-fuel system design and real-time operation

Cet article présente MasCOR, un cadre d'optimisation conjointe assisté par l'apprentissage automatique qui permet de concevoir et d'opérer efficacement des systèmes de production de carburants e-fuels sous incertitude, en identifiant des stratégies de dimensionnement et de gestion spécifiques à chaque site pour atteindre la neutralité carbone à un coût compétitif.

Jeongdong Kim, Minsu Kim, Jonggeol Na + 1 more2026-03-05🤖 cs.AI

When Small Variations Become Big Failures: Reliability Challenges in Compute-in-Memory Neural Accelerators

Cette présentation examine les défis de fiabilité des accélérateurs neuronaux à calcul en mémoire, en démontrant comment de petites variations des dispositifs peuvent entraîner des échecs critiques, et propose des solutions de conception croisée, notamment un mécanisme de vérification sélective et une méthode d'entraînement robuste, pour garantir un déploiement fiable dans des applications critiques.

Yifan Qin, Jiahao Zheng, Zheyu Yan + 3 more2026-03-05🤖 cs.LG

Quantifying Ranking Instability Across Evaluation Protocol Axes in Gene Regulatory Network Benchmarking

Cette étude propose un cadre diagnostique pour quantifier l'instabilité des classements dans l'évaluation des réseaux de régulation génique, révélant que les inversions de rangs entre méthodes sont principalement dues à des variations de leur pouvoir discriminant plutôt qu'à des effets de taux de base, et soulignant ainsi la nécessité de pratiques de rapport plus robustes.

Ihor Kendiukhov2026-03-05🤖 cs.LG

Geographically-Weighted Weakly Supervised Bayesian High-Resolution Transformer for 200m Resolution Pan-Arctic Sea Ice Concentration Mapping and Uncertainty Estimation using Sentinel-1, RCM, and AMSR2 Data

Cette étude propose une approche novatrice de Transformer bayésien à haute résolution, combinant des modules locaux et globaux, une fonction de perte faiblement supervisée pondérée géographiquement et une fusion de données multi-sources (Sentinel-1, RCM, AMSR2) pour produire des cartes de concentration de la glace de mer à l'échelle pan-arctique à 200 mètres avec une estimation fiable des incertitudes.

Mabel Heffring, Lincoln Linlin Xu2026-03-05🤖 cs.LG

← Précédent Suivant →