cs.LG articles | Gist.Science

Generalizable deep learning for photoplethysmography-based blood pressure estimation -- A Benchmarking Study

Cette étude de benchmarking évalue la capacité de généralisation de cinq modèles d'apprentissage profond pour l'estimation de la pression artérielle à partir de PPG, révélant une baisse significative des performances sur des données externes et soulignant l'importance cruciale de l'adaptation de domaine pour surmonter les disparités de distribution entre les jeux de données.

Mohammad Moulaeifard, Peter H. Charlton, Nils Strodthoff2026-03-03⚡ eess

Machine-learning for photoplethysmography analysis: Benchmarking feature, image, and signal-based approaches

Cette étude de benchmark démontre que les réseaux de neurones convolutifs modernes traitant directement les signaux bruts de photopléthysmographie surpassent les approches basées sur des caractéristiques ou des images pour la prédiction de la pression artérielle et de la fibrillation auriculaire.

Mohammad Moulaeifard, Loic Coquelin, Mantas Rinkevičius + 13 more2026-03-03⚡ eess

Does Generation Require Memorization? Creative Diffusion Models using Ambient Diffusion

Cet article propose une méthode fondée sur des preuves théoriques, consistant à entraîner des modèles de diffusion uniquement sur des données bruitées à grande échelle, permettant ainsi de réduire significativement la mémorisation du jeu d'entraînement sans compromettre la qualité de génération des images.

Kulin Shah, Alkis Kalavasis, Adam R. Klivans + 1 more2026-03-03🤖 cs.LG

A Randomized Linearly Convergent Frank-Wolfe-type Method for Smooth Convex Minimization over the Spectrahedron

Cet article propose la première variante de la méthode de Frank-Wolfe garantissant une convergence linéaire en espérance et indépendante de la dimension pour la minimisation de fonctions convexes lisses sur le spectrahèdre, tout en n'utilisant que des calculs matriciels de rang un.

Dan Garber2026-03-03🔢 math

LLaVE: Large Language and Vision Embedding Models with Hardness-Weighted Contrastive Learning

Le papier présente LLaVE, un cadre d'apprentissage contrastif pondéré par la difficulté qui améliore l'entraînement des modèles d'encodage multimodaux pour mieux distinguer les paires négatives difficiles, permettant ainsi d'atteindre des performances de pointe sur le benchmark MMEB avec une meilleure efficacité que les modèles précédents.

Zhibin Lan, Liqiang Niu, Fandong Meng + 2 more2026-03-03💬 cs.CL

Vision-R1: Incentivizing Reasoning Capability in Multimodal Large Language Models

Le papier présente Vision-R1, un modèle multimodal de langage qui améliore les capacités de raisonnement grâce à une stratégie d'entraînement par apprentissage par renforcement combinant un jeu de données de chaîne de pensée initialisé automatiquement et une suppression progressive de la sur-réflexion, atteignant ainsi des performances compétitives sur les benchmarks de raisonnement mathématique.

Wenxuan Huang, Bohan Jia, Zijie Zhai + 7 more2026-03-03💬 cs.CL

Effective and Efficient Masked Image Generation Models

Ce papier présente eMIGM, un modèle unifié de génération d'images masquées qui, grâce à une exploration rigoureuse de l'espace de conception, surpasse des modèles de référence comme VAR et EDM2 sur ImageNet tout en nécessitant moins de calculs.

Zebin You, Jingyang Ou, Xiaolu Zhang + 3 more2026-03-03🤖 cs.LG

Reproducibility and Artifact Consistency of the SIGIR 2022 Recommender Systems Papers Based on Message Passing

Cette étude révèle que la plupart des articles SIGIR 2022 sur les systèmes de recommandation basés sur le passage de messages souffrent de pratiques erronées, d'incohérences entre les artefacts et les descriptions, et de comparaisons biaisées, rendant leurs résultats et leurs affirmations de progrès non reproductibles et non validés.

Maurizio Ferrari Dacrema, Michael Benigni, Nicola Ferro2026-03-03🤖 cs.LG

I Predict Therefore I Am: Is Next Token Prediction Enough to Learn Human-Interpretable Concepts from Data?

Cet article démontre théoriquement et valide empiriquement que la prédiction du prochain token permet aux grands modèles de langage d'apprendre des concepts latents interprétables par l'humain, dont les représentations correspondent approximativement aux logarithmes des probabilités a posteriori de ces concepts.

Yuhang Liu, Dong Gong, Yichao Cai + 6 more2026-03-03💬 cs.CL

A Multi-Objective Evaluation Framework for Analyzing Utility-Fairness Trade-Offs in Machine Learning Systems

Cet article présente un cadre d'évaluation multi-objectif, agnostique et disponible publiquement, conçu pour analyser et visualiser les compromis entre utilité et équité dans les systèmes d'apprentissage automatique, en mettant particulièrement l'accent sur leur application critique dans le domaine de l'imagerie médicale.

Gökhan Özbulak, Oscar Jimenez-del-Toro, Maíra Fatoretto + 2 more2026-03-03🤖 cs.LG

A Benchmark Dataset for Machine Learning Surrogates of Pore-Scale CO2-Water Interaction

Cet article présente un ensemble de données de référence composé de 624 échantillons 2D haute résolution issus de simulations numériques, conçu pour entraîner et évaluer des modèles d'apprentissage automatique simulant les interactions poreuses entre le CO2 et l'eau dans le contexte du stockage géologique.

Alhasan Abdellatif, Hannah P. Menke, Julien Maes + 2 more2026-03-03🤖 cs.LG

AdaRank: Adaptive Rank Pruning for Enhanced Model Merging

Ce papier présente AdaRank, un cadre novateur de fusion de modèles qui améliore les performances multi-tâches en adaptivement élaguant les composantes singulières interférentes des vecteurs de tâche via une minimisation de l'entropie, réduisant ainsi l'écart de performance par rapport aux modèles affinés individuels à moins de 1 %.

Chanhyuk Lee, Jiho Choi, Chanryeol Lee + 2 more2026-03-03🤖 cs.AI

Geometric Reasoning in the Embedding Space

Cette étude démontre que les réseaux de neurones à graphes et les transformateurs peuvent apprendre à raisonner sur des contraintes géométriques pour prédire des positions dans une grille 2D, en réorganisant leurs représentations internes pour reconstruire la structure de la grille, le réseau de neurones à graphes proposé surpassant significativement le transformateur en performance et en évolutivité.

Jan Hůla, David Mojžíšek, Jiří Janeček + 2 more2026-03-03🤖 cs.LG

Optimistic Online Learning in Symmetric Cone Games

Ce papier introduit les jeux à cône symétrique comme cadre unificateur pour divers problèmes d'optimisation et de théorie des jeux, et propose l'algorithme OSCMWU, une méthode d'apprentissage en ligne optimiste qui calcule efficacement des équilibres de Nash avec une complexité itérative $\tilde{\mathcal{O}}(1/\epsilon)$ en exploitant la forte convexité de l'entropie négative sur les cône symétriques.

Anas Barakat, Wayne Lin, John Lazarsfeld + 1 more2026-03-03🔢 math

Identifying and Evaluating Inactive Heads in Pretrained LLMs

Cette étude propose et évalue douze fonctions de score pour identifier les têtes d'attention inactives dans les grands modèles de langage, démontrant que plus de 12 % de ces têtes peuvent être supprimées sans perte significative de performance et que les méthodes basées uniquement sur les poids d'attention sous-estiment considérablement ce phénomène.

Pedro Sandoval-Segura, Xijun Wang, Ashwinee Panda + 4 more2026-03-03🤖 cs.LG

Standardization of Weighted Ranking Correlation Coefficients

Cet article propose une fonction de standardisation générale qui transforme les coefficients de corrélation pondérés entre classements en une forme normalisée à espérance nulle sous l'hypothèse d'indépendance, en utilisant des estimations numériques basées sur l'échantillonnage Monte Carlo pour surmonter les difficultés de calcul liées aux grandes tailles d'échantillons.

Pierangelo Lombardo2026-03-03🔬 cond-mat

Standardization of Multi-Objective QUBOs

Cet article propose une nouvelle méthode de mise à l'échelle des objectifs QUBO multi-objectifs basée sur le calcul exact de leur variance pour les normaliser à une variance unitaire, facilitant ainsi leur équilibrage et leur combinaison par pondération égale sans nécessiter de sélection manuelle fastidieuse des poids.

Loong Kuan Lee, Thore Gerlach, Nico Piatkowski2026-03-03⚛️ quant-ph

Sparsification Under Siege: Dual-Level Defense Against Poisoning in Communication-Efficient Federated Learning

Cet article présente SafeSparse, un cadre de défense à double niveau qui résout le compromis entre robustesse et efficacité communicationnelle dans l'apprentissage fédéré en utilisant une calibration structurelle et un alignement sémantique directionnel pour contrer les attaques par empoisonnement lors de la sparsification des gradients.

Zhiyong Jin, Runhua Xu, Chao Li + 3 more2026-03-03🤖 cs.LG

Rewriting Pre-Training Data Boosts LLM Performance in Math and Code

Ce papier présente deux nouveaux jeux de données pré-entraînés, SwallowCode et SwallowMath, générés par une méthode de réécriture systématique de données publiques qui améliore significativement les performances des grands modèles de langage en programmation et en raisonnement mathématique.

Kazuki Fujii, Yukito Tajima, Sakae Mizuki + 14 more2026-03-03🤖 cs.AI

Wasserstein Distances Made Explainable: Insights Into Dataset Shifts and Transport Phenomena

Cet article propose une méthode d'IA explicable permettant d'attribuer efficacement et précisément les distances de Wasserstein à divers composants des données, tels que des sous-groupes ou des caractéristiques, afin de mieux comprendre les décalages de distribution et les phénomènes de transport.

Philip Naumann, Jacob Kauffmann, Grégoire Montavon2026-03-03🤖 cs.AI

← Précédent Suivant →