cs.LG articles | Gist.Science

SNPgen: Phenotype-Supervised Genotype Representation and Synthetic Data Generation via Latent Diffusion

L'article présente SNPgen, un cadre de diffusion latente conditionnelle qui génère des données génétiques synthétiques alignées sur les phénotypes pour préserver la confidentialité tout en permettant une prédiction des maladies complexes aussi précise que les modèles entraînés sur des données réelles.

Andrea Lampis, Michela Carlotta Massi, Nicola Pirastu, Francesca Ieva, Matteo Matteucci, Emanuele Di Angelantonio2026-03-12🧬 q-bio

LAtte: Hyperbolic Lorentz Attention for Cross-Subject EEG Classification

Le papier présente LAtte, un cadre novateur combinant un module d'attention lorentzien et un encodeur InceptionTime pour surmonter la variabilité inter-sujets et le faible rapport signal-bruit dans la classification EEG, permettant ainsi un apprentissage robuste et généralisable à travers différents sujets.

Johannes Burchert, Ahmad Bdeir, Tom Hanika, Lars Schmidt-Thieme, Niels Landwehr2026-03-12🤖 cs.LG

Continuous Diffusion Transformers for Designing Synthetic Regulatory Elements

Cette étude présente un modèle Diffusion Transformer paramétriquement efficace qui génère des séquences d'ADN régulateur spécifiques aux types cellulaires avec une convergence accélérée, une réduction du mémorisation des données et une activité régulatrice prédite nettement améliorée grâce à un affinage par DDPO.

Jonathan Liu, Kia Ghods2026-03-12🧬 q-bio

Kernel Tests of Equivalence

Cet article propose de nouveaux tests d'équivalence basés sur des noyaux, utilisant la divergence de Stein et la divergence maximale de moyenne pour évaluer l'absence de différences significatives entre distributions sans les limitations des méthodes paramétriques ou des tests de moments.

Xing Liu, Axel Gandy2026-03-12📊 stat

Dynamics-Predictive Sampling for Active RL Finetuning of Large Reasoning Models

Cet article propose l'échantillonnage prédictif dynamique (DPS), une méthode qui modélise la progression d'apprentissage des prompts comme un système dynamique pour prédire et sélectionner en ligne les exemples les plus informatifs avant les rollouts coûteux, réduisant ainsi considérablement la surcharge computationnelle et accélérant le finetuning par apprentissage par renforcement des grands modèles de raisonnement.

Yixiu Mao, Yun Qu, Qi Wang, Heming Zou, Xiangyang Ji2026-03-12🤖 cs.LG

Ergodicity in reinforcement learning

Cet article examine l'impact des processus de récompense non ergodiques sur l'apprentissage par renforcement, en démontrant que l'optimisation de la valeur espérée est inadéquate pour les agents individuels et en présentant des solutions visant à maximiser les performances sur des trajectoires uniques.

Dominik Baumann, Erfaun Noorani, Arsenii Mustafin, Xinyi Sheng, Bert Verbruggen, Arne Vanhoyweghen, Vincent Ginis, Thomas B. Schön2026-03-12🤖 cs.LG

LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation

LookaheadKV est un cadre d'éviction de cache KV léger qui prédit l'importance future des tokens sans génération explicite, offrant ainsi une précision supérieure aux méthodes existantes tout en réduisant considérablement les coûts de calcul et le temps de génération initial.

Jinwoo Ahn, Ingyu Seong, Akhil Kedia, Junhan Kim, Hyemi Jang, Kangwook Lee, Yongkweon Jeon2026-03-12🤖 cs.LG

NCAA Bracket Prediction Using Machine Learning and Combinatorial Fusion Analysis

Ce papier présente une méthode de prédiction des matchs du tournoi NCAA 2024 utilisant l'analyse de fusion combinatoire (CFA) pour générer un classement d'équipes atteignant une précision de 74,60 %, surpassant ainsi les dix meilleurs systèmes de classement publics.

Yuanhong Wu, Isaiah Smith, Tushar Marwah, Michael Schroeter, Mohamed Rahouti, D. Frank Hsu2026-03-12🤖 cs.LG

ECoLAD: Deployment-Oriented Evaluation for Automotive Time-Series Anomaly Detection

L'article présente ECoLAD, un protocole d'évaluation axé sur le déploiement qui révèle que, contrairement aux méthodes profondes qui deviennent irréalistes sous contraintes de calcul, les détecteurs classiques légers maintiennent à la fois une couverture et une détection efficace sur des données automobiles réelles.

Kadir-Kaan Özer, René Ebeling, Markus Enzweiler2026-03-12🤖 cs.LG

Historical Consensus: Preventing Posterior Collapse via Iterative Selection of Gaussian Mixture Priors

Ce papier propose une méthode d'entraînement par consensus historique, basée sur une sélection itérative de priors à mélange gaussien, qui élimine définitivement l'effondrement postérieur dans les autoencodeurs variationnels en créant une barrière historique stable qui exclut les solutions dégénérées, et ce sans nécessiter de conditions de stabilité explicites ni de contraintes architecturales.

Zegu Zhang, Jian Zhang2026-03-12🤖 cs.LG

Quantifying Membership Disclosure Risk for Tabular Synthetic Data Using Kernel Density Estimators

Cet article propose une méthode pratique basée sur les estimateurs de densité de noyau pour quantifier le risque de divulgation de l'appartenance dans les données synthétiques tabulaires, permettant une évaluation robuste de la vie privée sans recourir à des modèles d'ombre coûteux.

Rajdeep Pathak, Sayantee Jana2026-03-12📊 stat

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

Ce papier propose RAD, un cadre d'alignement novateur qui remplace les contraintes de coût espéré par des contraintes de dominance stochastique du premier ordre optimisées via le transport optimal, permettant ainsi un contrôle universel des risques spectraux et une meilleure robustesse face aux événements rares et aux distributions hors domaine.

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

Cet article présente un cadre de prédiction sélective pour la récupération de structures moléculaires à partir de spectres de masse, démontrant que l'utilisation de mesures de confiance simples et d'incertitudes aléatoires au niveau de la récupération permet d'abstenir les prédictions incertaines et de garantir des taux d'erreur contrôlés dans des applications à haut risque.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem Waegeman2026-03-12📊 stat

Ranking Reasoning LLMs under Test-Time Scaling

Ce papier introduit Scorio, une bibliothèque open-source qui formalise et évalue des méthodes statistiques pour classer les modèles de langage de raisonnement dans des régimes d'extension au moment du test, en identifiant des approches fiables pour les budgets de calcul élevés et faibles sur des benchmarks mathématiques de haut niveau.

Mohsen Hariri, Michael Hinczewski, Jing Ma, Vipin Chaudhary2026-03-12📊 stat

Bio-Inspired Self-Supervised Learning for Wrist-worn IMU Signals

Cette étude propose une méthode d'apprentissage auto-supervisé bio-inspirée pour les signaux IMU portés au poignet, qui utilise une tokenisation basée sur la théorie des sous-mouvements pour pré-entraîner un encodeur Transformer et obtenir des représentations supérieures pour la reconnaissance d'activités humaines, même dans des contextes de données limitées.

Prithviraj Tarale, Kiet Chu, Abhishek Varghese, Kai-Chun Liu, Maxwell A Xu, Mohit Iyyer, Sunghoon I. Lee2026-03-12🤖 cs.LG

Pointy - A Lightweight Transformer for Point Cloud Foundation Models

Ce papier présente Pointy, une architecture légère basée sur les transformateurs qui, entraînée uniquement sur 39 000 nuages de points, surpasse des modèles fondationnels plus massifs et démontre l'efficacité d'une conception architecturale soignée et d'un protocole d'entraînement rigoureux pour les modèles de base sur les nuages de points.

Konrad Szafer, Marek Kraft, Dominik Belter2026-03-12🤖 cs.LG

TOSSS: a CVE-based Software Security Benchmark for Large Language Models

Ce papier présente TOSSS, un nouveau benchmark basé sur la base de données CVE permettant d'évaluer la capacité des modèles de langage à distinguer le code sécurisé du code vulnérable, révélant des scores de sécurité variables parmi 14 modèles testés.

Marc Damie, Murat Bilgehan Ertan, Domenico Essoussi, Angela Makhanu, Gaëtan Peter, Roos Wensveen2026-03-12🤖 cs.LG

FRIEND: Federated Learning for Joint Optimization of multi-RIS Configuration and Eavesdropper Intelligent Detection in B5G Networks

Cet article présente le cadre FRIEND, une approche d'apprentissage fédéré intégrant des surfaces intelligentes reconfigurables (RIS) multiples pour optimiser conjointement la configuration du réseau et la détection d'espions dans les réseaux cellulaires sans cellule mmWave de la B5G, améliorant ainsi le taux de confidentialité d'environ 30 % tout en préservant la vie privée des données.

Maria Lamprini A. Bartsioka, Ioannis A. Bartsiokas, Anastasios K. Papazafeiropoulos, Maria A. Seimeni, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🤖 cs.LG

Federated Learning-driven Beam Management in LEO 6G Non-Terrestrial Networks

Cette étude propose une gestion de faisceau intelligente pour les réseaux non-terrestres LEO 6G en utilisant l'apprentissage fédéré via des stations HAPS, démontrant que les réseaux de neurones à graphes surpassent les perceptrons multicouches en précision et en stabilité, notamment aux faibles angles d'élévation.

Maria Lamprini Bartsioka, Ioannis A. Bartsiokas, Athanasios D. Panagopoulos, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🔬 physics

The Discrete Charm of the MLP: Binary Routing of Continuous Signals in Transformer Feed-Forward Layers

Cette étude démontre que les couches MLP des transformateurs effectuent un routage binaire des signaux continus, où des architectures de consensus neuronale et de gestion d'exceptions déterminent de manière fonctionnelle quels jetons nécessitent un traitement non linéaire, expliquant ainsi l'échec des approximations polynomiales lisses.

Peter Balogh2026-03-12🤖 cs.LG

← Précédent Suivant →