SNPgen: Phenotype-Supervised Genotype Representation and Synthetic Data Generation via Latent Diffusion

L'article présente SNPgen, un cadre de diffusion latente conditionnelle qui génère des données génétiques synthétiques alignées sur les phénotypes pour préserver la confidentialité tout en permettant une prédiction des maladies complexes aussi précise que les modèles entraînés sur des données réelles.

Andrea Lampis, Michela Carlotta Massi, Nicola Pirastu, Francesca Ieva, Matteo Matteucci, Emanuele Di Angelantonio2026-03-12🧬 q-bio

Dynamics-Predictive Sampling for Active RL Finetuning of Large Reasoning Models

Cet article propose l'échantillonnage prédictif dynamique (DPS), une méthode qui modélise la progression d'apprentissage des prompts comme un système dynamique pour prédire et sélectionner en ligne les exemples les plus informatifs avant les rollouts coûteux, réduisant ainsi considérablement la surcharge computationnelle et accélérant le finetuning par apprentissage par renforcement des grands modèles de raisonnement.

Yixiu Mao, Yun Qu, Qi Wang, Heming Zou, Xiangyang Ji2026-03-12🤖 cs.LG

Historical Consensus: Preventing Posterior Collapse via Iterative Selection of Gaussian Mixture Priors

Ce papier propose une méthode d'entraînement par consensus historique, basée sur une sélection itérative de priors à mélange gaussien, qui élimine définitivement l'effondrement postérieur dans les autoencodeurs variationnels en créant une barrière historique stable qui exclut les solutions dégénérées, et ce sans nécessiter de conditions de stabilité explicites ni de contraintes architecturales.

Zegu Zhang, Jian Zhang2026-03-12🤖 cs.LG

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

Ce papier propose RAD, un cadre d'alignement novateur qui remplace les contraintes de coût espéré par des contraintes de dominance stochastique du premier ordre optimisées via le transport optimal, permettant ainsi un contrôle universel des risques spectraux et une meilleure robustesse face aux événements rares et aux distributions hors domaine.

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

Cet article présente un cadre de prédiction sélective pour la récupération de structures moléculaires à partir de spectres de masse, démontrant que l'utilisation de mesures de confiance simples et d'incertitudes aléatoires au niveau de la récupération permet d'abstenir les prédictions incertaines et de garantir des taux d'erreur contrôlés dans des applications à haut risque.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem Waegeman2026-03-12📊 stat

Bio-Inspired Self-Supervised Learning for Wrist-worn IMU Signals

Cette étude propose une méthode d'apprentissage auto-supervisé bio-inspirée pour les signaux IMU portés au poignet, qui utilise une tokenisation basée sur la théorie des sous-mouvements pour pré-entraîner un encodeur Transformer et obtenir des représentations supérieures pour la reconnaissance d'activités humaines, même dans des contextes de données limitées.

Prithviraj Tarale, Kiet Chu, Abhishek Varghese, Kai-Chun Liu, Maxwell A Xu, Mohit Iyyer, Sunghoon I. Lee2026-03-12🤖 cs.LG

FRIEND: Federated Learning for Joint Optimization of multi-RIS Configuration and Eavesdropper Intelligent Detection in B5G Networks

Cet article présente le cadre FRIEND, une approche d'apprentissage fédéré intégrant des surfaces intelligentes reconfigurables (RIS) multiples pour optimiser conjointement la configuration du réseau et la détection d'espions dans les réseaux cellulaires sans cellule mmWave de la B5G, améliorant ainsi le taux de confidentialité d'environ 30 % tout en préservant la vie privée des données.

Maria Lamprini A. Bartsioka, Ioannis A. Bartsiokas, Anastasios K. Papazafeiropoulos, Maria A. Seimeni, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🤖 cs.LG

Federated Learning-driven Beam Management in LEO 6G Non-Terrestrial Networks

Cette étude propose une gestion de faisceau intelligente pour les réseaux non-terrestres LEO 6G en utilisant l'apprentissage fédéré via des stations HAPS, démontrant que les réseaux de neurones à graphes surpassent les perceptrons multicouches en précision et en stabilité, notamment aux faibles angles d'élévation.

Maria Lamprini Bartsioka, Ioannis A. Bartsiokas, Athanasios D. Panagopoulos, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🔬 physics