SNPgen: Phenotype-Supervised Genotype Representation and Synthetic Data Generation via Latent Diffusion

El artículo presenta SNPgen, un marco de difusión latente condicional que genera genotipos sintéticos supervisados por fenotipos, logrando un rendimiento predictivo comparable al de datos reales para enfermedades complejas mientras garantiza la privacidad y preserva las estructuras genéticas clave.

Andrea Lampis, Michela Carlotta Massi, Nicola Pirastu, Francesca Ieva, Matteo Matteucci, Emanuele Di Angelantonio2026-03-12🧬 q-bio

Dynamics-Predictive Sampling for Active RL Finetuning of Large Reasoning Models

Este trabajo propone el Muestreo Predictivo de Dinámicas (DPS), un método que utiliza inferencia bayesiana sobre un modelo oculto de Markov para predecir y seleccionar proactivamente los prompts más informativos durante el ajuste fino con aprendizaje por refuerzo de modelos de razonamiento grandes, reduciendo así significativamente el costo computacional de las simulaciones y acelerando el entrenamiento sin comprometer el rendimiento.

Yixiu Mao, Yun Qu, Qi Wang, Heming Zou, Xiangyang Ji2026-03-12🤖 cs.LG

Ergodicity in reinforcement learning

Este artículo examina cómo los procesos de recompensa no ergódicos hacen que la optimización del valor esperado sea inadecuada para el rendimiento individual en el aprendizaje por refuerzo, relacionando este concepto con las cadenas de Markov ergódicas y presentando soluciones para maximizar el rendimiento a largo plazo en trayectorias individuales.

Dominik Baumann, Erfaun Noorani, Arsenii Mustafin, Xinyi Sheng, Bert Verbruggen, Arne Vanhoyweghen, Vincent Ginis, Thomas B. Schön2026-03-12🤖 cs.LG

LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation

LookaheadKV es un marco de expulsión de caché KV ligero que, al predecir puntuaciones de importancia futuras mediante módulos eficientes en lugar de generar borradores explícitos, logra una alta precisión y reduce el costo de expulsión hasta 14,5 veces en comparación con métodos anteriores.

Jinwoo Ahn, Ingyu Seong, Akhil Kedia, Junhan Kim, Hyemi Jang, Kangwook Lee, Yongkweon Jeon2026-03-12🤖 cs.LG

Quantifying Membership Disclosure Risk for Tabular Synthetic Data Using Kernel Density Estimators

Este trabajo propone un método práctico basado en estimadores de densidad de núcleo (KDE) para cuantificar el riesgo de divulgación de pertenencia en datos sintéticos tabulares, demostrando mediante evaluaciones empíricas que supera a enfoques anteriores al permitir una caracterización precisa del riesgo sin necesidad de modelos sombra computacionalmente costosos.

Rajdeep Pathak, Sayantee Jana2026-03-12📊 stat

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

Este trabajo presenta RAD, un marco de alineación que reemplaza las restricciones de costo esperado tradicionales por restricciones de dominancia estocástica de primer orden dentro de un marco de transporte óptimo, permitiendo un control universal de medidas de riesgo espectral y mejorando la robustez ante eventos catastróficos y distribuciones fuera de contexto en el Aprendizaje por Refuerzo a partir de Feedback Humano (RLHF).

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

Este artículo presenta un marco de predicción selectiva para la recuperación de estructuras moleculares a partir de espectros de masas que, mediante la cuantificación de incertidumbre a nivel de recuperación, permite a los modelos abstenerse de hacer predicciones dudosas para garantizar un control riguroso de la tasa de error en aplicaciones de alto riesgo.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem Waegeman2026-03-12📊 stat

Bio-Inspired Self-Supervised Learning for Wrist-worn IMU Signals

Este trabajo propone un método de aprendizaje auto-supervisido bioinspirado para señales IMU de muñeca que, al tokenizar el movimiento en segmentos basados en la teoría de submovimientos y preentrenar un Transformer, logra representaciones superiores para el reconocimiento de actividades humanas en comparación con enfoques existentes.

Prithviraj Tarale, Kiet Chu, Abhishek Varghese, Kai-Chun Liu, Maxwell A Xu, Mohit Iyyer, Sunghoon I. Lee2026-03-12🤖 cs.LG

FRIEND: Federated Learning for Joint Optimization of multi-RIS Configuration and Eavesdropper Intelligent Detection in B5G Networks

Este trabajo presenta un marco de aprendizaje federado para redes B5G que optimiza conjuntamente la configuración de superficies inteligentes reconfigurables (RIS) y la detección de eavesdroppers mediante una red neuronal convolucional con salida temprana, logrando un aumento del 30% en la tasa de secreto y preservando la privacidad de los datos en entornos industriales.

Maria Lamprini A. Bartsioka, Ioannis A. Bartsiokas, Anastasios K. Papazafeiropoulos, Maria A. Seimeni, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🤖 cs.LG

Federated Learning-driven Beam Management in LEO 6G Non-Terrestrial Networks

Este trabajo investiga la gestión de haces en redes no terrestres LEO mediante aprendizaje federado, demostrando que un modelo de red neuronal gráfica (GNN) supera a un perceptrón multicapa (MLP) en precisión y estabilidad para la selección de haces, especialmente en ángulos de elevación bajos.

Maria Lamprini Bartsioka, Ioannis A. Bartsiokas, Athanasios D. Panagopoulos, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🔬 physics

The Discrete Charm of the MLP: Binary Routing of Continuous Signals in Transformer Feed-Forward Layers

El artículo demuestra que las capas MLP en los modelos de transformadores realizan una enrutamiento binario de señales continuas, donde neuronas específicas actúan como interruptores de consenso y excepciones para dirigir el procesamiento no lineal, una estructura funcional que explica por qué las aproximaciones polinómicas suaves fallan al capturar la naturaleza discreta de estas decisiones.

Peter Balogh2026-03-12🤖 cs.LG