cs.LG artículos | Gist.Science

SNPgen: Phenotype-Supervised Genotype Representation and Synthetic Data Generation via Latent Diffusion

El artículo presenta SNPgen, un marco de difusión latente condicional que genera genotipos sintéticos supervisados por fenotipos, logrando un rendimiento predictivo comparable al de datos reales para enfermedades complejas mientras garantiza la privacidad y preserva las estructuras genéticas clave.

Andrea Lampis, Michela Carlotta Massi, Nicola Pirastu, Francesca Ieva, Matteo Matteucci, Emanuele Di Angelantonio2026-03-12🧬 q-bio

LAtte: Hyperbolic Lorentz Attention for Cross-Subject EEG Classification

El artículo presenta LAtte, un marco innovador que integra un módulo de atención Lorentz con un codificador InceptionTime para lograr una clasificación robusta y generalizable de señales EEG entre diferentes sujetos mediante el aprendizaje de patrones comunes y adaptadores específicos para cada individuo.

Johannes Burchert, Ahmad Bdeir, Tom Hanika, Lars Schmidt-Thieme, Niels Landwehr2026-03-12🤖 cs.LG

Continuous Diffusion Transformers for Designing Synthetic Regulatory Elements

Este trabajo presenta un modelo eficiente de Difusión Transformer (DiT) que genera secuencias de ADN regulador específicas de tipo celular con una convergencia más rápida y menos memorización que los enfoques anteriores, mejorando además significativamente la actividad reguladora predicha mediante ajuste fino con DDPO.

Jonathan Liu, Kia Ghods2026-03-12🧬 q-bio

Kernel Tests of Equivalence

Este artículo propone nuevos tests de equivalencia basados en núcleos que utilizan la discrepancia de Stein y la discrepancia máxima media para evaluar la ausencia de diferencias significativas entre distribuciones, superando las limitaciones de los métodos paramétricos tradicionales mediante aproximaciones asintóticas y de remuestreo.

Xing Liu, Axel Gandy2026-03-12📊 stat

Dynamics-Predictive Sampling for Active RL Finetuning of Large Reasoning Models

Este trabajo propone el Muestreo Predictivo de Dinámicas (DPS), un método que utiliza inferencia bayesiana sobre un modelo oculto de Markov para predecir y seleccionar proactivamente los prompts más informativos durante el ajuste fino con aprendizaje por refuerzo de modelos de razonamiento grandes, reduciendo así significativamente el costo computacional de las simulaciones y acelerando el entrenamiento sin comprometer el rendimiento.

Yixiu Mao, Yun Qu, Qi Wang, Heming Zou, Xiangyang Ji2026-03-12🤖 cs.LG

Ergodicity in reinforcement learning

Este artículo examina cómo los procesos de recompensa no ergódicos hacen que la optimización del valor esperado sea inadecuada para el rendimiento individual en el aprendizaje por refuerzo, relacionando este concepto con las cadenas de Markov ergódicas y presentando soluciones para maximizar el rendimiento a largo plazo en trayectorias individuales.

Dominik Baumann, Erfaun Noorani, Arsenii Mustafin, Xinyi Sheng, Bert Verbruggen, Arne Vanhoyweghen, Vincent Ginis, Thomas B. Schön2026-03-12🤖 cs.LG

LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation

LookaheadKV es un marco de expulsión de caché KV ligero que, al predecir puntuaciones de importancia futuras mediante módulos eficientes en lugar de generar borradores explícitos, logra una alta precisión y reduce el costo de expulsión hasta 14,5 veces en comparación con métodos anteriores.

Jinwoo Ahn, Ingyu Seong, Akhil Kedia, Junhan Kim, Hyemi Jang, Kangwook Lee, Yongkweon Jeon2026-03-12🤖 cs.LG

NCAA Bracket Prediction Using Machine Learning and Combinatorial Fusion Analysis

Este artículo presenta un nuevo enfoque para predecir los resultados del torneo de la NCAA utilizando Análisis de Fusión Combinatoria (CFA), logrando una precisión del 74,60% que supera a los diez sistemas de clasificación públicos más populares.

Yuanhong Wu, Isaiah Smith, Tushar Marwah, Michael Schroeter, Mohamed Rahouti, D. Frank Hsu2026-03-12🤖 cs.LG

ECoLAD: Deployment-Oriented Evaluation for Automotive Time-Series Anomaly Detection

El artículo presenta ECoLAD, un protocolo de evaluación orientado a la implementación que demuestra cómo, bajo las restricciones de recursos de los vehículos, los detectores de anomalías clásicos y ligeros mantienen su viabilidad y rendimiento, mientras que varios métodos profundos pierden factibilidad antes de perder precisión.

Kadir-Kaan Özer, René Ebeling, Markus Enzweiler2026-03-12🤖 cs.LG

Historical Consensus: Preventing Posterior Collapse via Iterative Selection of Gaussian Mixture Priors

Este artículo propone el Entrenamiento de Consenso Histórico, un método iterativo que selecciona mezclas gaussianas para crear una barrera de estabilidad que elimina por completo el colapso posterior en los autoencoders variacionales sin requerir restricciones arquitectónicas ni ajustes de hiperparámetros.

Zegu Zhang, Jian Zhang2026-03-12🤖 cs.LG

Quantifying Membership Disclosure Risk for Tabular Synthetic Data Using Kernel Density Estimators

Este trabajo propone un método práctico basado en estimadores de densidad de núcleo (KDE) para cuantificar el riesgo de divulgación de pertenencia en datos sintéticos tabulares, demostrando mediante evaluaciones empíricas que supera a enfoques anteriores al permitir una caracterización precisa del riesgo sin necesidad de modelos sombra computacionalmente costosos.

Rajdeep Pathak, Sayantee Jana2026-03-12📊 stat

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

Este trabajo presenta RAD, un marco de alineación que reemplaza las restricciones de costo esperado tradicionales por restricciones de dominancia estocástica de primer orden dentro de un marco de transporte óptimo, permitiendo un control universal de medidas de riesgo espectral y mejorando la robustez ante eventos catastróficos y distribuciones fuera de contexto en el Aprendizaje por Refuerzo a partir de Feedback Humano (RLHF).

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

Este artículo presenta un marco de predicción selectiva para la recuperación de estructuras moleculares a partir de espectros de masas que, mediante la cuantificación de incertidumbre a nivel de recuperación, permite a los modelos abstenerse de hacer predicciones dudosas para garantizar un control riguroso de la tasa de error en aplicaciones de alto riesgo.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem Waegeman2026-03-12📊 stat

Ranking Reasoning LLMs under Test-Time Scaling

El artículo presenta Scorio, una biblioteca de código abierto que formaliza y evalúa métodos estadísticos para clasificar modelos de lenguaje de razonamiento bajo escalado de tiempo de prueba, demostrando que ciertas técnicas logran concordancia casi perfecta con un estándar de referencia bayesiano tanto en regímenes de múltiples intentos como de intento único.

Mohsen Hariri, Michael Hinczewski, Jing Ma, Vipin Chaudhary2026-03-12📊 stat

Bio-Inspired Self-Supervised Learning for Wrist-worn IMU Signals

Este trabajo propone un método de aprendizaje auto-supervisido bioinspirado para señales IMU de muñeca que, al tokenizar el movimiento en segmentos basados en la teoría de submovimientos y preentrenar un Transformer, logra representaciones superiores para el reconocimiento de actividades humanas en comparación con enfoques existentes.

Prithviraj Tarale, Kiet Chu, Abhishek Varghese, Kai-Chun Liu, Maxwell A Xu, Mohit Iyyer, Sunghoon I. Lee2026-03-12🤖 cs.LG

Pointy - A Lightweight Transformer for Point Cloud Foundation Models

El artículo presenta "Pointy", una arquitectura ligera basada en transformadores para modelos fundamentales de nubes de puntos que, a pesar de entrenarse con solo 39.000 muestras, supera a modelos más grandes y alcanza resultados cercanos al estado del arte, demostrando la eficacia de un diseño arquitectónico cuidadoso y un régimen de entrenamiento estandarizado.

Konrad Szafer, Marek Kraft, Dominik Belter2026-03-12🤖 cs.LG

TOSSS: a CVE-based Software Security Benchmark for Large Language Models

El artículo presenta TOSSS, un nuevo benchmark basado en la base de datos CVE que evalúa la capacidad de los modelos de lenguaje grandes para seleccionar fragmentos de código seguros frente a vulnerables, ofreciendo una métrica de seguridad complementaria a las puntuaciones existentes.

Marc Damie, Murat Bilgehan Ertan, Domenico Essoussi, Angela Makhanu, Gaëtan Peter, Roos Wensveen2026-03-12🤖 cs.LG

FRIEND: Federated Learning for Joint Optimization of multi-RIS Configuration and Eavesdropper Intelligent Detection in B5G Networks

Este trabajo presenta un marco de aprendizaje federado para redes B5G que optimiza conjuntamente la configuración de superficies inteligentes reconfigurables (RIS) y la detección de eavesdroppers mediante una red neuronal convolucional con salida temprana, logrando un aumento del 30% en la tasa de secreto y preservando la privacidad de los datos en entornos industriales.

Maria Lamprini A. Bartsioka, Ioannis A. Bartsiokas, Anastasios K. Papazafeiropoulos, Maria A. Seimeni, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🤖 cs.LG

Federated Learning-driven Beam Management in LEO 6G Non-Terrestrial Networks

Este trabajo investiga la gestión de haces en redes no terrestres LEO mediante aprendizaje federado, demostrando que un modelo de red neuronal gráfica (GNN) supera a un perceptrón multicapa (MLP) en precisión y estabilidad para la selección de haces, especialmente en ángulos de elevación bajos.

Maria Lamprini Bartsioka, Ioannis A. Bartsiokas, Athanasios D. Panagopoulos, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🔬 physics

The Discrete Charm of the MLP: Binary Routing of Continuous Signals in Transformer Feed-Forward Layers

El artículo demuestra que las capas MLP en los modelos de transformadores realizan una enrutamiento binario de señales continuas, donde neuronas específicas actúan como interruptores de consenso y excepciones para dirigir el procesamiento no lineal, una estructura funcional que explica por qué las aproximaciones polinómicas suaves fallan al capturar la naturaleza discreta de estas decisiones.

Peter Balogh2026-03-12🤖 cs.LG

← Anterior Siguiente →