cs.LG artículos | Gist.Science

Taking Shortcuts for Categorical VQA Using Super Neurons

El artículo presenta "Super Neurons", un método de sondeo que utiliza activaciones escalares en las capas superficiales de los modelos de lenguaje visual para lograr clasificadores precisos con una aceleración de hasta 5,10 veces mediante la salida temprana del modelo.

Pierre Musacchio, Jaeyi Jeong, Dahun Kim, Jaesik Park2026-03-12🤖 cs.AI

AI-Enhanced Spatial Cellular Traffic Demand Prediction with Contextual Clustering and Error Correction for 5G/6G Planning

Este artículo presenta un marco de inteligencia artificial que mejora la predicción espacial de la demanda de tráfico celular para la planificación de redes 5G/6G mediante una estrategia de división de datos consciente del contexto y corrección de errores residuales, logrando así una mayor generalización espacial y una reducción del error en comparación con métodos tradicionales.

Mohamad Alkadamani, Colin Brown, Halim Yanikomeroglu2026-03-12⚡ eess

Towards Intelligent Spectrum Management: Spectrum Demand Estimation Using Graph Neural Networks

Este artículo presenta un modelo de red neuronal de atención gráfica jerárquica (HR-GAT) que estima la demanda de espectro a escala espacial fina utilizando registros públicos, logrando una precisión superior a la de métodos existentes y facilitando la gestión y asignación eficiente del espectro para reguladores.

Mohamad Alkadamani, Amir Ghasemi, Halim Yanikomeroglu2026-03-12⚡ eess

Protein Counterfactuals via Diffusion-Guided Latent Optimization

El artículo presenta MCCOP, un marco que utiliza optimización latente guiada por difusión para generar mutaciones mínimas y biológicamente plausibles que modifican las propiedades de las proteínas según lo deseado, ofreciendo así una herramienta interpretable para el diseño y la ingeniería de proteínas.

Weronika Kłos, Sidney Bender, Lukas Kades2026-03-12🤖 cs.LG

Evaluating randomized smoothing as a defense against adversarial attacks in trajectory prediction

Este trabajo demuestra que el suavizado aleatorizado es una defensa simple y económica que mejora consistentemente la robustez de los modelos de predicción de trayectorias frente a ataques adversarios sin comprometer su precisión en entornos normales.

Julian F. Schumann, Eduardo Figueiredo, Frederik Baymler Mathiesen, Luca Laurenti, Jens Kober, Arkady Zgonnikov2026-03-12🤖 cs.LG

ReTabSyn: Realistic Tabular Data Synthesis via Reinforcement Learning

El artículo presenta ReTabSyn, un pipeline de síntesis de datos tabulares basado en aprendizaje por refuerzo que, al priorizar la distribución condicional y ofrecer retroalimentación directa sobre la preservación de correlaciones, supera a los métodos actuales en escenarios con datos limitados, desequilibrados o con cambios de distribución, mejorando así la utilidad de los modelos downstream.

Xiaofeng Lin, Seungbae Kim, Zhuoya Li, Zachary DeSoto, Charles Fleming, Guang Cheng2026-03-12📊 stat

Towards Cold-Start Drafting and Continual Refining: A Value-Driven Memory Approach with Application to NPU Kernel Synthesis

El paper presenta EvoKernel, un marco de agentes autoevolutivos que utiliza un enfoque de memoria basado en valores para superar la escasez de datos en la síntesis de kernels para NPUs, logrando mejorar la precisión de los modelos de 11.0% a 83.0% y acelerar el rendimiento mediante un refinamiento continuo.

Yujie Zheng, Zhuo Li, Shengtao Zhang, Hanjing Wang, Junjie Sheng, Jiaqian Wang, Junchi Yan, Weinan Zhang, Ying Wen, Bo Tang, Muning Wen2026-03-12🤖 cs.LG

$V_{0.5}$ : Generalist Value Model as a Prior for Sparse RL Rollouts

El artículo presenta $V_{0.5}$ , un modelo de valor generalista que fusiona adaptativamente una estimación previa con promedios empíricos de rollouts dispersos mediante pruebas estadísticas en tiempo real, logrando una reducción significativa de la varianza y un rendimiento superior en tareas de razonamiento matemático en comparación con métodos como GRPO y DAPO.

Yi-Kai Zhang, Yueqing Sun, Hongyan Hao, Qi Gu, Xunliang Cai, De-Chuan Zhan, Han-Jia Ye2026-03-12🤖 cs.LG

6ABOS: An Open-Source Atmospheric Correction Framework for the EnMAP Hyperspectral Mission Based on 6S

Este artículo presenta 6ABOS, un marco de código abierto basado en Python que automatiza la corrección atmosférica de imágenes hiperespectrales de la misión EnMAP mediante el modelo 6S y la API de Google Earth Engine, demostrando una alta precisión en la recuperación de la reflectancia del agua en embalses mediterráneos.

Gabriel Caballero Cañas, Bárbara Alvado Arranz, Xavier Sòria-Perpinyà, Antonio Ruiz-Verdú, Jesús Delegido, José Moreno2026-03-12🤖 cs.LG

SNPgen: Phenotype-Supervised Genotype Representation and Synthetic Data Generation via Latent Diffusion

El artículo presenta SNPgen, un marco de difusión latente condicional que genera genotipos sintéticos supervisados por fenotipos, logrando un rendimiento predictivo comparable al de datos reales para enfermedades complejas mientras garantiza la privacidad y preserva las estructuras genéticas clave.

Andrea Lampis, Michela Carlotta Massi, Nicola Pirastu, Francesca Ieva, Matteo Matteucci, Emanuele Di Angelantonio2026-03-12🧬 q-bio

LAtte: Hyperbolic Lorentz Attention for Cross-Subject EEG Classification

El artículo presenta LAtte, un marco innovador que integra un módulo de atención Lorentz con un codificador InceptionTime para lograr una clasificación robusta y generalizable de señales EEG entre diferentes sujetos mediante el aprendizaje de patrones comunes y adaptadores específicos para cada individuo.

Johannes Burchert, Ahmad Bdeir, Tom Hanika, Lars Schmidt-Thieme, Niels Landwehr2026-03-12🤖 cs.LG

Continuous Diffusion Transformers for Designing Synthetic Regulatory Elements

Este trabajo presenta un modelo eficiente de Difusión Transformer (DiT) que genera secuencias de ADN regulador específicas de tipo celular con una convergencia más rápida y menos memorización que los enfoques anteriores, mejorando además significativamente la actividad reguladora predicha mediante ajuste fino con DDPO.

Jonathan Liu, Kia Ghods2026-03-12🧬 q-bio

Kernel Tests of Equivalence

Este artículo propone nuevos tests de equivalencia basados en núcleos que utilizan la discrepancia de Stein y la discrepancia máxima media para evaluar la ausencia de diferencias significativas entre distribuciones, superando las limitaciones de los métodos paramétricos tradicionales mediante aproximaciones asintóticas y de remuestreo.

Xing Liu, Axel Gandy2026-03-12📊 stat

Dynamics-Predictive Sampling for Active RL Finetuning of Large Reasoning Models

Este trabajo propone el Muestreo Predictivo de Dinámicas (DPS), un método que utiliza inferencia bayesiana sobre un modelo oculto de Markov para predecir y seleccionar proactivamente los prompts más informativos durante el ajuste fino con aprendizaje por refuerzo de modelos de razonamiento grandes, reduciendo así significativamente el costo computacional de las simulaciones y acelerando el entrenamiento sin comprometer el rendimiento.

Yixiu Mao, Yun Qu, Qi Wang, Heming Zou, Xiangyang Ji2026-03-12🤖 cs.LG

Ergodicity in reinforcement learning

Este artículo examina cómo los procesos de recompensa no ergódicos hacen que la optimización del valor esperado sea inadecuada para el rendimiento individual en el aprendizaje por refuerzo, relacionando este concepto con las cadenas de Markov ergódicas y presentando soluciones para maximizar el rendimiento a largo plazo en trayectorias individuales.

Dominik Baumann, Erfaun Noorani, Arsenii Mustafin, Xinyi Sheng, Bert Verbruggen, Arne Vanhoyweghen, Vincent Ginis, Thomas B. Schön2026-03-12🤖 cs.LG

LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation

LookaheadKV es un marco de expulsión de caché KV ligero que, al predecir puntuaciones de importancia futuras mediante módulos eficientes en lugar de generar borradores explícitos, logra una alta precisión y reduce el costo de expulsión hasta 14,5 veces en comparación con métodos anteriores.

Jinwoo Ahn, Ingyu Seong, Akhil Kedia, Junhan Kim, Hyemi Jang, Kangwook Lee, Yongkweon Jeon2026-03-12🤖 cs.LG

NCAA Bracket Prediction Using Machine Learning and Combinatorial Fusion Analysis

Este artículo presenta un nuevo enfoque para predecir los resultados del torneo de la NCAA utilizando Análisis de Fusión Combinatoria (CFA), logrando una precisión del 74,60% que supera a los diez sistemas de clasificación públicos más populares.

Yuanhong Wu, Isaiah Smith, Tushar Marwah, Michael Schroeter, Mohamed Rahouti, D. Frank Hsu2026-03-12🤖 cs.LG

ECoLAD: Deployment-Oriented Evaluation for Automotive Time-Series Anomaly Detection

El artículo presenta ECoLAD, un protocolo de evaluación orientado a la implementación que demuestra cómo, bajo las restricciones de recursos de los vehículos, los detectores de anomalías clásicos y ligeros mantienen su viabilidad y rendimiento, mientras que varios métodos profundos pierden factibilidad antes de perder precisión.

Kadir-Kaan Özer, René Ebeling, Markus Enzweiler2026-03-12🤖 cs.LG

Historical Consensus: Preventing Posterior Collapse via Iterative Selection of Gaussian Mixture Priors

Este artículo propone el Entrenamiento de Consenso Histórico, un método iterativo que selecciona mezclas gaussianas para crear una barrera de estabilidad que elimina por completo el colapso posterior en los autoencoders variacionales sin requerir restricciones arquitectónicas ni ajustes de hiperparámetros.

Zegu Zhang, Jian Zhang2026-03-12🤖 cs.LG

Quantifying Membership Disclosure Risk for Tabular Synthetic Data Using Kernel Density Estimators

Este trabajo propone un método práctico basado en estimadores de densidad de núcleo (KDE) para cuantificar el riesgo de divulgación de pertenencia en datos sintéticos tabulares, demostrando mediante evaluaciones empíricas que supera a enfoques anteriores al permitir una caracterización precisa del riesgo sin necesidad de modelos sombra computacionalmente costosos.

Rajdeep Pathak, Sayantee Jana2026-03-12📊 stat

← Anterior Siguiente →

cs.LG