AI-Enhanced Spatial Cellular Traffic Demand Prediction with Contextual Clustering and Error Correction for 5G/6G Planning

Este artículo presenta un marco de inteligencia artificial que mejora la predicción espacial de la demanda de tráfico celular para la planificación de redes 5G/6G mediante una estrategia de división de datos consciente del contexto y corrección de errores residuales, logrando así una mayor generalización espacial y una reducción del error en comparación con métodos tradicionales.

Mohamad Alkadamani, Colin Brown, Halim Yanikomeroglu2026-03-12⚡ eess

ReTabSyn: Realistic Tabular Data Synthesis via Reinforcement Learning

El artículo presenta ReTabSyn, un pipeline de síntesis de datos tabulares basado en aprendizaje por refuerzo que, al priorizar la distribución condicional y ofrecer retroalimentación directa sobre la preservación de correlaciones, supera a los métodos actuales en escenarios con datos limitados, desequilibrados o con cambios de distribución, mejorando así la utilidad de los modelos downstream.

Xiaofeng Lin, Seungbae Kim, Zhuoya Li, Zachary DeSoto, Charles Fleming, Guang Cheng2026-03-12📊 stat

Towards Cold-Start Drafting and Continual Refining: A Value-Driven Memory Approach with Application to NPU Kernel Synthesis

El paper presenta EvoKernel, un marco de agentes autoevolutivos que utiliza un enfoque de memoria basado en valores para superar la escasez de datos en la síntesis de kernels para NPUs, logrando mejorar la precisión de los modelos de 11.0% a 83.0% y acelerar el rendimiento mediante un refinamiento continuo.

Yujie Zheng, Zhuo Li, Shengtao Zhang, Hanjing Wang, Junjie Sheng, Jiaqian Wang, Junchi Yan, Weinan Zhang, Ying Wen, Bo Tang, Muning Wen2026-03-12🤖 cs.LG

V0.5V_{0.5}: Generalist Value Model as a Prior for Sparse RL Rollouts

El artículo presenta V0.5V_{0.5}, un modelo de valor generalista que fusiona adaptativamente una estimación previa con promedios empíricos de rollouts dispersos mediante pruebas estadísticas en tiempo real, logrando una reducción significativa de la varianza y un rendimiento superior en tareas de razonamiento matemático en comparación con métodos como GRPO y DAPO.

Yi-Kai Zhang, Yueqing Sun, Hongyan Hao, Qi Gu, Xunliang Cai, De-Chuan Zhan, Han-Jia Ye2026-03-12🤖 cs.LG

6ABOS: An Open-Source Atmospheric Correction Framework for the EnMAP Hyperspectral Mission Based on 6S

Este artículo presenta 6ABOS, un marco de código abierto basado en Python que automatiza la corrección atmosférica de imágenes hiperespectrales de la misión EnMAP mediante el modelo 6S y la API de Google Earth Engine, demostrando una alta precisión en la recuperación de la reflectancia del agua en embalses mediterráneos.

Gabriel Caballero Cañas, Bárbara Alvado Arranz, Xavier Sòria-Perpinyà, Antonio Ruiz-Verdú, Jesús Delegido, José Moreno2026-03-12🤖 cs.LG

SNPgen: Phenotype-Supervised Genotype Representation and Synthetic Data Generation via Latent Diffusion

El artículo presenta SNPgen, un marco de difusión latente condicional que genera genotipos sintéticos supervisados por fenotipos, logrando un rendimiento predictivo comparable al de datos reales para enfermedades complejas mientras garantiza la privacidad y preserva las estructuras genéticas clave.

Andrea Lampis, Michela Carlotta Massi, Nicola Pirastu, Francesca Ieva, Matteo Matteucci, Emanuele Di Angelantonio2026-03-12🧬 q-bio

Dynamics-Predictive Sampling for Active RL Finetuning of Large Reasoning Models

Este trabajo propone el Muestreo Predictivo de Dinámicas (DPS), un método que utiliza inferencia bayesiana sobre un modelo oculto de Markov para predecir y seleccionar proactivamente los prompts más informativos durante el ajuste fino con aprendizaje por refuerzo de modelos de razonamiento grandes, reduciendo así significativamente el costo computacional de las simulaciones y acelerando el entrenamiento sin comprometer el rendimiento.

Yixiu Mao, Yun Qu, Qi Wang, Heming Zou, Xiangyang Ji2026-03-12🤖 cs.LG

Ergodicity in reinforcement learning

Este artículo examina cómo los procesos de recompensa no ergódicos hacen que la optimización del valor esperado sea inadecuada para el rendimiento individual en el aprendizaje por refuerzo, relacionando este concepto con las cadenas de Markov ergódicas y presentando soluciones para maximizar el rendimiento a largo plazo en trayectorias individuales.

Dominik Baumann, Erfaun Noorani, Arsenii Mustafin, Xinyi Sheng, Bert Verbruggen, Arne Vanhoyweghen, Vincent Ginis, Thomas B. Schön2026-03-12🤖 cs.LG

LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation

LookaheadKV es un marco de expulsión de caché KV ligero que, al predecir puntuaciones de importancia futuras mediante módulos eficientes en lugar de generar borradores explícitos, logra una alta precisión y reduce el costo de expulsión hasta 14,5 veces en comparación con métodos anteriores.

Jinwoo Ahn, Ingyu Seong, Akhil Kedia, Junhan Kim, Hyemi Jang, Kangwook Lee, Yongkweon Jeon2026-03-12🤖 cs.LG

Quantifying Membership Disclosure Risk for Tabular Synthetic Data Using Kernel Density Estimators

Este trabajo propone un método práctico basado en estimadores de densidad de núcleo (KDE) para cuantificar el riesgo de divulgación de pertenencia en datos sintéticos tabulares, demostrando mediante evaluaciones empíricas que supera a enfoques anteriores al permitir una caracterización precisa del riesgo sin necesidad de modelos sombra computacionalmente costosos.

Rajdeep Pathak, Sayantee Jana2026-03-12📊 stat