Online Minimization of Polarization and Disagreement via Low-Rank Matrix Bandits

Este artículo propone un algoritmo de dos etapas basado en bandas de matrices de bajo rango para minimizar la polarización y el desacuerdo en el modelo de dinámica de opiniones de Friedkin-Johnsen en un entorno en línea donde las opiniones innatas son desconocidas, logrando un arrepentimiento acumulado sublineal y superando significativamente a las líneas base existentes.

Federico Cinus, Yuko Kuroki, Atsushi Miyauchi, Francesco Bonchi2026-03-09🤖 cs.LG

Self-Speculative Masked Diffusions

El artículo presenta las "Self-Speculative Masked Diffusions", un nuevo modelo de difusión enmascarada para datos discretos que reduce a la mitad las evaluaciones de red neuronal necesarias para generar muestras de alta calidad en tareas como modelado de texto y secuencias de proteínas, mediante la implementación de un mecanismo de muestreo especulativo integrado que permite predicciones no factorizadas en una sola pasada.

Andrew Campbell, Valentin De Bortoli, Jiaxin Shi, Arnaud Doucet2026-03-09🤖 cs.LG

Decoding Partial Differential Equations: Cross-Modal Adaptation of Decoder-only Models to PDEs

Este artículo demuestra que, aunque los modelos de lenguaje decodificador-only son inferiores a los codificador-only para la adaptación a ecuaciones diferenciales parciales, se puede cerrar esta brecha de rendimiento mediante dos nuevas técnicas que imitan la bidireccionalidad: "Parallel Flipping" y "Sequence Doubling".

Paloma García-de-Herreros, Philipp Slusallek, Dietrich Klakow, Vagrant Gautam2026-03-09🤖 cs.LG

How Reliable is Language Model Micro-Benchmarking?

Este estudio demuestra que los micro-benchmarks actuales a menudo no logran clasificar modelos de lenguaje de manera fiable, especialmente cuando sus diferencias de rendimiento son pequeñas, y revela que se requieren cientos de ejemplos para lograr una consistencia comparable a la de las evaluaciones completas, lo que hace que el muestreo aleatorio sea una alternativa competitiva.

Gregory Yauney, Shahzaib Saqib Warraich, Swabha Swayamdipta2026-03-09🤖 cs.LG

Escaping Model Collapse via Synthetic Data Verification: Near-term Improvements and Long-term Convergence

Este artículo demuestra teórica y empíricamente que inyectar información mediante un verificador externo de datos sintéticos (humano o modelo superior) previene el colapso del modelo durante el reentrenamiento iterativo, logrando mejoras a corto plazo que convergen a largo plazo hacia el "centro de conocimiento" del verificador.

Bingji Yi, Qiyuan Liu, Yuwei Cheng, Haifeng Xu2026-03-09🤖 cs.LG

KLASS: KL-Guided Fast Inference in Masked Diffusion Models

El artículo presenta KLASS, un método de muestreo rápido y adaptable que acelera significativamente la inferencia en modelos de difusión enmascarados mediante la identificación de predicciones estables basadas en la divergencia KL, logrando mejoras de velocidad y rendimiento en diversas tareas de generación sin necesidad de entrenamiento adicional.

Seo Hyun Kim, Sunwoo Hong, Hojung Jung, Youngrok Park, Se-Young Yun2026-03-09🤖 cs.LG

FireScope: Wildfire Risk Prediction with a Chain-of-Thought Oracle

El artículo presenta FireScope, un marco basado en modelos de lenguaje visual que utiliza razonamiento tipo "cadena de pensamiento" para predecir mapas de riesgo de incendios forestales con alta generalización entre continentes, respaldado por el nuevo conjunto de datos y benchmark FireScope-Bench.

Mario Markov (INSAIT, Sofia University "St. Kliment Ohridski"), Stefan Maria Ailuro (INSAIT, Sofia University "St. Kliment Ohridski"), Luc Van Gool (INSAIT, Sofia University "St. Kliment Ohridski"), Konrad Schindler (ETH Zurich), Danda Pani Paudel (INSAIT, Sofia University "St. Kliment Ohridski")2026-03-09🤖 cs.LG

EgoCogNav: Cognition-aware Human Egocentric Navigation

El artículo presenta EgoCogNav, un marco de navegación egocéntrica multimodal que predice la incertidumbre percibida y fusiona características de la escena con señales sensoriales para anticipar trayectorias y movimientos de la cabeza, acompañado de la introducción del nuevo conjunto de datos CEN para investigar comportamientos de navegación humana en entornos reales.

Zhiwen Qiu, Ziang Liu, Wenqian Niu, Tapomayukh Bhattacharjee, Saleh Kalantari2026-03-09🤖 cs.LG

SPINE: Token-Selective Test-Time Reinforcement Learning with Entropy-Band Regularization

El paper presenta SPINE, un marco de aprendizaje por refuerzo en tiempo de prueba que selecciona tokens de alta entropía críticos para la toma de decisiones y aplica una regularización basada en bandas de entropía para evitar el colapso de las respuestas y mejorar el rendimiento en modelos de lenguaje grandes y multimodales sin necesidad de etiquetas.

Jianghao Wu, Yasmeen George, Jin Ye, Yicheng Wu, Daniel F. Schmidt, Jianfei Cai2026-03-09🤖 cs.LG

DAISI: Data Assimilation with Inverse Sampling using Stochastic Interpolants

El artículo presenta DAISI, un algoritmo de filtrado escalable basado en modelos generativos que supera las limitaciones de los métodos clásicos de asimilación de datos al utilizar un prior generativo preentrenado combinado con pasos de muestreo inverso y guiado para manejar dinámicas complejas y observaciones no lineales sin necesidad de reentrenamiento.

Martin Andrae, Erik Larsson, So Takao, Tomas Landelius, Fredrik Lindsten2026-03-09🤖 cs.LG

Whatever Remains Must Be True: Filtering Drives Reasoning in LLMs, Shaping Diversity

Este trabajo propone un método que utiliza la familia de divergencias α\alpha para aproximar una distribución objetivo filtrada, permitiendo controlar explícitamente la compensación entre precisión y diversidad en modelos de lenguaje grandes y superando a los enfoques anteriores en cobertura sin sacrificar el rendimiento en la resolución de problemas de razonamiento.

Germán Kruszewski, Pierre Erbacher, Jos Rozen, Marc Dymetman2026-03-09🤖 cs.AI

DFIR-DETR: Frequency-Domain Iterative Refinement and Dynamic Feature Aggregation for Small Object Detection

El artículo presenta DFIR-DETR, un detector basado en transformadores que mejora la detección de objetos pequeños mediante la agregación dinámica de características, una pirámide de características con preservación de normas y un refinamiento iterativo en el dominio de la frecuencia para superar las limitaciones de los métodos actuales.

Bo Gao, Jingcheng Tong, Xingsheng Chen, Han Yu, Zichen Li2026-03-09🤖 cs.LG

Two-dimensional RMSD projections for reaction path visualization and validation

Este artículo presenta un método de visualización que proyecta las trayectorias de reacción en un plano bidimensional basado en la desviación cuadrática media (RMSD) corregida por permutación, superando las limitaciones de los análisis unidimensionales tradicionales para permitir una comparación más efectiva de diferentes métodos de optimización y validar rutas de reacción complejas.

Rohit Goswami2026-03-09🔬 cond-mat.mtrl-sci