cs.LG artículos | Gist.Science

How Reliable is Language Model Micro-Benchmarking?

Este estudio demuestra que los micro-benchmarks actuales a menudo no logran clasificar modelos de lenguaje de manera fiable, especialmente cuando sus diferencias de rendimiento son pequeñas, y revela que se requieren cientos de ejemplos para lograr una consistencia comparable a la de las evaluaciones completas, lo que hace que el muestreo aleatorio sea una alternativa competitiva.

Gregory Yauney, Shahzaib Saqib Warraich, Swabha Swayamdipta2026-03-09🤖 cs.LG

CanvasMAR: Improving Masked Autoregressive Video Prediction With Canvas

El artículo presenta CanvasMAR, un modelo autoregresivo de predicción de video que mejora la calidad y la coherencia de la generación con pocos pasos mediante la introducción de un "lienzo" global borroso como prior estructurado, un currículo de muestreo de fácil a difícil basado en el movimiento y una guía libre de clasificadores compuesta.

Zian Li, Muhan Zhang2026-03-09🤖 cs.AI

Escaping Model Collapse via Synthetic Data Verification: Near-term Improvements and Long-term Convergence

Este artículo demuestra teórica y empíricamente que inyectar información mediante un verificador externo de datos sintéticos (humano o modelo superior) previene el colapso del modelo durante el reentrenamiento iterativo, logrando mejoras a corto plazo que convergen a largo plazo hacia el "centro de conocimiento" del verificador.

Bingji Yi, Qiyuan Liu, Yuwei Cheng, Haifeng Xu2026-03-09🤖 cs.LG

Mixed Monotonicity Reachability Analysis of Neural ODE: A Trade-Off Between Tightness and Efficiency

Este artículo propone un nuevo método de análisis de alcanzabilidad basado en intervalos para las EDOs neuronales que utiliza técnicas de monotonicidad mixta para lograr un equilibrio entre precisión y eficiencia computacional, haciéndolo especialmente adecuado para aplicaciones de tiempo real y de alta dimensión.

Abdelrahman Sayed Sayed, Pierre-Jean Meyer, Mohamed Ghazel2026-03-09🤖 cs.LG

Real-Time Learning of Predictive Dynamic Obstacle Models for Robotic Motion Planning

Este artículo presenta un marco en línea que utiliza una descomposición de modo dinámico de Hankel modificada para denoificar y predecir en tiempo real las dinámicas no lineales de obstáculos móviles a partir de datos parciales y ruidosos, permitiendo una planificación de movimiento robótico más segura y adaptable.

Stella Kombo, Masih Haseli, Skylar X. Wei, Joel W. Burdick2026-03-09🤖 cs.LG

KLASS: KL-Guided Fast Inference in Masked Diffusion Models

El artículo presenta KLASS, un método de muestreo rápido y adaptable que acelera significativamente la inferencia en modelos de difusión enmascarados mediante la identificación de predicciones estables basadas en la divergencia KL, logrando mejoras de velocidad y rendimiento en diversas tareas de generación sin necesidad de entrenamiento adicional.

Seo Hyun Kim, Sunwoo Hong, Hojung Jung, Youngrok Park, Se-Young Yun2026-03-09🤖 cs.LG

CADM: Cluster-customized Adaptive Distance Metric for Categorical Data Clustering

El artículo propone CADM, una métrica de distancia adaptativa personalizada por clúster para el agrupamiento de datos categóricos y mixtos que considera las distintas distribuciones de atributos en cada grupo, logrando un rendimiento superior en múltiples conjuntos de datos.

Taixi Chen, Yiu-ming Cheung, Yiqun Zhang2026-03-09🤖 cs.LG

FireScope: Wildfire Risk Prediction with a Chain-of-Thought Oracle

El artículo presenta FireScope, un marco basado en modelos de lenguaje visual que utiliza razonamiento tipo "cadena de pensamiento" para predecir mapas de riesgo de incendios forestales con alta generalización entre continentes, respaldado por el nuevo conjunto de datos y benchmark FireScope-Bench.

Mario Markov (INSAIT, Sofia University "St. Kliment Ohridski"), Stefan Maria Ailuro (INSAIT, Sofia University "St. Kliment Ohridski"), Luc Van Gool (INSAIT, Sofia University "St. Kliment Ohridski"), Konrad Schindler (ETH Zurich), Danda Pani Paudel (INSAIT, Sofia University "St. Kliment Ohridski")2026-03-09🤖 cs.LG

EgoCogNav: Cognition-aware Human Egocentric Navigation

El artículo presenta EgoCogNav, un marco de navegación egocéntrica multimodal que predice la incertidumbre percibida y fusiona características de la escena con señales sensoriales para anticipar trayectorias y movimientos de la cabeza, acompañado de la introducción del nuevo conjunto de datos CEN para investigar comportamientos de navegación humana en entornos reales.

Zhiwen Qiu, Ziang Liu, Wenqian Niu, Tapomayukh Bhattacharjee, Saleh Kalantari2026-03-09🤖 cs.LG

SPINE: Token-Selective Test-Time Reinforcement Learning with Entropy-Band Regularization

El paper presenta SPINE, un marco de aprendizaje por refuerzo en tiempo de prueba que selecciona tokens de alta entropía críticos para la toma de decisiones y aplica una regularización basada en bandas de entropía para evitar el colapso de las respuestas y mejorar el rendimiento en modelos de lenguaje grandes y multimodales sin necesidad de etiquetas.

Jianghao Wu, Yasmeen George, Jin Ye, Yicheng Wu, Daniel F. Schmidt, Jianfei Cai2026-03-09🤖 cs.LG

DAISI: Data Assimilation with Inverse Sampling using Stochastic Interpolants

El artículo presenta DAISI, un algoritmo de filtrado escalable basado en modelos generativos que supera las limitaciones de los métodos clásicos de asimilación de datos al utilizar un prior generativo preentrenado combinado con pasos de muestreo inverso y guiado para manejar dinámicas complejas y observaciones no lineales sin necesidad de reentrenamiento.

Martin Andrae, Erik Larsson, So Takao, Tomas Landelius, Fredrik Lindsten2026-03-09🤖 cs.LG

Diffusion Fine-Tuning via Reparameterized Policy Gradient of the Soft Q-Function

El artículo propone SQDF, un método de ajuste fino basado en RL que utiliza un gradiente de política reparametrizado de una función Q suave para alinear modelos de difusión con objetivos específicos, logrando una optimización de recompensas superior sin sacrificar la diversidad ni la naturalidad de las muestras generadas.

Hyeongyu Kang, Jaewoo Lee, Woocheol Shin, Kiyoung Om, Jinkyoo Park2026-03-09🤖 cs.AI

Whatever Remains Must Be True: Filtering Drives Reasoning in LLMs, Shaping Diversity

Este trabajo propone un método que utiliza la familia de divergencias $\alpha$ para aproximar una distribución objetivo filtrada, permitiendo controlar explícitamente la compensación entre precisión y diversidad en modelos de lenguaje grandes y superando a los enfoques anteriores en cobertura sin sacrificar el rendimiento en la resolución de problemas de razonamiento.

Germán Kruszewski, Pierre Erbacher, Jos Rozen, Marc Dymetman2026-03-09🤖 cs.AI

A-3PO: Accelerating Asynchronous LLM Training with Staleness-aware Proximal Policy Approximation

El artículo presenta A-3PO, un método que acelera el entrenamiento asíncrono de modelos de lenguaje grandes al aproximar la política proximal mediante interpolación simple en lugar de calcularla explícitamente, logrando una aceleración de 1.8x sin comprometer el rendimiento.

Xiaocan Li, Shiliang Wu, Zheng Shen2026-03-09🤖 cs.AI

DFIR-DETR: Frequency-Domain Iterative Refinement and Dynamic Feature Aggregation for Small Object Detection

El artículo presenta DFIR-DETR, un detector basado en transformadores que mejora la detección de objetos pequeños mediante la agregación dinámica de características, una pirámide de características con preservación de normas y un refinamiento iterativo en el dominio de la frecuencia para superar las limitaciones de los métodos actuales.

Bo Gao, Jingcheng Tong, Xingsheng Chen, Han Yu, Zichen Li2026-03-09🤖 cs.LG

Two-dimensional RMSD projections for reaction path visualization and validation

Este artículo presenta un método de visualización que proyecta las trayectorias de reacción en un plano bidimensional basado en la desviación cuadrática media (RMSD) corregida por permutación, superando las limitaciones de los análisis unidimensionales tradicionales para permitir una comparación más efectiva de diferentes métodos de optimización y validar rutas de reacción complejas.

Rohit Goswami2026-03-09🔬 cond-mat.mtrl-sci

Uncertainty-Aware Subset Selection for Robust Visual Explainability under Distribution Shifts

Este artículo presenta un marco que combina la selección de subconjuntos submodulares con la estimación de incertidumbre basada en gradientes para mejorar la robustez y fidelidad de las explicaciones visuales bajo cambios de distribución, sin requerir entrenamiento adicional.

Madhav Gupta, Vishak Prasad C, Ganesh Ramakrishnan2026-03-09🤖 cs.LG

Data-Driven Global Sensitivity Analysis for Engineering Design Based on Individual Conditional Expectations

Este artículo propone un nuevo método de análisis de sensibilidad global basado en las curvas de Expectación Condicional Individual (ICE) para superar las limitaciones de los Gráficos de Dependencia Parcial (PDP) en la presencia de interacciones fuertes, demostrando mediante pruebas matemáticas y casos de estudio en ingeniería que esta aproximación ofrece una visión más rica y precisa de la importancia de las características en modelos de aprendizaje automático.

Pramudita Satria Palar, Paul Saves, Rommel G. Regis, Koji Shimoyama, Shigeru Obayashi, Nicolas Verstaevel, Joseph Morlier2026-03-09🤖 cs.AI

A Novel Patch-Based TDA Approach for Computed Tomography Imaging

Este estudio presenta un nuevo enfoque de análisis de datos topológicos (TDA) basado en parches para imágenes de tomografía computarizada que supera a los métodos tradicionales en precisión y eficiencia computacional, ofreciendo además un paquete de Python para facilitar su implementación.

Dashti A. Ali, Aras T. Asaad, Jacob J. Peoples, Mohammad Hamghalam, Natalie Gangai, Richard K. G. Do, Alice C. Wei, Amber L. Simpson2026-03-09🤖 cs.LG

Understanding and Improving Hyperbolic Deep Reinforcement Learning

Este artículo presenta Hyper++, un agente de aprendizaje por refuerzo profundo en geometría hiperbólica que supera los desafíos de optimización mediante regularización de características, una función de pérdida categórica y capas mejoradas, logrando un entrenamiento estable y un rendimiento superior en entornos como ProcGen y Atari-5.

Timo Klein, Thomas Lang, Andrii Shkabrii, Alexander Sturm, Kevin Sidak, Lukas Miklautz, Claudia Plant, Yllka Velaj, Sebastian Tschiatschek2026-03-09🤖 cs.AI

← Anterior Siguiente →