cs.LG artículos | Gist.Science

Online Minimization of Polarization and Disagreement via Low-Rank Matrix Bandits

Este artículo propone un algoritmo de dos etapas basado en bandas de matrices de bajo rango para minimizar la polarización y el desacuerdo en el modelo de dinámica de opiniones de Friedkin-Johnsen en un entorno en línea donde las opiniones innatas son desconocidas, logrando un arrepentimiento acumulado sublineal y superando significativamente a las líneas base existentes.

Federico Cinus, Yuko Kuroki, Atsushi Miyauchi, Francesco Bonchi2026-03-09🤖 cs.LG

Self-Speculative Masked Diffusions

El artículo presenta las "Self-Speculative Masked Diffusions", un nuevo modelo de difusión enmascarada para datos discretos que reduce a la mitad las evaluaciones de red neuronal necesarias para generar muestras de alta calidad en tareas como modelado de texto y secuencias de proteínas, mediante la implementación de un mecanismo de muestreo especulativo integrado que permite predicciones no factorizadas en una sola pasada.

Andrew Campbell, Valentin De Bortoli, Jiaxin Shi, Arnaud Doucet2026-03-09🤖 cs.LG

TCR-EML: Explainable Model Layers for TCR-pMHC Prediction

El artículo presenta TCR-EML, un modelo de aprendizaje profundo con capas explicables por diseño que integra mecanismos bioquímicos conocidos para predecir con alta precisión y ofrecer interpretaciones claras la unión entre receptores de células T y complejos péptido-MHC.

Jiarui Li, Zixiang Yin, Zhengming Ding, Samuel J. Landry, Ramgopal R. Mettu2026-03-09🤖 cs.LG

Decoding Partial Differential Equations: Cross-Modal Adaptation of Decoder-only Models to PDEs

Este artículo demuestra que, aunque los modelos de lenguaje decodificador-only son inferiores a los codificador-only para la adaptación a ecuaciones diferenciales parciales, se puede cerrar esta brecha de rendimiento mediante dos nuevas técnicas que imitan la bidireccionalidad: "Parallel Flipping" y "Sequence Doubling".

Paloma García-de-Herreros, Philipp Slusallek, Dietrich Klakow, Vagrant Gautam2026-03-09🤖 cs.LG

How Reliable is Language Model Micro-Benchmarking?

Este estudio demuestra que los micro-benchmarks actuales a menudo no logran clasificar modelos de lenguaje de manera fiable, especialmente cuando sus diferencias de rendimiento son pequeñas, y revela que se requieren cientos de ejemplos para lograr una consistencia comparable a la de las evaluaciones completas, lo que hace que el muestreo aleatorio sea una alternativa competitiva.

Gregory Yauney, Shahzaib Saqib Warraich, Swabha Swayamdipta2026-03-09🤖 cs.LG

CanvasMAR: Improving Masked Autoregressive Video Prediction With Canvas

El artículo presenta CanvasMAR, un modelo autoregresivo de predicción de video que mejora la calidad y la coherencia de la generación con pocos pasos mediante la introducción de un "lienzo" global borroso como prior estructurado, un currículo de muestreo de fácil a difícil basado en el movimiento y una guía libre de clasificadores compuesta.

Zian Li, Muhan Zhang2026-03-09🤖 cs.AI

Escaping Model Collapse via Synthetic Data Verification: Near-term Improvements and Long-term Convergence

Este artículo demuestra teórica y empíricamente que inyectar información mediante un verificador externo de datos sintéticos (humano o modelo superior) previene el colapso del modelo durante el reentrenamiento iterativo, logrando mejoras a corto plazo que convergen a largo plazo hacia el "centro de conocimiento" del verificador.

Bingji Yi, Qiyuan Liu, Yuwei Cheng, Haifeng Xu2026-03-09🤖 cs.LG

Mixed Monotonicity Reachability Analysis of Neural ODE: A Trade-Off Between Tightness and Efficiency

Este artículo propone un nuevo método de análisis de alcanzabilidad basado en intervalos para las EDOs neuronales que utiliza técnicas de monotonicidad mixta para lograr un equilibrio entre precisión y eficiencia computacional, haciéndolo especialmente adecuado para aplicaciones de tiempo real y de alta dimensión.

Abdelrahman Sayed Sayed, Pierre-Jean Meyer, Mohamed Ghazel2026-03-09🤖 cs.LG

Real-Time Learning of Predictive Dynamic Obstacle Models for Robotic Motion Planning

Este artículo presenta un marco en línea que utiliza una descomposición de modo dinámico de Hankel modificada para denoificar y predecir en tiempo real las dinámicas no lineales de obstáculos móviles a partir de datos parciales y ruidosos, permitiendo una planificación de movimiento robótico más segura y adaptable.

Stella Kombo, Masih Haseli, Skylar X. Wei, Joel W. Burdick2026-03-09🤖 cs.LG

KLASS: KL-Guided Fast Inference in Masked Diffusion Models

El artículo presenta KLASS, un método de muestreo rápido y adaptable que acelera significativamente la inferencia en modelos de difusión enmascarados mediante la identificación de predicciones estables basadas en la divergencia KL, logrando mejoras de velocidad y rendimiento en diversas tareas de generación sin necesidad de entrenamiento adicional.

Seo Hyun Kim, Sunwoo Hong, Hojung Jung, Youngrok Park, Se-Young Yun2026-03-09🤖 cs.LG

CADM: Cluster-customized Adaptive Distance Metric for Categorical Data Clustering

El artículo propone CADM, una métrica de distancia adaptativa personalizada por clúster para el agrupamiento de datos categóricos y mixtos que considera las distintas distribuciones de atributos en cada grupo, logrando un rendimiento superior en múltiples conjuntos de datos.

Taixi Chen, Yiu-ming Cheung, Yiqun Zhang2026-03-09🤖 cs.LG

FireScope: Wildfire Risk Prediction with a Chain-of-Thought Oracle

El artículo presenta FireScope, un marco basado en modelos de lenguaje visual que utiliza razonamiento tipo "cadena de pensamiento" para predecir mapas de riesgo de incendios forestales con alta generalización entre continentes, respaldado por el nuevo conjunto de datos y benchmark FireScope-Bench.

Mario Markov (INSAIT, Sofia University "St. Kliment Ohridski"), Stefan Maria Ailuro (INSAIT, Sofia University "St. Kliment Ohridski"), Luc Van Gool (INSAIT, Sofia University "St. Kliment Ohridski"), Konrad Schindler (ETH Zurich), Danda Pani Paudel (INSAIT, Sofia University "St. Kliment Ohridski")2026-03-09🤖 cs.LG

EgoCogNav: Cognition-aware Human Egocentric Navigation

El artículo presenta EgoCogNav, un marco de navegación egocéntrica multimodal que predice la incertidumbre percibida y fusiona características de la escena con señales sensoriales para anticipar trayectorias y movimientos de la cabeza, acompañado de la introducción del nuevo conjunto de datos CEN para investigar comportamientos de navegación humana en entornos reales.

Zhiwen Qiu, Ziang Liu, Wenqian Niu, Tapomayukh Bhattacharjee, Saleh Kalantari2026-03-09🤖 cs.LG

SPINE: Token-Selective Test-Time Reinforcement Learning with Entropy-Band Regularization

El paper presenta SPINE, un marco de aprendizaje por refuerzo en tiempo de prueba que selecciona tokens de alta entropía críticos para la toma de decisiones y aplica una regularización basada en bandas de entropía para evitar el colapso de las respuestas y mejorar el rendimiento en modelos de lenguaje grandes y multimodales sin necesidad de etiquetas.

Jianghao Wu, Yasmeen George, Jin Ye, Yicheng Wu, Daniel F. Schmidt, Jianfei Cai2026-03-09🤖 cs.LG

DAISI: Data Assimilation with Inverse Sampling using Stochastic Interpolants

El artículo presenta DAISI, un algoritmo de filtrado escalable basado en modelos generativos que supera las limitaciones de los métodos clásicos de asimilación de datos al utilizar un prior generativo preentrenado combinado con pasos de muestreo inverso y guiado para manejar dinámicas complejas y observaciones no lineales sin necesidad de reentrenamiento.

Martin Andrae, Erik Larsson, So Takao, Tomas Landelius, Fredrik Lindsten2026-03-09🤖 cs.LG

Diffusion Fine-Tuning via Reparameterized Policy Gradient of the Soft Q-Function

El artículo propone SQDF, un método de ajuste fino basado en RL que utiliza un gradiente de política reparametrizado de una función Q suave para alinear modelos de difusión con objetivos específicos, logrando una optimización de recompensas superior sin sacrificar la diversidad ni la naturalidad de las muestras generadas.

Hyeongyu Kang, Jaewoo Lee, Woocheol Shin, Kiyoung Om, Jinkyoo Park2026-03-09🤖 cs.AI

Whatever Remains Must Be True: Filtering Drives Reasoning in LLMs, Shaping Diversity

Este trabajo propone un método que utiliza la familia de divergencias $\alpha$ para aproximar una distribución objetivo filtrada, permitiendo controlar explícitamente la compensación entre precisión y diversidad en modelos de lenguaje grandes y superando a los enfoques anteriores en cobertura sin sacrificar el rendimiento en la resolución de problemas de razonamiento.

Germán Kruszewski, Pierre Erbacher, Jos Rozen, Marc Dymetman2026-03-09🤖 cs.AI

A-3PO: Accelerating Asynchronous LLM Training with Staleness-aware Proximal Policy Approximation

El artículo presenta A-3PO, un método que acelera el entrenamiento asíncrono de modelos de lenguaje grandes al aproximar la política proximal mediante interpolación simple en lugar de calcularla explícitamente, logrando una aceleración de 1.8x sin comprometer el rendimiento.

Xiaocan Li, Shiliang Wu, Zheng Shen2026-03-09🤖 cs.AI

DFIR-DETR: Frequency-Domain Iterative Refinement and Dynamic Feature Aggregation for Small Object Detection

El artículo presenta DFIR-DETR, un detector basado en transformadores que mejora la detección de objetos pequeños mediante la agregación dinámica de características, una pirámide de características con preservación de normas y un refinamiento iterativo en el dominio de la frecuencia para superar las limitaciones de los métodos actuales.

Bo Gao, Jingcheng Tong, Xingsheng Chen, Han Yu, Zichen Li2026-03-09🤖 cs.LG

Two-dimensional RMSD projections for reaction path visualization and validation

Este artículo presenta un método de visualización que proyecta las trayectorias de reacción en un plano bidimensional basado en la desviación cuadrática media (RMSD) corregida por permutación, superando las limitaciones de los análisis unidimensionales tradicionales para permitir una comparación más efectiva de diferentes métodos de optimización y validar rutas de reacción complejas.

Rohit Goswami2026-03-09🔬 cond-mat.mtrl-sci

← Anterior Siguiente →