cs.LG artículos | Gist.Science

CLoE: Expert Consistency Learning for Missing Modality Segmentation

El artículo presenta CLoE, un marco de aprendizaje de consistencia que mejora la segmentación de imágenes médicas multimodales con modalidades faltantes al controlar la concordancia entre expertos a nivel de decisión y región, asignando pesos de fiabilidad dinámicos para lograr una fusión robusta y generalizable.

Xinyu Tong, Meihua Zhou, Bowu Fan, Haitao Li2026-03-11🤖 cs.AI

Reward-Zero: Language Embedding Driven Implicit Reward Mechanisms for Reinforcement Learning

El artículo presenta Reward-Zero, un mecanismo de recompensa implícita general que utiliza incrustaciones de lenguaje para convertir descripciones de tareas en señales de progreso densas y semánticamente alineadas, acelerando la exploración y mejorando la generalización en el aprendizaje por refuerzo sin necesidad de ingeniería de recompensas específica.

Heng Zhang, Haddy Alchaer, Arash Ajoudani, Yu She2026-03-11🤖 cs.LG

TA-GGAD: Testing-time Adaptive Graph Model for Generalist Graph Anomaly Detection

El artículo presenta TA-GGAD, un modelo gráfico adaptativo de tiempo de prueba que aborda el problema de la disortividad de anomalías ( $\mathcal{AD}$ ) para lograr una detección generalista de anomalías con alto rendimiento en múltiples dominios tras una única fase de entrenamiento.

Xiong Zhang, Hong Peng, Changlong Fu, Xin Jin, Yun Yang, Cheng Xie2026-03-11🤖 cs.AI

Interactive 3D visualization of surface roughness predictions in additive manufacturing: A data-driven framework

Este artículo presenta un marco de trabajo basado en datos que combina un modelo de red neuronal con generación sintética de datos y una interfaz web interactiva para predecir y visualizar en 3D la rugosidad superficial en la fabricación aditiva por extrusión de material, permitiendo una planificación de procesos optimizada antes de la impresión.

Engin Deniz Erkan, Elif Surer, Ulas Yaman2026-03-11🤖 cs.LG

Democratising Clinical AI through Dataset Condensation for Classical Clinical Models

Este artículo presenta un marco de optimización de orden cero con privacidad diferencial que extiende la condensación de datos a modelos clínicos no diferenciables, permitiendo compartir conjuntos de datos sintéticos compactos que preservan la utilidad predictiva sin exponer información sensible de los pacientes.

Anshul Thakur, Soheila Molaei, Pafue Christy Nganjimi, Joshua Fieggen, Andrew A. S. Soltan, Danielle Belgrave, Lei Clifton, David A. Clifton2026-03-11🤖 cs.AI

From Representation to Clusters: A Contrastive Learning Approach for Attributed Hypergraph Clustering

El artículo presenta CAHC, un método de aprendizaje contrastivo de extremo a extremo para el agrupamiento de hipergrafos atribuidos que optimiza simultáneamente la representación de nodos y la asignación de clústeres mediante objetivos a nivel de nodo e hiperborde, superando a los métodos existentes en múltiples conjuntos de datos.

Li Ni, Shuaikang Zeng, Lin Mu, Longlong Lin2026-03-11🤖 cs.LG

Flow Field Reconstruction via Voronoi-Enhanced Physics-Informed Neural Networks with End-to-End Sensor Placement Optimization

Este estudio presenta VSOPINN, un marco de redes neuronales informadas por física que integra la optimización de colocación de sensores mediante teselación de Voronoi para lograr una reconstrucción precisa y robusta de campos de flujo bajo mediciones escasas y fallos de sensores.

Renjie Xiao, Bingteng Sun, Yiling Chen, Lin Lu, Qiang Du, Junqiang Zhu2026-03-11🤖 cs.LG

SPAARS: Safer RL Policy Alignment through Abstract Exploration and Refined Exploitation of Action Space

SPAARS es un marco de aprendizaje curricular para el aprendizaje por refuerzo offline-a-online que mejora la seguridad y la eficiencia de las muestras al explorar inicialmente en un espacio latente de baja dimensión y luego transferir el control al espacio de acciones crudo, superando así las limitaciones de rendimiento de los métodos basados en decodificadores.

Swaminathan S K, Aritra Hazra2026-03-11🤖 cs.AI

Reviving ConvNeXt for Efficient Convolutional Diffusion Models

Este artículo presenta el modelo de difusión totalmente convolucional (FCDM), una arquitectura basada en ConvNeXt que demuestra ser una alternativa altamente eficiente y competitiva a los modelos basados en transformadores, logrando un rendimiento comparable con la mitad de las operaciones de punto flotante, menos pasos de entrenamiento y la capacidad de entrenarse en sistemas de solo 4 GPUs.

Taesung Kwon, Lorenzo Bianchi, Lennart Wittke, Felix Watine, Fabio Carrara, Jong Chul Ye, Romann Weber, Vinicius Azevedo2026-03-11🤖 cs.AI

Reconstructing Movement from Sparse Samples: Enhanced Spatio-Temporal Matching Strategies for Low-Frequency Data

Este artículo propone y evalúa cuatro mejoras al algoritmo de coincidencia espaciotemporal para el mapeo de trayectorias GPS en redes viales, logrando mayores eficiencias computacionales y precisión en entornos urbanos densos mediante el uso de datos reales de Milán.

Ali Yousefian, Arianna Burzacchi, Simone Vantini2026-03-11🤖 cs.LG

Impact of Markov Decision Process Design on Sim-to-Real Reinforcement Learning

Este trabajo demuestra que el diseño cuidadoso del Proceso de Decisión de Markov, especialmente mediante el uso de modelos de dinámica basados en la física, es crucial para cerrar la brecha sim-real y lograr un control exitoso en procesos industriales físicos.

Tatjana Krau, Jorge Mandlmaier, Tobias Damm, Frieder Heieck2026-03-11🤖 cs.LG

From Weighting to Modeling: A Nonparametric Estimator for Off-Policy Evaluation

Este artículo presenta un nuevo enfoque de evaluación de políticas fuera de línea en banditos contextuales que combina un método de ponderación no paramétrica con predicciones de recompensas para lograr estimaciones de valor con menor varianza y sesgo reducido en comparación con las técnicas existentes.

Rong J. B. Zhu2026-03-11🤖 cs.LG

Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers

El artículo presenta VMoER, un enfoque bayesiano escalable que integra la cuantificación de incertidumbre en las capas de Mezcla de Expertos (MoE) de los modelos fundacionales mediante la inferencia variacional en la etapa de enrutamiento, logrando una mejora significativa en la estabilidad, calibración y detección de datos fuera de distribución con un costo computacional marginal.

Albus Yizhuo Li, Matthew Wicker2026-03-11🤖 cs.AI

Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection

Este artículo presenta tcNF, un marco novedoso de flujos normalizadores condicionados temporalmente que mejora la detección de anomalías en series temporales multivariadas al modelar con precisión las dependencias temporales y la incertidumbre mediante un enfoque autoregresivo.

David Baumgartner, Helge Langseth, Kenth Engø-Monsen, Heri Ramampiaro2026-03-11🤖 cs.AI

TrainDeeploy: Hardware-Accelerated Parameter-Efficient Fine-Tuning of Small Transformer Models at the Extreme Edge

El artículo presenta TrainDeeploy, un marco que habilita la primera canalización completa de entrenamiento y ajuste fino en el dispositivo para modelos Transformer y CNN en chips de ultra bajo consumo, logrando una adaptación eficiente en el extremo mediante estrategias como LoRA que reducen significativamente el uso de memoria y el volumen de transferencia de datos.

Run Wang, Victor J. B. Jung, Philip Wiese, Francesco Conti, Alessio Burrello, Luca Benini2026-03-11🤖 cs.LG

You Didn't Have to Say It like That: Subliminal Learning from Faithful Paraphrases

El estudio demuestra que los modelos de lenguaje pueden adquirir subliminalmente preferencias de un modelo generador a través de parafraseos fieles, incluso cuando el contenido semántico es irrelevante o contradice explícitamente dicha preferencia, lo que revela una vulnerabilidad crítica en los pipelines de entrenamiento con datos sintéticos que no puede detectarse mediante inspección de contenido.

Isaia Gisler (ETH Zürich), Zhonghao He (University of Cambridge), Tianyi Qiu (Peking University)2026-03-11🤖 cs.LG

Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation

El artículo presenta EDA, un marco eficiente en parámetros y datos que restaura el rendimiento de la decodificación especulativa en modelos de lenguaje ajustados mediante una arquitectura desacoplada, una estrategia de regeneración de datos y un mecanismo de selección de muestras, logrando así una adaptación rápida y de bajo costo sin necesidad de reentrenamiento completo.

Luxi Lin, Zhihang Lin, Zhanpeng Zeng, Yuhao Chen, Qingyu Zhang, Jixiang Luo, Xuelong Li, Rongrong Ji2026-03-11🤖 cs.AI

What Do We Care About in Bandits with Noncompliance? BRACE: Bandits with Recommendations, Abstention, and Certified Effects

El artículo presenta BRACE, un algoritmo para problemas de banditos con incumplimiento que permite elegir entre optimizar el bienestar de las recomendaciones o el tratamiento, ofreciendo estimaciones de efectos estructurales certificados y válidos incluso en escenarios de identificación débil o heterogeneidad.

Nicolás Della Penna2026-03-11🤖 cs.LG

Compiler-First State Space Duality and Portable $O(1)$ Autoregressive Caching for Inference

Este trabajo demuestra que el algoritmo de dualidad del espacio de estados de Mamba-2 puede implementarse completamente mediante primitivas estándar compiladas por XLA sin kernels personalizados, logrando una inferencia autoregresiva con caché $O(1)$ portátil y de alto rendimiento en CPU, GPU y TPU.

Cosmo Santoni2026-03-11🤖 cs.AI

Learning Bayesian and Markov Networks with an Unreliable Oracle

Este estudio analiza el aprendizaje de la estructura de redes de Markov y bayesianas mediante un oráculo de independencia condicional no fiable, demostrando que las redes de Markov pueden identificarse incluso con un número moderadamente exponencial de errores bajo ciertas condiciones de conectividad, mientras que las redes bayesianas no toleran ningún error para una identificación garantizada, y propone algoritmos para los casos en que la estructura es identificable.

Juha Harviainen, Pekka Parviainen, Vidya Sagar Sharma2026-03-11🤖 cs.LG

← Anterior Siguiente →

cs.LG