cs.LG artículos | Gist.Science

HEARTS: Benchmarking LLM Reasoning on Health Time Series

El artículo presenta HEARTS, un nuevo benchmark unificado que evalúa las capacidades de razonamiento jerárquico de los modelos de lenguaje grandes (LLM) sobre series temporales de salud mediante 16 conjuntos de datos y 110 tareas, revelando que estos modelos actuales tienen un rendimiento limitado y dependen de heurísticas simples en comparación con los modelos especializados.

Sirui Li, Shuhan Xiao, Mihir Joshi, Ahmed Metwally, Daniel McDuff, Wei Wang, Yuzhe Yang2026-03-10🤖 cs.LG

RECAP: Local Hebbian Prototype Learning as a Self-Organizing Readout for Reservoir Dynamics

El artículo presenta RECAP, una estrategia de aprendizaje bioinspirada que combina dinámicas de reservorio no entrenadas con un mecanismo de lectura de prototipos hebbianos autoorganizado para lograr una clasificación robusta de imágenes sin necesidad de retropropagación de errores.

Heng Zhang2026-03-10🤖 cs.LG

Roots Beneath the Cut: Uncovering the Risk of Concept Revival in Pruning-Based Unlearning for Diffusion Models

Este artículo revela que el desprendimiento basado en poda en modelos de difusión es vulnerable a la revivificación de conceptos eliminados mediante un ataque de canal lateral que explota las ubicaciones de los pesos podados, demostrando que este método no es inherentemente seguro y proponiendo estrategias de defensa para ocultar dichas ubicaciones.

Ci Zhang, Zhaojun Ding, Chence Yang, Jun Liu, Xiaoming Zhai, Shaoyi Huang, Beiwen Li, Xiaolong Ma, Jin Lu, Geng Yuan2026-03-10🤖 cs.LG

SR-TTT: Surprisal-Aware Residual Test-Time Training

El artículo presenta SR-TTT, un enfoque que mejora los modelos de entrenamiento en tiempo de prueba (TTT) al integrar un mecanismo de memoria residual esparsa y controlada por la pérdida para almacenar tokens altamente sorprendentes, resolviendo así las fallas de recuerdo catastróficas en tareas de recuperación exacta mientras se mantiene una eficiencia de memoria O(1).

Swamynathan V P2026-03-10🤖 cs.LG

Quantum Deep Learning: A Comprehensive Review

Esta revisión exhaustiva define y clasifica el aprendizaje profundo cuántico en cuatro paradigmas, analiza sus fundamentos teóricos, arquitecturas y demostraciones experimentales en diversas plataformas de hardware, evalúa críticamente las ventajas cuánticas y los desafíos de escalabilidad, y ofrece una hoja de ruta para su implementación a gran escala.

Yanjun Ji, Zhao-Yun Chen, Marco Roth, David A. Kreplin, Christian Schiffer, Martin King, Oliver Anton, M. Sahnawaz Alam, Markus Krutzik, Dennis Willsch, Ludwig Mathey, Frank K. Wilhelm, Guo-Ping Guo2026-03-10⚛️ quant-ph

Trust Aware Federated Learning for Secure Bone Healing Stage Interpretation in e-Health

Este artículo presenta un marco de aprendizaje federado consciente de la confianza que utiliza un mecanismo de puntuación adaptativa para filtrar contribuciones de participantes poco fiables en entornos de sensores médicos distribuidos, mejorando así la estabilidad del entrenamiento y la precisión en la interpretación de las etapas de curación ósea.

Paul Shepherd, Tasos Dagiuklas, Bugra Alkan, Joaquim Bastos, Jonathan Rodriguez2026-03-10🤖 cs.LG

HURRI-GAN: A Novel Approach for Hurricane Bias-Correction Beyond Gauge Stations using Generative Adversarial Networks

El artículo presenta HURRI-GAN, un enfoque innovador basado en redes generativas adversarias que corrige los sesgos de los modelos físicos de simulación de huracanes más allá de las estaciones de medición, permitiendo predicciones precisas en tiempo real con menor costo computacional.

Noujoud Nadera, Hadi Majed, Stefanos Giaremis, Rola El Osta, Clint Dawson, Carola Kaiser, Hartmut Kaiser2026-03-10🤖 cs.LG

Geodesic Gradient Descent: A Generic and Learning-rate-free Optimizer on Objective Function-induced Manifolds

Este artículo presenta el descenso de gradiente geodésico (GGD), un optimizador genérico y libre de tasa de aprendizaje que aproxima la geometría local de la función objetivo mediante esferas n-dimensionales para mantener las trayectorias de actualización en la hipersuperficie, logrando reducciones significativas en el error de prueba en comparación con algoritmos clásicos como Adam.

Liwei Hu, Guangyao Li, Wenyong Wang, Xiaoming Zhang, Yu Xiang2026-03-10🤖 cs.LG

How the Graph Construction Technique Shapes Performance in IoT Botnet Detection

Este estudio demuestra que la técnica de construcción de grafos influye significativamente en el rendimiento de la detección de botnets IoT, identificando que el uso de grafos de Gabriel combinados con un autoencoder variacional y una red neuronal de atención gráfica (GAT) logra la mayor precisión (97,56%) en el conjunto de datos N-BaIoT.

Hassan Wasswa, Hussein Abbass, Timothy Lynar2026-03-10🤖 cs.LG

Approximate Nearest Neighbor Search for Modern AI: A Projection-Augmented Graph Approach

Este artículo presenta PAG, un nuevo marco de búsqueda de vecinos más cercanos aproximados que integra proyecciones en índices gráficos para satisfacer las demandas modernas de eficiencia, escalabilidad y actualizaciones en línea, logrando un rendimiento de búsqueda hasta 5 veces superior al de HNSW.

Kejing Lu, Zhenpeng Pan, Jianbin Qin, Yoshiharu Ishikawa, Chuan Xiao2026-03-10🤖 cs.LG

EnsAug: Augmentation-Driven Ensembles for Human Motion Sequence Analysis

El artículo presenta EnsAug, un nuevo paradigma de entrenamiento que supera a los métodos convencionales al utilizar un conjunto de modelos especialistas, cada uno entrenado con una única transformación geométrica distinta, logrando así un rendimiento superior en el análisis de secuencias de movimiento humano y reconocimiento de gestos.

Bikram De, Habib Irani, Vangelis Metsis2026-03-10🤖 cs.LG

HyperTokens: Controlling Token Dynamics for Continual Video-Language Understanding

El artículo presenta HyperTokens, un generador de tokens basado en transformadores que controla dinámicamente la actualización de prompts para el entendimiento continuo de video-lenguaje, logrando una mayor precisión y menor olvido mediante regularizadores inspirados en meta-aprendizaje y supervision multimodal auxiliar.

Toan Nguyen, Yang Liu, Celso De Melo, Flora D. Salim2026-03-10🤖 cs.LG

ERP-RiskBench: Leakage-Safe Ensemble Learning for Financial Risk

Este artículo presenta ERP-RiskBench, un marco experimental reproducible y seguro contra fugas de datos que utiliza un modelo de ensemble de aprendizaje automático para detectar riesgos financieros en sistemas ERP, demostrando que las prácticas rigurosas de validación reducen las estimaciones de rendimiento infladas e identifican las discrepancias en la conciliación de tres vías como los predictores más informativos.

Sanjay Mishra2026-03-10🤖 cs.LG

Unmixing microinfrared spectroscopic images of cross-sections of historical oil paintings

Este artículo presenta un autoencoder CNN no supervisado con una función de pérdida de distancia angular espectral ponderada (WSAD) para realizar la desmezcla ciega de imágenes hiperespectrales de micro-FTIR en secciones transversales de pinturas al óleo históricas, mejorando la interpretación de materiales complejos como se demuestra en un análisis del Políptico de la Adoración del Cordero Místico de los hermanos Van Eyck.

Shivam Pande, Nicolas Nadisic, Francisco Mederos-Henry, Aleksandra Pizurica2026-03-10🤖 cs.LG

GNN For Muon Particle Momentum estimation

Este artículo demuestra que las Redes Neuronales de Grafos (GNN) superan a modelos tradicionales como TabNet en la estimación del momento de partículas muónicas para el experimento CMS del CERN, destacando la importancia de la dimensionalidad de las características de los nodos para la eficiencia del modelo.

Vishak K Bhat, Eric A. F. Reinhardt, Sergei Gleyzer2026-03-10🤖 cs.LG

XAI and Few-shot-based Hybrid Classification Model for Plant Leaf Disease Prognosis

Este trabajo presenta un modelo híbrido de clasificación basado en aprendizaje con pocos ejemplos e inteligencia artificial explicable que integra redes siamesas y prototípicas con Grad-CAM para identificar con alta precisión y transparencia las etapas de enfermedades en hojas de maíz, arroz y trigo, incluso con datos anotados limitados.

Diana Susan Joseph, Pranav M Pawar, Raja Muthalagu, Mithun Mukharjee2026-03-10🤖 cs.LG

Chart Deep Research in LVLMs via Parallel Relative Policy Optimization

Este artículo presenta PRPO, un método de optimización de políticas paralelas que resuelve conflictos en el entrenamiento de modelos visuales para el análisis profundo de gráficos, junto con MCDR-Bench, una nueva plataforma de evaluación objetiva que supera las limitaciones de las técnicas actuales al medir capacidades de razonamiento analítico avanzado.

Jiajin Tang, Gaoyang, Wenjie Wang, Sibei Yang, Xing Chen2026-03-10🤖 cs.LG

One step further with Monte-Carlo sampler to guide diffusion better

Este artículo propone una estrategia plug-and-play que combina un paso de desruido inverso adicional con muestreo Monte-Carlo para reducir errores de estimación y mejorar la calidad de la generación guiada en modelos de difusión basados en ecuaciones diferenciales estocásticas.

Minsi Ren, Wenhao Deng, Ruiqi Feng, Tailin Wu2026-03-10🤖 cs.LG

High-Resolution Image Reconstruction with Unsupervised Learning and Noisy Data Applied to Ion-Beam Dynamics for Particle Accelerators

Este trabajo presenta un marco de aprendizaje no supervisado que utiliza filtrado convolucional y redes neuronales para reconstruir imágenes de haces de iones con alta fidelidad y eliminar el ruido en condiciones de baja relación señal-ruido, permitiendo la detección de estructuras de halo más allá de siete desviaciones estándar sin necesidad de conjuntos de datos de entrenamiento.

Francis Osswald (IPHC), Mohammed Chahbaoui (UNISTRA), Xinyi Liang (SU)2026-03-10🤖 cs.LG

Soft Equivariance Regularization for Invariant Self-Supervised Learning

El artículo propone la Regularización de Equivarianza Suave (SER), un método que desacopla la invariancia y la equivarianza en diferentes capas de la red para mejorar el aprendizaje auto-supervisado, logrando así un rendimiento superior en tareas de clasificación, robustez ante perturbaciones y detección de objetos sin requerir cabezas de predicción auxiliares ni aumentar significativamente el costo computacional.

Joohyung Lee, Changhun Kim, Hyunsu Kim, Kwanhyung Lee, Juho Lee2026-03-10🤖 cs.LG

← Anterior Siguiente →