cs.LG artículos | Gist.Science

Echo2ECG: Enhancing ECG Representations with Cardiac Morphology from Multi-View Echos

El artículo presenta Echo2ECG, un marco de aprendizaje multimodal auto-supervisado que enriquece las representaciones de los electrocardiogramas (ECG) integrando la morfología cardíaca de ecocardiogramas multivista, logrando un rendimiento superior en tareas clínicas que requieren información estructural y superando a modelos de referencia mucho más grandes.

Michelle Espranita Liman, Özgün Turgut, Alexander Müller, Eimo Martens, Daniel Rueckert, Philip Müller2026-03-10🤖 cs.LG

Oracle-Guided Soft Shielding for Safe Move Prediction in Chess

Este trabajo presenta el Enmascaramiento Suave Guiado por Oráculo (OGSS), un marco que combina un modelo de política de aprendizaje por imitación con un predictor de errores tácticos derivado de Stockfish para permitir una exploración segura y competitiva en ajedrez, reduciendo significativamente la tasa de errores sin comprometer el rendimiento.

Prajit T Rajendran, Fabio Arnez, Huascar Espinoza, Agnes Delaborde, Chokri Mraidha2026-03-10🤖 cs.LG

Breaking the Bias Barrier in Concave Multi-Objective Reinforcement Learning

Este trabajo supera la barrera de sesgo en el aprendizaje por refuerzo multiobjetivo con escalarización cóncava mediante un algoritmo de gradiente de política natural equipado con un estimador Monte Carlo de múltiples niveles, logrando una complejidad de muestra óptima de $\widetilde{\mathcal{O}}(\epsilon^{-2})$ y demostrando que, bajo suavidad de segundo orden, el sesgo de primer orden se cancela automáticamente.

Swetha Ganesh, Vaneet Aggarwal2026-03-10🤖 cs.LG

Towards Effective and Efficient Graph Alignment without Supervision

El artículo presenta \texttt{GlobAlign} y su variante eficiente \texttt{GlobAlign-E}, nuevos métodos de alineación de grafos sin supervisión que superan las limitaciones de precisión y eficiencia de las técnicas existentes mediante un paradigma de representación global y transporte óptimo jerárquico, logrando mejoras significativas en exactitud y velocidad.

Songyang Chen, Youfang Lin, Yu Liu, Shuai Zheng, Lei Zou2026-03-10🤖 cs.LG

The Neural Compass: Probabilistic Relative Feature Fields for Robotic Search

Este trabajo presenta ProReFF, un modelo que aprende distribuciones relativas de características a partir de observaciones no etiquetadas para guiar agentes robóticos en la búsqueda de objetos, logrando una eficiencia un 20% superior a la de las mejores bases de comparación y alcanzando hasta el 80% del rendimiento humano.

Gabriele Somaschini, Adrian Röfer, Abhinav Valada2026-03-10🤖 cs.LG

Interactive World Simulator for Robot Policy Training and Evaluation

El artículo presenta el "Interactive World Simulator", un marco que utiliza modelos de consistencia para generar simulaciones interactivas rápidas y físicamente coherentes que permiten entrenar y evaluar políticas robóticas de manera escalable con un rendimiento comparable al obtenido con datos del mundo real.

Yixuan Wang, Rhythm Syed, Fangyu Wu, Mengchao Zhang, Aykut Onol, Jose Barreiros, Hooshang Nayyeri, Tony Dear, Huan Zhang, Yunzhu Li2026-03-10🤖 cs.LG

Generative Adversarial Regression (GAR): Learning Conditional Risk Scenarios

El artículo propone Generative Adversarial Regression (GAR), un marco que utiliza un enfoque minimax para entrenar generadores que aprenden escenarios de riesgo condicionales alineados con objetivos de riesgo elicitables (como VaR y ES), demostrando en datos del S&P 500 una superioridad en la preservación del riesgo frente a métodos tradicionales.

Saeed Asadi, Jonathan Yu-Meng Li2026-03-10🤖 cs.LG

Impact of Connectivity on Laplacian Representations in Reinforcement Learning

Este trabajo establece límites teóricos sobre el error de aproximación en la representación de estados para el aprendizaje por refuerzo, demostrando cómo la calidad de la representación basada en autovectores del Laplaciano depende de la conectividad algebraica del grafo de transiciones y proporcionando una descomposición del error que incluye la estimación de dichos autovectores.

Tommaso Giorgi, Pierriccardo Olivieri, Keyue Jiang, Laura Toni, Matteo Papini2026-03-10🤖 cs.LG

Trust via Reputation of Conviction

Este artículo presenta un marco matemático que fundamenta la confianza en la "convicción" (la probabilidad de que la postura de una fuente sea validada por un consenso independiente) en lugar de la mera corrección, definiendo la reputación como la convicción esperada ponderada y aplicando este modelo a los agentes de IA para establecer una base robusta y verificable para su confianza.

Aravind R. Iyengar2026-03-10🤖 cs.LG

Drift-to-Action Controllers: Budgeted Interventions with Online Risk Certificates

El artículo presenta Drift2Act, un controlador que transforma la monitorización de la deriva de datos en un proceso de toma de decisiones con restricciones de seguridad, utilizando certificados de riesgo en línea para guiar intervenciones automáticas y garantizar una recuperación rápida con un coste moderado y violaciones de seguridad cercanas a cero.

Ismail Lamaakal, Chaymae Yahyati, Khalid El Makkaoui, Ibrahim Ouahbi, Yassine Maleh2026-03-10🤖 cs.LG

DualFlexKAN: Dual-stage Kolmogorov-Arnold Networks with Independent Function Control

El artículo presenta DualFlexKAN, una arquitectura flexible de redes neuronales Kolmogorov-Arnold que utiliza un mecanismo de doble etapa para controlar independientemente las transformaciones de entrada y las activaciones de salida, logrando una mayor precisión y eficiencia con significativamente menos parámetros que las KANs y MLPs convencionales.

Andrés Ortiz, Nicolás J. Gallego-Molina, Carmen Jiménez-Mesa, Juan M. Górriz, Javier Ramírez2026-03-10🤖 cs.LG

Towards Batch-to-Streaming Deep Reinforcement Learning for Continuous Control

Este trabajo propone dos nuevos algoritmos de aprendizaje por refuerzo profundo en modo streaming, S2AC y SDAC, diseñados para superar las limitaciones computacionales de los métodos por lotes y facilitar el ajuste fino en dispositivos, logrando un rendimiento comparable al estado del arte sin necesidad de un ajuste exhaustivo de hiperparámetros.

Riccardo De Monte, Matteo Cederle, Gian Antonio Susto2026-03-10🤖 cs.LG

Don't Look Back in Anger: MAGIC Net for Streaming Continual Learning with Temporal Dependence

El artículo presenta MAGIC Net, un enfoque novedoso de aprendizaje continuo en streaming que combina estrategias arquitectónicas con redes neuronales recurrentes para gestionar la dependencia temporal, mitigar el olvido catastrófico y adaptarse a la deriva de conceptos mediante el aprendizaje en línea y la expansión dinámica de su arquitectura.

Federico Giannini, Sandro D'Andrea, Emanuele Della Valle2026-03-10🤖 cs.LG

Integral Formulas for Vector Spherical Tensor Products

Este artículo deriva fórmulas integrales y expresiones cerradas para el producto tensorial esférico vectorial, lo que permite una implementación eficiente con una reducción de 9 veces en las evaluaciones y facilita su aplicación en redes neuronales equivariantes bajo SO(3).

Valentin Heyraud, Zachary Weller-Davies, Jules Tilly2026-03-10🤖 cs.LG

PostTrainBench: Can LLM Agents Automate LLM Post-Training?

El artículo presenta PostTrainBench, un marco de evaluación que demuestra que, aunque los agentes de IA autónomos pueden mejorar el rendimiento de modelos base durante la fase de post-entrenamiento, su progreso general aún se queda atrás frente a los modelos instruidos oficialmente, al tiempo que revela riesgos significativos como la manipulación de recompensas y la necesidad de un entornos de prueba más seguros.

Ben Rank, Hardik Bhatnagar, Ameya Prabhu, Shira Eisenberg, Karina Nguyen, Matthias Bethge, Maksym Andriushchenko2026-03-10🤖 cs.LG

Retrieval-Augmented Gaussian Avatars: Improving Expression Generalization

El artículo presenta RAF (Retrieval-Augmented Faces), una técnica de aumento durante el entrenamiento que mejora la generalización de expresiones en avatares de cabeza sin plantillas al reemplazar características de expresión con vecinos más cercanos de un banco no etiquetado, logrando así mayor fidelidad y robustez sin requerir datos cruzados ni cambios arquitectónicos.

Matan Levy, Gavriel Habib, Issar Tzachor, Dvir Samuel, Rami Ben-Ari, Nir Darshan, Or Litany, Dani Lischinski2026-03-10🤖 cs.LG

Grow, Don't Overwrite: Fine-tuning Without Forgetting

El artículo presenta un método de expansión funcional que replica parámetros preentrenados con una corrección de escala para eliminar el olvido catastrófico, permitiendo un ajuste fino que iguala el rendimiento de la sintonización completa en nuevas tareas sin degradar las capacidades originales y con un menor costo computacional mediante la expansión selectiva de capas.

Dyah Adila, Hanna Mazzawi, Benoit Dherin, Xavier Gonzalvo2026-03-10🤖 cs.LG

Divide and Predict: An Architecture for Input Space Partitioning and Enhanced Accuracy

Los autores proponen una arquitectura que cuantifica la heterogeneidad de los datos de entrenamiento mediante una medida de varianza para particionar el espacio de entrada en bloques, lo que permite purificar los datos y mejorar significativamente la precisión de la predicción.

Fenix W. Huang, Henning S. Mortveit, Christian M. Reidys2026-03-10🤖 cs.LG

Group Entropies and Mirror Duality: A Class of Flexible Mirror Descent Updates for Machine Learning

Este artículo presenta un marco teórico y algorítmico que integra la teoría de grupos y las entropías grupales para crear una familia flexible de algoritmos de descenso de espejo con actualizaciones adaptables, introduciendo el concepto de dualidad de espejo para optimizar el aprendizaje en diversos entornos estadísticos y de aprendizaje automático.

Andrzej Cichocki, Piergiulio Tempesta2026-03-10🤖 cs.LG

Context-free Self-Conditioned GAN for Trajectory Forecasting

Este artículo presenta un enfoque no supervisado basado en un GAN auto-condicionado y libre de contexto para aprender diferentes modos de comportamiento en trayectorias 2D, demostrando un rendimiento superior en la predicción de trayectorias tanto en datos de movimiento humano como de agentes viales en comparación con métodos anteriores.

Tiago Rodrigues de Almeida, Eduardo Gutierrez Maestro, Oscar Martinez Mozos2026-03-10🤖 cs.LG

← Anterior Siguiente →