cs.LG artículos | Gist.Science

Identifying Adversary Characteristics from an Observed Attack

Este artículo presenta un marco de trabajo para identificar las características del atacante a partir de un ataque observado en sistemas de aprendizaje automático, demostrando que, aunque el atacante no es identificable sin información adicional, este enfoque permite seleccionar al atacante más probable para mejorar las estrategias de defensa tanto exógenas como intrínsecas.

Soyon Choi, Scott Alfeld, Meiyi Ma2026-03-09🤖 cs.LG

Making Reconstruction FID Predictive of Diffusion Generation FID

Este artículo propone el FID interpolado (iFID), una métrica sencilla que interpola las representaciones latentes de un VAE y su vecino más cercano, logrando por primera vez una fuerte correlación con el FID de generación de modelos de difusión, a diferencia del FID de reconstrucción tradicional.

Tongda Xu, Mingwei He, Shady Abu-Hussein, Jose Miguel Hernandez-Lobato, Haotian Zhang, Kai Zhao, Chao Zhou, Ya-Qin Zhang, Yan Wang2026-03-09🤖 cs.LG

When Rubrics Fail: Error Enumeration as Reward in Reference-Free RL Post-Training for Virtual Try-On

Este artículo propone el Recuento de Errores Implícito (IEC), un método de aprendizaje por refuerzo sin referencias que enumera y penaliza errores específicos en lugar de depender de rúbricas basadas en respuestas ideales, logrando así un rendimiento superior en la tarea de probador virtual donde existen múltiples soluciones válidas.

Wisdom Ikezogwo, Mehmet Saygin Seyfioglu, Ranjay Krishna, Karim Bouyarmane2026-03-09🤖 cs.AI

The Value of Graph-based Encoding in NBA Salary Prediction

Este artículo demuestra que integrar representaciones vectoriales de un grafo de conocimiento, construido con datos dentro y fuera de la cancha, mejora significativamente la precisión de los modelos de aprendizaje automático para predecir los salarios de los jugadores de la NBA, especialmente en casos donde los enfoques tabulares tradicionales fallan.

Junhao Su, David Grimsman, Christopher Archibald2026-03-09🤖 cs.LG

Reinforcement Learning for Power-Flow Network Analysis

Este artículo presenta un enfoque de aprendizaje por refuerzo que, mediante una función de recompensa probabilística y un espacio de estados diseñado, descubre configuraciones de redes eléctricas con un número de soluciones de flujo de potencia significativamente mayor que el promedio, superando las limitaciones de los algoritmos algebraicos actuales.

Alperen Ergur, Julia Lindberg, Vinny Miller2026-03-09🤖 cs.LG

Improved Scaling Laws via Weak-to-Strong Generalization in Random Feature Ridge Regression

Este artículo demuestra que, mediante regresión de crestas con características aleatorias, un modelo fuerte entrenado con etiquetas imperfectas de un modelo débil puede superar sustancialmente las leyes de escalado de este último, alcanzando incluso tasas óptimas minimax independientemente del rendimiento del profesor.

Diyuan Wu, Lehan Chen, Theodor Misiakiewicz, Marco Mondelli2026-03-09🤖 cs.LG

Parallelization Strategies for Dense LLM Deployment: Navigating Through Application-Specific Tradeoffs and Bottlenecks

Este artículo analiza las estrategias de paralelización para la implementación de modelos de lenguaje grandes (LLM) densos, demostrando que la paralelización tensorial optimiza la latencia mientras que la paralelización de pipeline mejora el rendimiento, permitiendo mediante su combinación un control efectivo sobre el equilibrio entre ambos factores.

Burak Topcu, Musa Oguzhan Cim, Poovaiah Palangappa, Meena Arunachalam, Mahmut Taylan Kandemir2026-03-09🤖 cs.LG

Warm Starting State-Space Models with Automata Learning

Este trabajo demuestra que es posible realizar máquinas de Moore como modelos de espacio de estados, y propone un enfoque híbrido que utiliza el aprendizaje de autómatas simbólicos para inicializar estos modelos, logrando así una convergencia más rápida y una mayor precisión en comparación con la inicialización aleatoria.

William Fishell, Sam Nicholas Kouteili, Mark Santolucito2026-03-09🤖 cs.LG

Random Dot Product Graphs as Dynamical Systems: Limitations and Opportunities

Este artículo establece un marco geométrico basado en haces fibrados principales para analizar las limitaciones y oportunidades de aprender ecuaciones diferenciales que gobiernan la evolución de redes temporales dentro de grafos de producto escalar aleatorio, identificando obstáculos fundamentales como la libertad de gauge y la holonomía no trivial, mientras demuestra que las dinámicas simétricas pueden resolver la ambigüedad de gauge y proponiendo un pipeline constructivo para recuperar campos vectoriales a partir de secuencias de grafos ruidosos.

Giulio Valentino Dalla Riva2026-03-09🤖 cs.LG

The Rise of AI in Weather and Climate Information and its Impact on Global Inequality

El artículo advierte que la rápida adopción de la IA en la ciencia climática, al depender de una infraestructura computacional y de datos concentrada en el Norte Global, corre el riesgo de exacerbar las desigualdades globales y propone un cambio hacia un desarrollo centrado en los datos, infraestructura digital pública y co-producción de conocimiento para democratizar la soberanía tecnológica y garantizar una resiliencia sistémica equitativa.

Amirpasha Mozaffari, Amanda Duarte, Lina Teckentrup, Stefano Materia, Gina E. C. Charnley, Lluis Palma, Eulalia Baulenas Serra, Dragana Bojovic, Paula Checchia, Aude Carreric, Francisco Doblas-Reyes2026-03-09🤖 cs.AI

Unsupervised domain adaptation for radioisotope identification in gamma spectroscopy

Este estudio demuestra que la adaptación de dominio no supervisada, específicamente mediante la minimización de la discrepancia máxima del momento medio (MMD), mejora significativamente la capacidad de generalización de modelos de aprendizaje automático entrenados con datos sintéticos para la identificación de radioisótopos en espectroscopía gamma, permitiendo su despliegue efectivo en entornos operativos reales sin necesidad de datos etiquetados.

Peter Lalor, Ayush Panigrahy, Alex Hagen2026-03-09🤖 cs.LG

Revisiting the (Sub)Optimality of Best-of-N for Inference-Time Alignment

Este trabajo demuestra que la muestreo Best-of-N (BoN) es óptimo en términos estadísticos y computacionales para maximizar la tasa de victorias bajo condiciones realistas, y propone una variante simple que elimina el "reward hacking" manteniendo dicho rendimiento óptimo.

Ved Sriraman, Adam Block2026-03-09🤖 cs.AI

Full Dynamic Range Sky-Modelling For Image Based Lighting

El artículo presenta Icarus, un modelo de cielo todo tiempo basado en aprendizaje profundo que supera las limitaciones de los modelos actuales al generar mapas de entorno de alto rango dinámico completo (FDR) con nubes y posiciones solares controlables, logrando una iluminación basada en imágenes (IBL) con un realismo fotográfico y una precisión de sombras sin precedentes.

Ian J. Maquignaz2026-03-09🤖 cs.LG

MIRACL: A Diverse Meta-Reinforcement Learning for Multi-Objective Multi-Echelon Combinatorial Supply Chain Optimisation

El artículo presenta MIRACL, un marco jerárquico de meta-aprendizaje por refuerzo multiobjetivo que, mediante la descomposición de tareas y una estrategia de adaptación basada en Pareto, logra una generalización eficiente con pocos ejemplos en la optimización de cadenas de suministro multi-nivel, superando a las bases de referencia convencionales en rendimiento y adaptabilidad.

Rifny Rachman, Josh Tingey, Richard Allmendinger, Wei Pan, Pradyumn Shukla, Bahrul Ilmi Nasution2026-03-09🤖 cs.LG

Score-Guided Proximal Projection: A Unified Geometric Framework for Rectified Flow Editing

Este trabajo presenta Score-Guided Proximal Projection (SGPP), un marco geométrico unificado que reformula la edición de flujos rectificados como un problema de optimización proximal para equilibrar la fidelidad y el realismo, superando las limitaciones de los métodos actuales al garantizar la convergencia al modo posterior y ofrecer un control flexible entre la preservación de la identidad y la libertad generativa.

Vansh Bansal, James G Scott2026-03-09🤖 cs.LG

TML-Bench: Benchmark for Data Science Agents on Tabular ML Tasks

Este artículo presenta TML-Bench, un nuevo conjunto de pruebas para evaluar la eficacia y fiabilidad de agentes de IA autónomos en tareas de aprendizaje automático tabular tipo Kaggle, demostrando que el modelo MiniMax-M2.1 obtiene el mejor rendimiento global y que los resultados mejoran con mayores límites de tiempo.

Mykola Pinchuk2026-03-09🤖 cs.AI

Bridging Domains through Subspace-Aware Model Merging

El artículo presenta SCORE, un método de fusión de modelos que mejora la generalización de dominio al resolver conflictos entre subespacios singulares mediante la proyección de matrices de tareas en una base ortogonal compartida.

Levy Chaves, Chao Zhou, Rebekka Burkholz, Eduardo Valle, Sandra Avila2026-03-09🤖 cs.AI

Knowing without Acting: The Disentangled Geometry of Safety Mechanisms in Large Language Models

Este artículo propone la Hipótesis de Seguridad Desentrelazada (DSH), que revela una separación geométrica entre la detección de peligros y la ejecución de denegaciones en los modelos de lenguaje, permitiendo tanto la creación de un benchmark para validar esta disociación como el desarrollo del ataque de borrado de rechazo (REA) que logra tasas de éxito sin precedentes al eliminar quirúrgicamente el mecanismo de denegación.

Jinman Wu, Yi Xie, Shen Lin, Shiqian Zhao, Xiaofeng Chen2026-03-09🤖 cs.AI

First-Order Softmax Weighted Switching Gradient Method for Distributed Stochastic Minimax Optimization with Stochastic Constraints

Este artículo presenta un nuevo método de gradiente conmutativo ponderado por softmax para la optimización minimax estocástica distribuida con restricciones estocásticas, que garantiza una convergencia estable y de alta probabilidad en escenarios de aprendizaje federado con participación parcial, superando las limitaciones de los enfoques tradicionales basados en primal-dual o penalizaciones.

Zhankun Luo, Antesh Upadhyay, Sang Bin Moon, Abolfazl Hashemi2026-03-09🤖 cs.LG

The Coordination Gap: Alternation Metrics for Temporal Dynamics in Multi-Agent Battle of the Exes

Este artículo introduce métricas de alternancia temporalmente sensibles para evaluar la coordinación en juegos multiagente, demostrando que las métricas tradicionales pueden ocultar graves deficiencias en la dinámica temporal al revelar que las políticas aprendidas, a pesar de altos rendimientos agregados, pueden tener un desempeño significativamente inferior al de políticas aleatorias.

Nikolaos Al. Papadopoulos, Konstantinos Psannis2026-03-09🤖 cs.LG

← Anterior Siguiente →