cs.LG artículos | Gist.Science

HGT-Scheduler: Deep Reinforcement Learning for the Job Shop Scheduling Problem via Heterogeneous Graph Transformers

Este artículo presenta el HGT-Scheduler, un marco de aprendizaje por refuerzo que utiliza Transformadores de Grafos Heterogéneos para modelar el problema de la programación de trabajos (JSSP) como un grafo heterogéneo, logrando así capturar patrones relacionales específicos del tipo de arista y superar a los enfoques de grafos homogéneos en la obtención de políticas de programación efectivas.

Bulent Soykan2026-03-10🤖 cs.LG

SpatialMAGIC: A Hybrid Framework Integrating Graph Diffusion and Spatial Attention for Spatial Transcriptomics Imputation

SpatialMAGIC es un marco híbrido que integra difusión gráfica y atención espacial para imputar datos de transcriptómica espacial, superando a los métodos existentes en precisión de agrupamiento y mejorando la detección de genes biológicamente relevantes mientras preserva la arquitectura tisular.

Sayeem Bin Zaman, Fahim Hafiz, Riasat Azim2026-03-10🤖 cs.LG

xaitimesynth: A Python Package for Evaluating Attribution Methods for Time Series with Synthetic Ground Truth

El artículo presenta xaitimesynth, un paquete de Python de código abierto que facilita la evaluación de métodos de atribución para series temporales mediante la generación de datos sintéticos con verdad fundamental conocida y métricas de localización estandarizadas.

Gregor Baer2026-03-10🤖 cs.LG

Physics-Informed Diffusion Model for Generating Synthetic Extreme Rare Weather Events Data

Este artículo presenta un modelo de difusión informado por física basado en Context-UNet que genera imágenes satelitales sintéticas de eventos meteorológicos extremos y raros, condicionadas a parámetros atmosféricos clave, para mitigar la escasez de datos y mejorar la detección de ciclones tropicales de rápida intensificación.

Marawan Yakout, Tannistha Maiti, Monira Majhabeen, Tarry Singh2026-03-10🤖 cs.LG

Optimistic Policy Regularization

El artículo presenta la Regularización de Política Optimista (OPR), un mecanismo ligero que mejora la eficiencia de muestras y el rendimiento final en aprendizaje por refuerzo profundo al preservar y reforzar las trayectorias históricamente exitosas, superando a métodos de referencia en entornos como Atari y CAGE Challenge 2.

Mai Pham, Vikrant Vaze, Peter Chin2026-03-10🤖 cs.LG

Best-of-Tails: Bridging Optimism and Pessimism in Inference-Time Alignment

El artículo presenta Best-of-Tails (BoT), un marco de alineación en tiempo de inferencia que adapta dinámicamente su estrategia entre enfoques optimistas y pesimistas basándose en la heaviness de la cola de la distribución de recompensas, utilizando el estimador de Hill y la divergencia de Tsallis para mejorar el rendimiento en diversas tareas de razonamiento y preferencias humanas.

Hsiang Hsu, Eric Lei, Chun-Fu Chen2026-03-10🤖 cs.LG

NEST: Network- and Memory-Aware Device Placement For Distributed Deep Learning

El artículo presenta NEST, un marco de colocación de dispositivos consciente de la red, la memoria y la computación que unifica el paralelismo de modelos y la viabilidad de memoria mediante programación dinámica estructurada, logrando un mayor rendimiento y escalabilidad en comparación con las soluciones existentes para el entrenamiento distribuido de aprendizaje profundo.

Irene Wang, Vishnu Varma Venkata, Arvind Krishnamurthy, Divya Mahajan2026-03-10🤖 cs.LG

Multi-Agent Reinforcement Learning with Submodular Reward

Este artículo presenta el primer marco formal para el aprendizaje por refuerzo multiagente cooperativo con recompensas submodulares, proponiendo algoritmos con garantías teóricas que superan la maldición de la dimensionalidad y logran aproximaciones de 1/2 tanto en entornos de dinámica conocida como desconocida.

Wenjing Chen, Chengyuan Qian, Shuo Xing, Yi Zhou, Victoria Crawford2026-03-10🤖 cs.LG

CREDO: Epistemic-Aware Conformalized Credal Envelopes for Regression

El artículo presenta CREDO, un método que combina la construcción de envolventes credales interpretables para capturar la incertidumbre epistémica con la calibración conformalizada para garantizar una cobertura válida, logrando intervalos de predicción en regresión que son tanto eficientes como interpretables.

Luben M. C. Cabezas, Sabina J. Sloman, Bruno M. Resende, Fanyi Wu, Michele Caprio, Rafael Izbicki2026-03-10🤖 cs.LG

Joint 3D Gravity and Magnetic Inversion via Rectified Flow and Ginzburg-Landau Guidance

Este artículo presenta un marco novedoso para la inversión conjunta de gravedad y magnetismo 3D que reformula el problema como un flujo rectificado sobre el conjunto de datos Noddyverse, incorpora un regularizador de Ginzburg-Landau para la identificación de minerales y propone una metodología de guía plug-and-play para capturar la distribución completa de soluciones en lugar de un único resultado determinista.

Dhruman Gupta (Ashoka University), Yashas Shende (Ashoka University), Aritra Das (Ashoka University), Chanda Grover Kamra (Ashoka University), Debayan Gupta (Ashoka University)2026-03-10🤖 cs.LG

Bilateral Trade Under Heavy-Tailed Valuations: Minimax Regret with Infinite Variance

Este trabajo establece la tasa minimax exacta de arrepentimiento para el comercio bilateral contextual con valoraciones de varianza infinita, demostrando que un algoritmo basado en estimación de media truncada logra un rendimiento óptimo que interpola entre la tasa no paramétrica clásica y la tasa lineal trivial según el momento finito $p$ de las valoraciones.

Hangyi Zhao2026-03-10🤖 cs.LG

Contextual Counterfactual Credit Assignment for Multi-Agent Reinforcement Learning in LLM Collaboration

El artículo presenta \textbf{\texttt{C3}}, un método de asignación de crédito contrafactual contextual que mejora el aprendizaje por refuerzo multiagente impulsado por LLMs al aislar el impacto causal de mensajes individuales mediante reproductores de continuación fija y una línea base de exclusión, logrando así una asignación de crédito más precisa y un mejor rendimiento en tareas de colaboración.

Yanjun Chen, Yirong Sun, Hanlin Wang, Xinming Zhang, Xiaoyu Shen, Wenjie Li, Wei Zhang2026-03-10🤖 cs.LG

IGLU: The Integrated Gaussian Linear Unit Activation Function

El artículo presenta IGLU, una nueva función de activación paramétrica basada en una mezcla de escalas de puertas GELU que utiliza una distribución de cola pesada (Cauchy) para garantizar gradientes no nulos y mejorar la robustez en datos desbalanceados, junto con una aproximación computacionalmente eficiente (IGLU-Approx) que logra un rendimiento competitivo o superior al de ReLU y GELU en tareas de visión y lenguaje con menor costo computacional.

Mingi Kang, Zai Yang, Jeova Farias Sales Rocha Neto2026-03-10🤖 cs.LG

Symmetry-Constrained Language-Guided Program Synthesis for Discovering Governing Equations from Noisy and Partial Observations

El marco SymLang integra gramáticas restringidas por simetría, síntesis de programas guiada por modelos de lenguaje y selección de modelos bayesiana regularizada por MDL para descubrir ecuaciones gobernantes interpretables y físicamente consistentes a partir de observaciones ruidosas y parciales, logrando una recuperación estructural exacta del 83,7% en sistemas dinámicos diversos.

Mirza Samad Ahmed Baig, Syeda Anshrah Gillani2026-03-10🤖 cs.LG

Stochastic Attention via Langevin Dynamics on the Modern Hopfield Energy

Este artículo presenta la atención estocástica, un método libre de entrenamiento que utiliza dinámicas de Langevin sobre la energía de Hopfield moderna para controlar la recuperación exacta o la generación abierta mediante la temperatura, logrando mayor novedad y diversidad que los modelos aprendidos sin requerir cambios arquitectónicos.

Abdulrahman Alswaidan, Jeffrey D. Varner2026-03-10🤖 cs.LG

Physics-informed AI Accelerated Retention Analysis of Ferroelectric Vertical NAND: From Day-Scale TCAD to Second-Scale Surrogate Model

Este estudio presenta un modelo sustituto de inteligencia artificial basado en operadores neuronales informados por física (PINO) que acelera más de 10.000 veces el análisis de retención de datos en NAND vertical ferroeléctrica (Fe-VNAND) en comparación con las herramientas TCAD tradicionales, manteniendo la precisión física necesaria para la optimización de dispositivos.

Gyujun Jeong (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Sungwon Cho (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Minji Shon (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Namhoon Kim (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Woohyun Hwang (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Kwangyou Seo (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Suhwan Lim (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Wanki Kim (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Daewon Ha (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Prasanna Venkatesan (NVIDIA, Santa Clara, CA, USA), Kihang Youn (NVIDIA, Santa Clara, CA, USA), Ram Cherukuri (NVIDIA, Santa Clara, CA, USA), Yiyi Wang (NVIDIA, Santa Clara, CA, USA), Suman Datta (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Asif Khan (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Shimeng Yu (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA)2026-03-10🤖 cs.LG

Single-pass Possibilistic Clustering with Damped Window Footprints

Este artículo presenta un algoritmo de agrupamiento posibilista de paso único (SPC) diseñado para datos en flujo, que destaca por su capacidad para modelar agrupamientos no esféricos, realizar actualizaciones de huellas en ventanas amortiguadas mediante fórmulas cerradas y fusionar estimaciones de media y covarianza utilizando la unión de covarianzas, demostrando un rendimiento superior en pureza y mutua información normalizada frente a otros algoritmos de agrupamiento en flujo.

Jeffrey Dale, James Keller, Aquila Galusha2026-03-10🤖 cs.LG

Learning From Design Procedure To Generate CAD Programs for Data Augmentation

Este trabajo propone un nuevo paradigma de aumento de datos que utiliza modelos de lenguaje grandes para generar programas de CAD condicionados a superficies de referencia y procedimientos de modelado, logrando así crear modelos con mayor diversidad geométrica y mayor similitud con diseños industriales de grado profesional.

Yan-Ying Chen, Dule Shu, Matthew Hong, Andrew Taber, Jonathan Li, Matthew Klenk2026-03-10🤖 cs.LG

Fairness May Backfire: When Leveling-Down Occurs in Fair Machine Learning

Este artículo establece que, aunque la equidad algorítmica en modelos que utilizan atributos sensibles mejora inevitablemente los resultados del grupo desfavorecido, la imposición de restricciones de equidad en modelos ciegas a estos atributos puede generar efectos adversos o "nivelación hacia abajo" para ambos grupos dependiendo de la distribución de los datos y la presencia de candidatos ocultos.

Yi Yang, Xiangyu Chang, Pei-yu Chen2026-03-10🤖 cs.LG

XGenBoost: Synthesizing Small and Large Tabular Datasets with XGBoost

El artículo presenta XGenBoost, un enfoque de generación de datos tabulares basado en XGBoost que utiliza un modelo de difusión DDIM para conjuntos pequeños y un modelo autoregresivo jerárquico para conjuntos grandes, logrando superar a los métodos anteriores en síntesis de datos mixtos con menor costo de entrenamiento.

Jim Achterberg, Marcel Haas, Bram van Dijk, Marco Spruit2026-03-10🤖 cs.LG

← Anterior Siguiente →