HGT-Scheduler: Deep Reinforcement Learning for the Job Shop Scheduling Problem via Heterogeneous Graph Transformers

Este artículo presenta el HGT-Scheduler, un marco de aprendizaje por refuerzo que utiliza Transformadores de Grafos Heterogéneos para modelar el problema de la programación de trabajos (JSSP) como un grafo heterogéneo, logrando así capturar patrones relacionales específicos del tipo de arista y superar a los enfoques de grafos homogéneos en la obtención de políticas de programación efectivas.

Bulent Soykan2026-03-10🤖 cs.LG

Physics-Informed Diffusion Model for Generating Synthetic Extreme Rare Weather Events Data

Este artículo presenta un modelo de difusión informado por física basado en Context-UNet que genera imágenes satelitales sintéticas de eventos meteorológicos extremos y raros, condicionadas a parámetros atmosféricos clave, para mitigar la escasez de datos y mejorar la detección de ciclones tropicales de rápida intensificación.

Marawan Yakout, Tannistha Maiti, Monira Majhabeen, Tarry Singh2026-03-10🤖 cs.LG

Best-of-Tails: Bridging Optimism and Pessimism in Inference-Time Alignment

El artículo presenta Best-of-Tails (BoT), un marco de alineación en tiempo de inferencia que adapta dinámicamente su estrategia entre enfoques optimistas y pesimistas basándose en la heaviness de la cola de la distribución de recompensas, utilizando el estimador de Hill y la divergencia de Tsallis para mejorar el rendimiento en diversas tareas de razonamiento y preferencias humanas.

Hsiang Hsu, Eric Lei, Chun-Fu Chen2026-03-10🤖 cs.LG

NEST: Network- and Memory-Aware Device Placement For Distributed Deep Learning

El artículo presenta NEST, un marco de colocación de dispositivos consciente de la red, la memoria y la computación que unifica el paralelismo de modelos y la viabilidad de memoria mediante programación dinámica estructurada, logrando un mayor rendimiento y escalabilidad en comparación con las soluciones existentes para el entrenamiento distribuido de aprendizaje profundo.

Irene Wang, Vishnu Varma Venkata, Arvind Krishnamurthy, Divya Mahajan2026-03-10🤖 cs.LG

CREDO: Epistemic-Aware Conformalized Credal Envelopes for Regression

El artículo presenta CREDO, un método que combina la construcción de envolventes credales interpretables para capturar la incertidumbre epistémica con la calibración conformalizada para garantizar una cobertura válida, logrando intervalos de predicción en regresión que son tanto eficientes como interpretables.

Luben M. C. Cabezas, Sabina J. Sloman, Bruno M. Resende, Fanyi Wu, Michele Caprio, Rafael Izbicki2026-03-10🤖 cs.LG

Joint 3D Gravity and Magnetic Inversion via Rectified Flow and Ginzburg-Landau Guidance

Este artículo presenta un marco novedoso para la inversión conjunta de gravedad y magnetismo 3D que reformula el problema como un flujo rectificado sobre el conjunto de datos Noddyverse, incorpora un regularizador de Ginzburg-Landau para la identificación de minerales y propone una metodología de guía plug-and-play para capturar la distribución completa de soluciones en lugar de un único resultado determinista.

Dhruman Gupta (Ashoka University), Yashas Shende (Ashoka University), Aritra Das (Ashoka University), Chanda Grover Kamra (Ashoka University), Debayan Gupta (Ashoka University)2026-03-10🤖 cs.LG

Contextual Counterfactual Credit Assignment for Multi-Agent Reinforcement Learning in LLM Collaboration

El artículo presenta \textbf{\texttt{C3}}, un método de asignación de crédito contrafactual contextual que mejora el aprendizaje por refuerzo multiagente impulsado por LLMs al aislar el impacto causal de mensajes individuales mediante reproductores de continuación fija y una línea base de exclusión, logrando así una asignación de crédito más precisa y un mejor rendimiento en tareas de colaboración.

Yanjun Chen, Yirong Sun, Hanlin Wang, Xinming Zhang, Xiaoyu Shen, Wenjie Li, Wei Zhang2026-03-10🤖 cs.LG

IGLU: The Integrated Gaussian Linear Unit Activation Function

El artículo presenta IGLU, una nueva función de activación paramétrica basada en una mezcla de escalas de puertas GELU que utiliza una distribución de cola pesada (Cauchy) para garantizar gradientes no nulos y mejorar la robustez en datos desbalanceados, junto con una aproximación computacionalmente eficiente (IGLU-Approx) que logra un rendimiento competitivo o superior al de ReLU y GELU en tareas de visión y lenguaje con menor costo computacional.

Mingi Kang, Zai Yang, Jeova Farias Sales Rocha Neto2026-03-10🤖 cs.LG

Symmetry-Constrained Language-Guided Program Synthesis for Discovering Governing Equations from Noisy and Partial Observations

El marco SymLang integra gramáticas restringidas por simetría, síntesis de programas guiada por modelos de lenguaje y selección de modelos bayesiana regularizada por MDL para descubrir ecuaciones gobernantes interpretables y físicamente consistentes a partir de observaciones ruidosas y parciales, logrando una recuperación estructural exacta del 83,7% en sistemas dinámicos diversos.

Mirza Samad Ahmed Baig, Syeda Anshrah Gillani2026-03-10🤖 cs.LG

Physics-informed AI Accelerated Retention Analysis of Ferroelectric Vertical NAND: From Day-Scale TCAD to Second-Scale Surrogate Model

Este estudio presenta un modelo sustituto de inteligencia artificial basado en operadores neuronales informados por física (PINO) que acelera más de 10.000 veces el análisis de retención de datos en NAND vertical ferroeléctrica (Fe-VNAND) en comparación con las herramientas TCAD tradicionales, manteniendo la precisión física necesaria para la optimización de dispositivos.

Gyujun Jeong (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Sungwon Cho (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Minji Shon (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Namhoon Kim (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Woohyun Hwang (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Kwangyou Seo (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Suhwan Lim (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Wanki Kim (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Daewon Ha (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Prasanna Venkatesan (NVIDIA, Santa Clara, CA, USA), Kihang Youn (NVIDIA, Santa Clara, CA, USA), Ram Cherukuri (NVIDIA, Santa Clara, CA, USA), Yiyi Wang (NVIDIA, Santa Clara, CA, USA), Suman Datta (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Asif Khan (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Shimeng Yu (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA)2026-03-10🤖 cs.LG

Single-pass Possibilistic Clustering with Damped Window Footprints

Este artículo presenta un algoritmo de agrupamiento posibilista de paso único (SPC) diseñado para datos en flujo, que destaca por su capacidad para modelar agrupamientos no esféricos, realizar actualizaciones de huellas en ventanas amortiguadas mediante fórmulas cerradas y fusionar estimaciones de media y covarianza utilizando la unión de covarianzas, demostrando un rendimiento superior en pureza y mutua información normalizada frente a otros algoritmos de agrupamiento en flujo.

Jeffrey Dale, James Keller, Aquila Galusha2026-03-10🤖 cs.LG

Learning From Design Procedure To Generate CAD Programs for Data Augmentation

Este trabajo propone un nuevo paradigma de aumento de datos que utiliza modelos de lenguaje grandes para generar programas de CAD condicionados a superficies de referencia y procedimientos de modelado, logrando así crear modelos con mayor diversidad geométrica y mayor similitud con diseños industriales de grado profesional.

Yan-Ying Chen, Dule Shu, Matthew Hong, Andrew Taber, Jonathan Li, Matthew Klenk2026-03-10🤖 cs.LG

Fairness May Backfire: When Leveling-Down Occurs in Fair Machine Learning

Este artículo establece que, aunque la equidad algorítmica en modelos que utilizan atributos sensibles mejora inevitablemente los resultados del grupo desfavorecido, la imposición de restricciones de equidad en modelos ciegas a estos atributos puede generar efectos adversos o "nivelación hacia abajo" para ambos grupos dependiendo de la distribución de los datos y la presencia de candidatos ocultos.

Yi Yang, Xiangyu Chang, Pei-yu Chen2026-03-10🤖 cs.LG