A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

Este artículo propone un método de programación cuadrática secuencial estocástica con región de confianza y punto interior (TR-IP-SSQP) para resolver problemas de optimización con función objetivo estocástica y restricciones deterministas, demostrando su convergencia casi segura y su rendimiento práctico mediante pruebas en conjuntos de datos estándar y regresión logística.

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad Lavaei2026-03-12🔢 math

Bayesian Hierarchical Models and the Maximum Entropy Principle

Este artículo demuestra que, cuando la distribución previa condicional a los hiperparámetros es una distribución canónica de máxima entropía, la distribución marginal dependiente resultante también posee una propiedad de máxima entropía bajo una restricción diferente sobre la distribución marginal de una función de las cantidades desconocidas, aclarando así la información asumida al asignar un modelo jerárquico bayesiano.

Brendon J. Brewer2026-03-12📊 stat

Improving TabPFN's Synthetic Data Generation by Integrating Causal Structure

Este trabajo mejora la generación de datos tabulares sintéticos del modelo TabPFN integrando la estructura causal mediante condicionamiento basado en grafos acíclicos dirigidos (DAG) y grafos acíclicos dirigidos parcialmente completados (CPDAG), lo que elimina correlaciones espurias y preserva los efectos causales al alinear el orden de generación con las relaciones causales reales.

Davide Tugnoli, Andrea De Lorenzo, Marco Virgolin, Giovanni Cinà2026-03-12🤖 cs.LG

Discovery of a Hematopoietic Manifold in scGPT Yields a Method for Extracting Performant Algorithms from Biological Foundation Model Internals

Este artículo presenta el descubrimiento y la extracción de un algoritmo compacto y de alto rendimiento para el análisis hematopoyético a partir del modelo fundacional scGPT mediante interpretabilidad mecánica, logrando resultados superiores a métodos existentes con una eficiencia computacional y de parámetros significativamente mayor.

Ihor Kendiukhov2026-03-12🧬 q-bio

Robust Post-Training for Generative Recommenders: Why Exponential Reward-Weighted SFT Outperforms RLHF

El artículo demuestra que el ajuste fino supervisado (SFT) ponderado exponencialmente por recompensas es un método post-entrenamiento robusto, escalable y superior al RLHF para sistemas generativos de recomendación, ya que evita el fraude de recompensas, no requiere puntuaciones de propensión y ofrece garantías teóricas de mejora de la política bajo feedback ruidoso.

Keertana Chidambaram, Sanath Kumar Krishnamurthy, Qiuling Xu, Ko-Jen Hsiao, Moumita Bhattacharya2026-03-12🤖 cs.LG

GSVD for Geometry-Grounded Dataset Comparison: An Alignment Angle Is All You Need

Este artículo propone el uso de la descomposición en valores singulares generalizada (GSVD) para comparar conjuntos de datos basándose en su geometría subyacente, derivando una "puntuación angular" interpretable que diagnostica si una muestra se explica mejor por uno u otro conjunto de datos o por ambos.

Eduarda de Souza Marques, Arthur Sobrinho Ferreira da Rocha, Joao Paixao, Heudson Mirandola, Daniel Sadoc Menasche2026-03-12🤖 cs.LG

What do near-optimal learning rate schedules look like?

Este artículo presenta un procedimiento de búsqueda para identificar formas de programación de la tasa de aprendizaje casi óptimas, revelando que el calentamiento y la decadencia son características robustas esenciales, mientras que las familias de programas comunes no son óptimas y la forma ideal depende significativamente de hiperparámetros como la descomposición de pesos.

Hiroki Naganuma, Atish Agarwala, Priya Kasimbeg, George E. Dahl2026-03-12🤖 cs.LG