cs.LG artículos | Gist.Science

Estimating condition number with Graph Neural Networks

Este artículo propone un método rápido basado en redes neuronales de grafos para estimar el número de condición de matrices dispersas, el cual logra una aceleración significativa frente a los métodos tradicionales de Hager-Higham y Lanczos gracias a una ingeniería de características eficiente.

Erin Carson, Xinye Chen2026-03-12🤖 cs.LG

Robust Post-Training for Generative Recommenders: Why Exponential Reward-Weighted SFT Outperforms RLHF

El artículo demuestra que el ajuste fino supervisado (SFT) ponderado exponencialmente por recompensas es un método post-entrenamiento robusto, escalable y superior al RLHF para sistemas generativos de recomendación, ya que evita el fraude de recompensas, no requiere puntuaciones de propensión y ofrece garantías teóricas de mejora de la política bajo feedback ruidoso.

Keertana Chidambaram, Sanath Kumar Krishnamurthy, Qiuling Xu, Ko-Jen Hsiao, Moumita Bhattacharya2026-03-12🤖 cs.LG

Taming Score-Based Denoisers in ADMM: A Convergent Plug-and-Play Framework

Este artículo presenta un marco convergente de Plug-and-Play basado en ADMM que integra un nuevo desruidor AC-DC para resolver la discrepancia de variedades y garantizar la convergencia en problemas inversos mediante modelos generativos basados en puntuación.

Rajesh Shrestha, Xiao Fu2026-03-12🤖 cs.LG

GSVD for Geometry-Grounded Dataset Comparison: An Alignment Angle Is All You Need

Este artículo propone el uso de la descomposición en valores singulares generalizada (GSVD) para comparar conjuntos de datos basándose en su geometría subyacente, derivando una "puntuación angular" interpretable que diagnostica si una muestra se explica mejor por uno u otro conjunto de datos o por ambos.

Eduarda de Souza Marques, Arthur Sobrinho Ferreira da Rocha, Joao Paixao, Heudson Mirandola, Daniel Sadoc Menasche2026-03-12🤖 cs.LG

Copula-ResLogit: A Deep-Copula Framework for Unobserved Confounding Effects

El estudio presenta Copula-ResLogit, un marco de modelado conjunto híbrido que combina redes neuronales residuales (ResNet) y modelos de cópula para detectar y mitigar los efectos de variables de confusión no observadas en el análisis de la demanda de transporte, demostrando su eficacia en la reducción de dependencias no causales en dos estudios de caso.

Kimia Kamal, Bilal Farooq2026-03-12🤖 cs.LG

MultiwayPAM: Multiway Partitioning Around Medoids for LLM-as-a-Judge Score Analysis

El artículo presenta MultiwayPAM, un nuevo método de agrupación tensorial diseñado para analizar las puntuaciones de evaluadores LLM, permitiendo identificar simultáneamente la pertenencia a grupos y los medoides en cada dimensión (preguntas, respondientes y evaluadores) para mitigar el costo computacional y revelar sesgos inherentes.

Chihiro Watanabe, Jingyu Sun2026-03-12📊 stat

Quantum entanglement provides a competitive advantage in adversarial games

Este estudio demuestra que el entrelazamiento cuántico proporciona una ventaja competitiva en juegos adversarios de suma cero, permitiendo a agentes híbridos entrenados en Pong superar a sus contrapartes separables y a redes neuronales clásicas al aprender representaciones estructurales distintas de las interacciones entre agentes.

Peiyong Wang, Kieran Hymas, James Quach2026-03-12⚛️ quant-ph

Hybrid Self-evolving Structured Memory for GUI Agents

El artículo presenta HyMEM, una memoria estructurada híbrida y autoevolutiva inspirada en el cerebro humano que combina nodos simbólicos discretos con incrustaciones continuas para mejorar significativamente el rendimiento de los agentes de GUI de código abierto, permitiéndoles igualar o superar a modelos propietarios avanzados.

Sibo Zhu, Wenyi Wu, Kun Zhou, Stephen Wang, Biwei Huang2026-03-12🤖 cs.AI

GaLoRA: Parameter-Efficient Graph-Aware LLMs for Node Classification

El artículo presenta GaLoRA, un marco eficiente en parámetros que integra información estructural en modelos de lenguaje grandes para lograr un rendimiento competitivo en la clasificación de nodos en grafos atribuidos a texto, utilizando solo el 0,24% de los parámetros necesarios para el ajuste fino completo.

Mayur Choudhary, Saptarshi Sengupta, Katerina Potika2026-03-12🤖 cs.LG

Regime-aware financial volatility forecasting via in-context learning

Este trabajo presenta un marco de aprendizaje en contexto que utiliza modelos de lenguaje grandes para predecir la volatilidad financiera adaptándose a diferentes regímenes de mercado mediante razonamiento contextual y muestreo condicional, superando a los métodos clásicos sin necesidad de ajuste de parámetros.

Saba Asaad, Shayan Mohajer Hamidi, Ali Bereyhi2026-03-12🤖 cs.LG

What do near-optimal learning rate schedules look like?

Este artículo presenta un procedimiento de búsqueda para identificar formas de programación de la tasa de aprendizaje casi óptimas, revelando que el calentamiento y la decadencia son características robustas esenciales, mientras que las familias de programas comunes no son óptimas y la forma ideal depende significativamente de hiperparámetros como la descomposición de pesos.

Hiroki Naganuma, Atish Agarwala, Priya Kasimbeg, George E. Dahl2026-03-12🤖 cs.LG

How to make the most of your masked language model for protein engineering

Este artículo propone un método de muestreo flexible basado en búsqueda estocástica en haz para optimizar modelos de lenguaje enmascarados en ingeniería de proteínas, demostrando mediante campañas experimentales con anticuerpos que la elección del método de muestreo es tan crucial como la selección del modelo mismo.

Calvin McCarter, Nick Bhattacharya, Sebastian W. Ober, Hunter Elliott2026-03-12🧬 q-bio

Data-Driven Integration Kernels for Interpretable Nonlocal Operator Learning

El artículo presenta un marco de aprendizaje de operadores no locales basado en kernels de integración impulsados por datos que separan la agregación de información no local de la predicción no lineal local, logrando modelos interpretables y eficientes para la precipitación del monzón asiático con menos parámetros y mayor claridad física.

Savannah L. Ferretti, Jerry Lin, Sara Shamekh, Jane W. Baldwin, Michael S. Pritchard, Tom Beucler2026-03-12🤖 cs.LG

NasoVoce: A Nose-Mounted Low-Audibility Speech Interface for Always-Available Speech Interaction

El paper presenta NasoVoce, una interfaz montada en la nariz que fusiona señales acústicas y de vibración para capturar el habla silenciosa y susurrada de manera robusta frente al ruido, permitiendo interacciones de voz discretas y siempre disponibles con IA.

Jun Rekimoto, Yu Nishimura, Bojian Yang2026-03-12🤖 cs.AI

Federated Active Learning Under Extreme Non-IID and Global Class Imbalance

El artículo presenta FairFAL, un marco de aprendizaje activo federado adaptativo que supera los desafíos del desequilibrio de clases global y la heterogeneidad de datos mediante la selección inteligente de modelos de consulta, el etiquetado pseudo-guiado por prototipos y una estrategia de muestreo equilibrada, logrando un rendimiento superior en escenarios no IID.

Chen-Chen Zong, Sheng-Jun Huang2026-03-12🤖 cs.LG

On The Complexity of Best-Arm Identification in Non-Stationary Linear Bandits

Este trabajo aborda el problema de identificación del mejor brazo en banditos lineales no estacionarios estableciendo un límite inferior dependiente del conjunto de brazos y proponiendo el algoritmo $\textsf{Adjacent-BAI}$ , que logra una probabilidad de error óptima al aprovechar la estructura geométrica del conjunto de brazos.

Leo Maynard-Zhang, Zhihan Xiong, Kevin Jamieson, Maryam Fazel2026-03-12📊 stat

HEAL: Hindsight Entropy-Assisted Learning for Reasoning Distillation

El artículo presenta HEAL, un marco de aprendizaje sin refuerzo que supera las limitaciones del destilado tradicional mediante la integración de reparación asistida por entropía, estimación de incertidumbre y un currículo evolutivo progresivo para transferir eficazmente capacidades de razonamiento de modelos grandes a modelos más pequeños.

Wenjing Zhang, Jiangze Yan, Jieyun Huang, Yi Shen, Shuming Shi, Ping Chen, Ning Wang, Zhaoxiang Liu, Kai Wang, Shiguo Lian2026-03-12🤖 cs.AI

Causal Concept Graphs in LLM Latent Space for Stepwise Reasoning

El artículo propone los Grafos Conceptuales Causales (CCG), un marco que combina autoencoders dispersos y aprendizaje de estructura diferenciable para mapear dependencias causales entre conceptos en el espacio latente de modelos de lenguaje, logrando una fidelidad causal significativamente superior en tareas de razonamiento paso a paso en comparación con métodos existentes.

Md Muntaqim Meherab, Noor Islam S. Mohammad, Faiza Feroz2026-03-12🤖 cs.LG

Optimal Expert-Attention Allocation in Mixture-of-Experts: A Scalable Law for Dynamic Model Design

Este artículo presenta una ley de escalado generalizada para modelos de Mezcla de Expertos (MoE) que define una fórmula óptima para la asignación dinámica de cómputo entre las capas de expertos y atención, permitiendo diseñar modelos más eficientes bajo presupuestos de recursos fijos.

Junzhuo Li, Peijie Jiang, Changxin Tian, Jia Liu, Zhiqiang Zhang, Xuming Hu2026-03-12🤖 cs.LG

Variance-Aware Adaptive Weighting for Diffusion Model Training

Este trabajo propone una estrategia de ponderación adaptativa basada en la varianza para equilibrar la dinámica de entrenamiento de los modelos de difusión en diferentes niveles de ruido, logrando mejoras consistentes en el rendimiento generativo y una mayor estabilidad en conjuntos de datos como CIFAR-10 y CIFAR-100.

Nanlong Sun, Lei Shi2026-03-12🤖 cs.LG

← Anterior Siguiente →