cs.LG artículos | Gist.Science

How to make the most of your masked language model for protein engineering

Este artículo propone un método de muestreo flexible basado en búsqueda estocástica en haz para optimizar modelos de lenguaje enmascarados en ingeniería de proteínas, demostrando mediante campañas experimentales con anticuerpos que la elección del método de muestreo es tan crucial como la selección del modelo mismo.

Calvin McCarter, Nick Bhattacharya, Sebastian W. Ober, Hunter Elliott2026-03-12🧬 q-bio

Data-Driven Integration Kernels for Interpretable Nonlocal Operator Learning

El artículo presenta un marco de aprendizaje de operadores no locales basado en kernels de integración impulsados por datos que separan la agregación de información no local de la predicción no lineal local, logrando modelos interpretables y eficientes para la precipitación del monzón asiático con menos parámetros y mayor claridad física.

Savannah L. Ferretti, Jerry Lin, Sara Shamekh, Jane W. Baldwin, Michael S. Pritchard, Tom Beucler2026-03-12🤖 cs.LG

NasoVoce: A Nose-Mounted Low-Audibility Speech Interface for Always-Available Speech Interaction

El paper presenta NasoVoce, una interfaz montada en la nariz que fusiona señales acústicas y de vibración para capturar el habla silenciosa y susurrada de manera robusta frente al ruido, permitiendo interacciones de voz discretas y siempre disponibles con IA.

Jun Rekimoto, Yu Nishimura, Bojian Yang2026-03-12🤖 cs.AI

Federated Active Learning Under Extreme Non-IID and Global Class Imbalance

El artículo presenta FairFAL, un marco de aprendizaje activo federado adaptativo que supera los desafíos del desequilibrio de clases global y la heterogeneidad de datos mediante la selección inteligente de modelos de consulta, el etiquetado pseudo-guiado por prototipos y una estrategia de muestreo equilibrada, logrando un rendimiento superior en escenarios no IID.

Chen-Chen Zong, Sheng-Jun Huang2026-03-12🤖 cs.LG

On The Complexity of Best-Arm Identification in Non-Stationary Linear Bandits

Este trabajo aborda el problema de identificación del mejor brazo en banditos lineales no estacionarios estableciendo un límite inferior dependiente del conjunto de brazos y proponiendo el algoritmo $\textsf{Adjacent-BAI}$ , que logra una probabilidad de error óptima al aprovechar la estructura geométrica del conjunto de brazos.

Leo Maynard-Zhang, Zhihan Xiong, Kevin Jamieson, Maryam Fazel2026-03-12📊 stat

HEAL: Hindsight Entropy-Assisted Learning for Reasoning Distillation

El artículo presenta HEAL, un marco de aprendizaje sin refuerzo que supera las limitaciones del destilado tradicional mediante la integración de reparación asistida por entropía, estimación de incertidumbre y un currículo evolutivo progresivo para transferir eficazmente capacidades de razonamiento de modelos grandes a modelos más pequeños.

Wenjing Zhang, Jiangze Yan, Jieyun Huang, Yi Shen, Shuming Shi, Ping Chen, Ning Wang, Zhaoxiang Liu, Kai Wang, Shiguo Lian2026-03-12🤖 cs.AI

Causal Concept Graphs in LLM Latent Space for Stepwise Reasoning

El artículo propone los Grafos Conceptuales Causales (CCG), un marco que combina autoencoders dispersos y aprendizaje de estructura diferenciable para mapear dependencias causales entre conceptos en el espacio latente de modelos de lenguaje, logrando una fidelidad causal significativamente superior en tareas de razonamiento paso a paso en comparación con métodos existentes.

Md Muntaqim Meherab, Noor Islam S. Mohammad, Faiza Feroz2026-03-12🤖 cs.LG

Optimal Expert-Attention Allocation in Mixture-of-Experts: A Scalable Law for Dynamic Model Design

Este artículo presenta una ley de escalado generalizada para modelos de Mezcla de Expertos (MoE) que define una fórmula óptima para la asignación dinámica de cómputo entre las capas de expertos y atención, permitiendo diseñar modelos más eficientes bajo presupuestos de recursos fijos.

Junzhuo Li, Peijie Jiang, Changxin Tian, Jia Liu, Zhiqiang Zhang, Xuming Hu2026-03-12🤖 cs.LG

Variance-Aware Adaptive Weighting for Diffusion Model Training

Este trabajo propone una estrategia de ponderación adaptativa basada en la varianza para equilibrar la dinámica de entrenamiento de los modelos de difusión en diferentes niveles de ruido, logrando mejoras consistentes en el rendimiento generativo y una mayor estabilidad en conjuntos de datos como CIFAR-10 y CIFAR-100.

Nanlong Sun, Lei Shi2026-03-12🤖 cs.LG

Graph-GRPO: Training Graph Flow Models with Reinforcement Learning

El artículo presenta Graph-GRPO, un marco de aprendizaje por refuerzo en línea que entrena modelos de flujo gráfico mediante una expresión analítica de probabilidad de transición y una estrategia de refinamiento local, logrando un rendimiento superior en tareas de generación y optimización molecular.

Baoheng Zhu, Deyu Bo, Delvin Ce Zhang, Xiao Wang2026-03-12🤖 cs.LG

On the Learning Dynamics of Two-layer Linear Networks with Label Noise SGD

Este artículo analiza la dinámica de aprendizaje de redes lineales de dos capas entrenadas con SGD y ruido en las etiquetas, revelando un comportamiento bifásico donde el ruido impulsa la transición de un régimen "perezoso" a uno "rico" para mejorar la generalización, un hallazgo que también se extiende a algoritmos como SAM y se valida mediante experimentos exhaustivos.

Tongcheng Zhang, Zhanpeng Zhou, Mingze Wang, Andi Han, Wei Huang, Taiji Suzuki, Junchi Yan2026-03-12🤖 cs.LG

Designing Service Systems from Textual Evidence

Este artículo presenta PP-LUCB, un algoritmo que optimiza la selección de configuraciones de sistemas de servicio utilizando puntuaciones de modelos de lenguaje grandes corregidas mediante auditorías humanas selectivas para minimizar costos y garantizar la precisión frente a sesgos sistemáticos.

Ruicheng Ao, Hongyu Chen, Siyang Gao, Hanwei Li, David Simchi-Levi2026-03-12🤖 cs.LG

Effective Dataset Distillation for Spatio-Temporal Forecasting with Bi-dimensional Compression

El artículo presenta STemDist, el primer método de destilación de datos diseñado específicamente para la predicción espacio-temporal, que comprime de manera equilibrada las dimensiones espaciales y temporales a nivel de clúster y mediante granularidad de subconjuntos, logrando entrenamientos hasta 6 veces más rápidos, 8 veces más eficientes en memoria y con un error de predicción hasta un 12% menor en comparación con métodos existentes.

Taehyung Kwon, Yeonje Choi, Yeongho Kim, Kijung Shin2026-03-12🤖 cs.LG

Domain-Adaptive Health Indicator Learning with Degradation-Stage Synchronized Sampling and Cross-Domain Autoencoder

Este artículo presenta un marco de aprendizaje de indicadores de salud adaptativo al dominio que combina un muestreo de lotes sincronizado por etapas de degradación y un autoencoder de fusión alineada entre dominios con mecanismos de atención cruzada para superar las discrepancias de distribución y las limitaciones estructurales en la modelado de señales de vibración complejas, logrando un rendimiento superior en sistemas de defensa y rodamientos industriales.

Jungho Choo, Hanbyeol Park, Gawon Lee, Yunkyung Park, Hyerim Bae2026-03-12🤖 cs.LG

Adaptive Active Learning for Regression via Reinforcement Learning

Este artículo presenta WiGS, un método de aprendizaje activo para regresión que utiliza aprendizaje por refuerzo para adaptar dinámicamente el equilibrio entre exploración e investigación, superando a los enfoques basados en reglas multiplicativas estáticas en precisión y eficiencia de etiquetado.

Simon D. Nguyen, Troy Russo, Kentaro Hoffman, Tyler H. McCormick2026-03-12📊 stat

GGMPs: Generalized Gaussian Mixture Processes

El artículo presenta los Procesos de Mezcla Gaussiana Generalizada (GGMP), un método basado en procesos gaussianos que permite la estimación de densidades condicionales multimodales y heterocedásticas mediante una combinación de ajuste local, alineación de componentes y entrenamiento por componente, ofreciendo una solución tratable y escalable para datos no gaussianos complejos.

Vardaan Tekriwal, Mark D. Risser, Hengrui Luo, Marcus M. Noack2026-03-12🤖 cs.LG

The Curse and Blessing of Mean Bias in FP4-Quantized LLM Training

El artículo demuestra que la eliminación de un sesgo de media coherente de rango uno, principal causante de la inestabilidad numérica en el entrenamiento de modelos de lenguaje con cuantización FP4, permite recuperar la estabilidad y el rendimiento cercanos a BF16 mediante una operación simple y eficiente en hardware.

Hengjie Cao, Zhendong Huang, Mengyi Chen, Yifeng Yang, Fanqi Yu, Ruijun Huang, Fang Dong, Xin Zhang, Jixian Zhou, Anrui Chen, Mingzhi Dong, Yujiang Wang, Jinlong Hou, Qin Lv, Yuan Cheng, Tun Lu, Fan Yang, Li Shang2026-03-12🤖 cs.LG

Unlearning the Unpromptable: Prompt-free Instance Unlearning in Diffusion Models

Este artículo presenta un método de olvido de instancias sin prompts para modelos de difusión que, mediante un enfoque basado en sustitutos, edición de imágenes y cirugía de gradientes, permite eliminar selectivamente salidas indeseadas e inexpresables mediante texto (como rostros específicos o representaciones culturalmente inexactas) mientras preserva la integridad del modelo.

Kyungryeol Lee, Kyeonghyun Lee, Seongmin Hong, Byung Hyun Lee, Se Young Chun2026-03-12🤖 cs.LG

Brenier Isotonic Regression

Este artículo propone la "regresión isótona de Brenier", una extensión novedosa de la regresión isótona a múltiples salidas que utiliza el transporte óptimo para imponer la monotonía cíclica, demostrando un rendimiento superior en tareas de calibración de probabilidades y modelos lineales generalizados.

Han Bao, Amirreza Eshraghi, Yutong Wang2026-03-12📊 stat

Spatio-Temporal Forecasting of Retaining Wall Deformation: Mitigating Error Accumulation via Multi-Resolution ConvLSTM Stacking Ensemble

Este estudio propone un marco de conjunto basado en ConvLSTM multi-resolución que, al integrar diversas resoluciones temporales de entrada, mitiga la acumulación de errores y mejora la precisión en la predicción a largo plazo de la deformación de muros de contención durante excavaciones escalonadas.

Jihoon Kim (Department of Civil,Environmental Engineering, Hongik University, Seoul, Republic of Korea), Heejung Youn (Department of Civil,Environmental Engineering, Hongik University, Seoul, Republic of Korea)2026-03-12🤖 cs.LG

← Anterior Siguiente →