cs.LG artículos | Gist.Science

Outlier-robust Autocovariance Least Square Estimation via Iteratively Reweighted Least Square

Este artículo presenta un nuevo algoritmo de estimación de covarianza de ruido robusto a valores atípicos, denominado ALS-IRLS, que combina umbralización adaptativa y el método de mínimos cuadrados iterativamente reponderados con la función de costo de Huber para superar las limitaciones de sensibilidad a anomalías de los métodos ALS convencionales y lograr una precisión de estimación cercana al límite teórico óptimo.

Jiahong Li, Fang Deng2026-03-10🤖 cs.LG

Learning Hierarchical Knowledge in Text-Rich Networks with Taxonomy-Informed Representation Learning

El artículo presenta TIER, un nuevo enfoque que construye una taxonomía jerárquica implícita y la integra en el aprendizaje de representaciones de redes ricas en texto mediante aprendizaje contrastivo y refinamiento con LLM, logrando así una modelación más interpretable y estructurada que supera a los métodos existentes.

Yunhui Liu, Yongchao Liu, Yinfeng Chen, Chuntao Hong, Tao Zheng, Tieke He2026-03-10🤖 cs.LG

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

El informe presenta Covenant-72B, un modelo de lenguaje de 72 mil millones de parámetros pre-entrenado de manera competitiva a través de la mayor colaboración distribuida globalmente hasta la fecha, logrando una participación abierta y sin permisos mediante un protocolo blockchain y el optimizador SparseLoCo.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel Dare2026-03-10🤖 cs.LG

Is continuous CoT better suited for multi-lingual reasoning?

El estudio demuestra que el razonamiento en cadena en un espacio latente continuo (CODI) supera al razonamiento explícito en idiomas de bajos recursos y escenarios zero-shot, ofreciendo una solución escalable con una compresión de trazas de 29 a 50 veces.

Ali Hamza Bashir, Behzad Shomali, Markus Frey, Mehdi Ali, Rafet Sifa, David Berghaus2026-03-10🤖 cs.LG

ALOOD: Exploiting Language Representations for LiDAR-based Out-of-Distribution Object Detection

El artículo presenta ALOOD, un método innovador que aprovecha las representaciones lingüísticas de modelos visión-lenguaje para convertir la detección de objetos fuera de distribución en LiDAR en una tarea de clasificación zero-shot, mejorando así la seguridad en la conducción autónoma al reducir las predicciones incorrectas de objetos desconocidos.

Michael Kösel, Marcel Schreiber, Michael Ulrich, Claudius Gläser, Klaus Dietmayer2026-03-10🤖 cs.LG

AutoAdapt: An Automated Domain Adaptation Framework for LLMs

El documento presenta AutoAdapt, un marco automatizado de extremo a extremo que utiliza un sistema multiagente de debate y un sustituto basado en LLM llamado AutoRefine para optimizar la adaptación de dominio de modelos de lenguaje grandes, logrando una mejora del 25% en precisión frente a las mejores técnicas actuales con un mínimo sobrecosto.

Sidharth Sinha, Anson Bastos, Xuchao Zhang, Akshay Nambi, Chetan Bansal, Saravan Rajmohan2026-03-10🤖 cs.LG

SERQ: Saliency-Aware Low-Rank Error Reconstruction for LLM Quantization

El artículo presenta SERQ, un método de reconstrucción de errores consciente de la saliencia que utiliza una única matriz de compensación de bajo rango para mitigar eficazmente los errores de cuantización en modelos de lenguaje grandes bajo configuraciones de 4 bits, logrando una mayor precisión que los enfoques actuales con una complejidad de calibración significativamente reducida.

Yeonsik Park, Hyeonseong Kim, Seungkyu Choi2026-03-10🤖 cs.LG

Sequential Service Region Design with Capacity-Constrained Investment and Spillover Effect

Este estudio aborda el problema de diseño secuencial de regiones de servicio bajo incertidumbre de demanda y efectos de derrame, proponiendo un marco de solución que integra el análisis de opciones reales con un algoritmo de optimización de política proximal basado en transformadores (TPPO) para identificar secuencias de inversión óptimas sin necesidad de enumeración exhaustiva.

Tingting Chen, Feng Chu, Jiantong Zhang2026-03-10🤖 cs.LG

Distributional Regression with Tabular Foundation Models: Evaluating Probabilistic Predictions via Proper Scoring Rules

El artículo critica la dependencia actual de métricas de estimación puntual en los benchmarks de regresión para modelos fundacionales tabulares y propone evaluar y optimizar las predicciones probabilísticas mediante reglas de puntuación adecuadas, como el CRPS, junto con estrategias de ajuste fino o prompts para adaptar el sesgo inductivo de estos modelos.

Jonas Landsgesell, Pascal Knoll2026-03-10🤖 cs.LG

Revisiting Gradient Staleness: Evaluating Distance Metrics for Asynchronous Federated Learning Aggregation

Este artículo extiende el método de agregación adaptativa AsyncFedED para el aprendizaje federado asíncrono, demostrando que la integración de métricas de distancia alternativas al de Euclídeo mejora la robustez, la velocidad de convergencia y el rendimiento del modelo en entornos heterogéneos con datos no IID.

Patrick Wilhelm, Odej Kao2026-03-10🤖 cs.LG

Wiener Chaos Expansion based Neural Operator for Singular Stochastic Partial Differential Equations

Este artículo presenta un operador neuronal basado en la expansión del caos de Wiener con modulación lineal por características (WCE-FiLM-NO) que logra simular con alta precisión y sin factores de renormalización las ecuaciones diferenciales parciales estocásticas singulares, como los modelos dinámicos $\boldsymbol{\Phi}^4_2$ y $\boldsymbol{\Phi}^4_3$ .

Dai Shi, Luke Thompson, Andi Han, Peiyan Hu, Junbin Gao, José Miguel Hernández-Lobato2026-03-10🤖 cs.LG

The Struggle Between Continuation and Refusal: A Mechanistic Analysis of the Continuation-Triggered Jailbreak in LLMs

Este artículo realiza un análisis mecanicista que demuestra cómo la competencia inherente entre la tendencia del modelo a continuar el texto y sus defensas de seguridad, activada por instrucciones de continuación, explica la vulnerabilidad a ataques de jailbreak y revela diferencias funcionales en las cabezas de atención críticas para la seguridad entre distintas arquitecturas de modelos.

Yonghong Deng, Zhen Yang, Ping Jian, Xinyue Zhang, Zhongbin Guo, Chengzhi Li2026-03-10🤖 cs.LG

Fibration Policy Optimization

El artículo presenta Fibration Policy Optimization (FiberPO), un marco unificado que integra la teoría de regiones de confianza y una estructura algebraica de fibración para optimizar políticas de modelos de lenguaje mediante un control de estabilidad jerárquico y multi-escala que abarca desde el nivel de tokens hasta dominios completos.

Chang Li, Tshihao Tsu, Yaren Zhang, Chao Xue, Xiaodong He2026-03-10🤖 cs.LG

Optimising antibiotic switching via forecasting of patient physiology

Este artículo propone un sistema de apoyo a la decisión clínica basado en procesos neuronales que pronostica la fisiología del paciente para identificar de manera interpretable y adaptable cuándo es seguro cambiar de antibióticos intravenosos a orales, superando las limitaciones de los métodos que aprenden de decisiones históricas y demostrando su eficacia en validaciones con datos de EE. UU. y el Reino Unido.

Magnus Ross, Nel Swanepoel, Akish Luintel, Emma McGuire, Ingemar J. Cox, Steve Harris, Vasileios Lampos2026-03-10🤖 cs.LG

FedPrism: Adaptive Personalized Federated Learning under Non-IID Data

FedPrism es un marco de aprendizaje federado personalizado que mitiga la degradación del rendimiento en entornos con datos no IID mediante una descomposición de modelo en tres componentes y un diseño de doble flujo que equilibra dinámicamente el conocimiento general con la especialización local.

Prakash Kumbhakar, Shrey Srivastava, Haroon R Lone2026-03-10🤖 cs.LG

FlowTouch: View-Invariant Visuo-Tactile Prediction

FlowTouch es un modelo novedoso que utiliza mallas 3D locales y modelos de flujo de correspondencia para predecir patrones táctiles a partir de información visual de manera invariante a la vista, logrando así generalizar entre diferentes configuraciones de sensores y cerrar la brecha entre simulación y realidad.

Seongjin Bien, Carlo Kneissl, Tobias Jülg, Frank Fundel, Thomas Ressler-Antal, Florian Walter, Björn Ommer, Gitta Kutyniok, Wolfram Burgard2026-03-10🤖 cs.LG

Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables

Este trabajo introduce los estimadores de gradiente ReinMax-Rao y ReinMax-CV, que aplican técnicas de Rao-Blackwellización y variables de control al método ReinMax para reducir su varianza y mejorar el entrenamiento de autoencoders variacionales con variables latentes discretas, ofreciendo además una nueva perspectiva numérica sobre dicho enfoque.

Daniel Wang, Thang D. Bui2026-03-10🤖 cs.LG

Airborne Magnetic Anomaly Navigation with Neural-Network-Augmented Online Calibration

Este artículo presenta un sistema de navegación magnética aérea totalmente adaptativo que utiliza un filtro de Kalman extendido con un modelo híbrido de física y redes neuronales para compensar en tiempo real las interferencias magnéticas de la plataforma sin necesidad de vuelos de calibración previos, logrando una precisión comparable a los métodos offline.

Antonia Hager, Sven Nebendahl, Alexej Klushyn, Jasper Krauser, Torleiv H. Bryne, Tor Arne Johansen2026-03-10🤖 cs.LG

Towards a more efficient bias detection in financial language models

Este estudio propone un método de detección de sesgos en modelos de lenguaje financieros que reduce significativamente los costos computacionales al identificar patrones consistentes entre modelos, permitiendo descubrir hasta un 73% de los comportamientos sesgados utilizando solo el 20% de los pares de entrada necesarios en enfoques tradicionales.

Firas Hadj Kacem, Ahmed Khanfir, Mike Papadakis2026-03-10🤖 cs.LG

SCL-GNN: Towards Generalizable Graph Neural Networks via Spurious Correlation Learning

El artículo presenta SCL-GNN, un nuevo marco de redes neuronales de grafos que mejora la generalización tanto en distribuciones IID como OOD al identificar y mitigar correlaciones espurias mediante el criterio de independencia Hilbert-Schmidt (HSIC) y una estrategia de optimización bi-nivel.

Yuxiang Zhang, Enyan Dai2026-03-10🤖 cs.LG

← Anterior Siguiente →