Outlier-robust Autocovariance Least Square Estimation via Iteratively Reweighted Least Square

Este artículo presenta un nuevo algoritmo de estimación de covarianza de ruido robusto a valores atípicos, denominado ALS-IRLS, que combina umbralización adaptativa y el método de mínimos cuadrados iterativamente reponderados con la función de costo de Huber para superar las limitaciones de sensibilidad a anomalías de los métodos ALS convencionales y lograr una precisión de estimación cercana al límite teórico óptimo.

Jiahong Li, Fang Deng2026-03-10🤖 cs.LG

Learning Hierarchical Knowledge in Text-Rich Networks with Taxonomy-Informed Representation Learning

El artículo presenta TIER, un nuevo enfoque que construye una taxonomía jerárquica implícita y la integra en el aprendizaje de representaciones de redes ricas en texto mediante aprendizaje contrastivo y refinamiento con LLM, logrando así una modelación más interpretable y estructurada que supera a los métodos existentes.

Yunhui Liu, Yongchao Liu, Yinfeng Chen, Chuntao Hong, Tao Zheng, Tieke He2026-03-10🤖 cs.LG

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

El informe presenta Covenant-72B, un modelo de lenguaje de 72 mil millones de parámetros pre-entrenado de manera competitiva a través de la mayor colaboración distribuida globalmente hasta la fecha, logrando una participación abierta y sin permisos mediante un protocolo blockchain y el optimizador SparseLoCo.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel Dare2026-03-10🤖 cs.LG

ALOOD: Exploiting Language Representations for LiDAR-based Out-of-Distribution Object Detection

El artículo presenta ALOOD, un método innovador que aprovecha las representaciones lingüísticas de modelos visión-lenguaje para convertir la detección de objetos fuera de distribución en LiDAR en una tarea de clasificación zero-shot, mejorando así la seguridad en la conducción autónoma al reducir las predicciones incorrectas de objetos desconocidos.

Michael Kösel, Marcel Schreiber, Michael Ulrich, Claudius Gläser, Klaus Dietmayer2026-03-10🤖 cs.LG

AutoAdapt: An Automated Domain Adaptation Framework for LLMs

El documento presenta AutoAdapt, un marco automatizado de extremo a extremo que utiliza un sistema multiagente de debate y un sustituto basado en LLM llamado AutoRefine para optimizar la adaptación de dominio de modelos de lenguaje grandes, logrando una mejora del 25% en precisión frente a las mejores técnicas actuales con un mínimo sobrecosto.

Sidharth Sinha, Anson Bastos, Xuchao Zhang, Akshay Nambi, Chetan Bansal, Saravan Rajmohan2026-03-10🤖 cs.LG

SERQ: Saliency-Aware Low-Rank Error Reconstruction for LLM Quantization

El artículo presenta SERQ, un método de reconstrucción de errores consciente de la saliencia que utiliza una única matriz de compensación de bajo rango para mitigar eficazmente los errores de cuantización en modelos de lenguaje grandes bajo configuraciones de 4 bits, logrando una mayor precisión que los enfoques actuales con una complejidad de calibración significativamente reducida.

Yeonsik Park, Hyeonseong Kim, Seungkyu Choi2026-03-10🤖 cs.LG

Sequential Service Region Design with Capacity-Constrained Investment and Spillover Effect

Este estudio aborda el problema de diseño secuencial de regiones de servicio bajo incertidumbre de demanda y efectos de derrame, proponiendo un marco de solución que integra el análisis de opciones reales con un algoritmo de optimización de política proximal basado en transformadores (TPPO) para identificar secuencias de inversión óptimas sin necesidad de enumeración exhaustiva.

Tingting Chen, Feng Chu, Jiantong Zhang2026-03-10🤖 cs.LG

Distributional Regression with Tabular Foundation Models: Evaluating Probabilistic Predictions via Proper Scoring Rules

El artículo critica la dependencia actual de métricas de estimación puntual en los benchmarks de regresión para modelos fundacionales tabulares y propone evaluar y optimizar las predicciones probabilísticas mediante reglas de puntuación adecuadas, como el CRPS, junto con estrategias de ajuste fino o prompts para adaptar el sesgo inductivo de estos modelos.

Jonas Landsgesell, Pascal Knoll2026-03-10🤖 cs.LG

Wiener Chaos Expansion based Neural Operator for Singular Stochastic Partial Differential Equations

Este artículo presenta un operador neuronal basado en la expansión del caos de Wiener con modulación lineal por características (WCE-FiLM-NO) que logra simular con alta precisión y sin factores de renormalización las ecuaciones diferenciales parciales estocásticas singulares, como los modelos dinámicos Φ24\boldsymbol{\Phi}^4_2 y Φ34\boldsymbol{\Phi}^4_3.

Dai Shi, Luke Thompson, Andi Han, Peiyan Hu, Junbin Gao, José Miguel Hernández-Lobato2026-03-10🤖 cs.LG

The Struggle Between Continuation and Refusal: A Mechanistic Analysis of the Continuation-Triggered Jailbreak in LLMs

Este artículo realiza un análisis mecanicista que demuestra cómo la competencia inherente entre la tendencia del modelo a continuar el texto y sus defensas de seguridad, activada por instrucciones de continuación, explica la vulnerabilidad a ataques de jailbreak y revela diferencias funcionales en las cabezas de atención críticas para la seguridad entre distintas arquitecturas de modelos.

Yonghong Deng, Zhen Yang, Ping Jian, Xinyue Zhang, Zhongbin Guo, Chengzhi Li2026-03-10🤖 cs.LG

Optimising antibiotic switching via forecasting of patient physiology

Este artículo propone un sistema de apoyo a la decisión clínica basado en procesos neuronales que pronostica la fisiología del paciente para identificar de manera interpretable y adaptable cuándo es seguro cambiar de antibióticos intravenosos a orales, superando las limitaciones de los métodos que aprenden de decisiones históricas y demostrando su eficacia en validaciones con datos de EE. UU. y el Reino Unido.

Magnus Ross, Nel Swanepoel, Akish Luintel, Emma McGuire, Ingemar J. Cox, Steve Harris, Vasileios Lampos2026-03-10🤖 cs.LG

FlowTouch: View-Invariant Visuo-Tactile Prediction

FlowTouch es un modelo novedoso que utiliza mallas 3D locales y modelos de flujo de correspondencia para predecir patrones táctiles a partir de información visual de manera invariante a la vista, logrando así generalizar entre diferentes configuraciones de sensores y cerrar la brecha entre simulación y realidad.

Seongjin Bien, Carlo Kneissl, Tobias Jülg, Frank Fundel, Thomas Ressler-Antal, Florian Walter, Björn Ommer, Gitta Kutyniok, Wolfram Burgard2026-03-10🤖 cs.LG

Airborne Magnetic Anomaly Navigation with Neural-Network-Augmented Online Calibration

Este artículo presenta un sistema de navegación magnética aérea totalmente adaptativo que utiliza un filtro de Kalman extendido con un modelo híbrido de física y redes neuronales para compensar en tiempo real las interferencias magnéticas de la plataforma sin necesidad de vuelos de calibración previos, logrando una precisión comparable a los métodos offline.

Antonia Hager, Sven Nebendahl, Alexej Klushyn, Jasper Krauser, Torleiv H. Bryne, Tor Arne Johansen2026-03-10🤖 cs.LG