cs.LG artículos | Gist.Science

Explainable Condition Monitoring via Probabilistic Anomaly Detection Applied to Helicopter Transmissions

Este artículo presenta un método novedoso de monitoreo de condiciones basado en la detección probabilística de anomalías utilizando únicamente datos saludables, el cual incorpora cuantificación de incertidumbre y herramientas explicativas para la toma de decisiones en aplicaciones críticas, validándose con éxito en un conjunto de datos de transmisiones de helicópteros y un benchmark público.

Aurelio Raffa Ugolini, Jessica Leoni, Valentina Breschi, Damiano Paniccia, Francesco Aldo Tucci, Luigi Capone, Mara Tanelli2026-03-10🤖 cs.LG

Mitigating Homophily Disparity in Graph Anomaly Detection: A Scalable and Adaptive Approach

El artículo presenta SAGAD, un marco escalable y adaptativo para la detección de anomalías en grafos que mitiga la disparidad de homofilia y mejora la eficiencia mediante el uso de filtros de Chebyshev, fusión adaptativa guiada por la estructura del subgrafo anómalo y una pérdida de preferencia de frecuencia, logrando un rendimiento superior en múltiples benchmarks.

Yunhui Liu, Qizhuo Xie, Yinfeng Chen, Xudong Jin, Tao Zheng, Bin Chong, Tieke He2026-03-10🤖 cs.LG

DARC: Disagreement-Aware Alignment via Risk-Constrained Decoding

El artículo presenta DARC, un método de inferencia sin reentrenamiento que aborda la heterogeneidad en las preferencias humanas mediante la selección de respuestas basada en la optimización de riesgos y la robustez distribucional para reducir el desacuerdo y el riesgo de cola sin comprometer la calidad promedio.

Mingxi Zou, Jiaxiang Chen, Junfan Li, Langzhang Liang, Qifan Wang, Xu Yinghui, Zenglin Xu2026-03-10🤖 cs.LG

Training event-based neural networks with exact gradients via Differentiable ODE Solving in JAX

El marco Eventax, implementado en JAX, resuelve el compromiso entre flexibilidad y precisión en el entrenamiento de redes neuronales de espigas al combinar solucionadores numéricos de EDO diferenciables con manejo de eventos, permitiendo calcular gradientes exactos para modelos neuronales arbitrarios definidos por ecuaciones diferenciales.

Lukas König, Manuel Kuhn, David Kappel, Anand Subramoney2026-03-10🤖 cs.LG

C $^2$ FG: Control Classifier-Free Guidance via Score Discrepancy Analysis

Este artículo presenta C²FG, un método de guía libre de clasificadores que, fundamentado en un análisis teórico de las discrepancias de puntuación, ajusta dinámicamente la fuerza de la guía mediante una función de decaimiento exponencial para mejorar la generación en modelos de difusión sin necesidad de reentrenamiento.

Jiayang Gao, Tianyi Zheng, Jiayang Zou, Fengxiang Yang, Shice Liu, Luyao Fan, Zheyu Zhang, Hao Zhang, Jinwei Chen, Peng-Tao Jiang, Bo Li, Jia Wang2026-03-10🤖 cs.LG

Are We Winning the Wrong Game? Revisiting Evaluation Practices for Long-Term Time Series Forecasting

Este artículo critica el enfoque actual de la predicción de series temporales a largo plazo, que prioriza la reducción marginal de métricas de error puntuales en tablas de clasificación, y propone una evaluación multidimensional que integre la fidelidad estadística, la coherencia estructural y la relevancia para la toma de decisiones para alinear el progreso de la investigación con los objetivos reales de la predicción.

Thanapol Phungtua-eng, Yoshitaka Yamamoto2026-03-10🤖 cs.LG

Outlier-robust Autocovariance Least Square Estimation via Iteratively Reweighted Least Square

Este artículo presenta un nuevo algoritmo de estimación de covarianza de ruido robusto a valores atípicos, denominado ALS-IRLS, que combina umbralización adaptativa y el método de mínimos cuadrados iterativamente reponderados con la función de costo de Huber para superar las limitaciones de sensibilidad a anomalías de los métodos ALS convencionales y lograr una precisión de estimación cercana al límite teórico óptimo.

Jiahong Li, Fang Deng2026-03-10🤖 cs.LG

Learning Hierarchical Knowledge in Text-Rich Networks with Taxonomy-Informed Representation Learning

El artículo presenta TIER, un nuevo enfoque que construye una taxonomía jerárquica implícita y la integra en el aprendizaje de representaciones de redes ricas en texto mediante aprendizaje contrastivo y refinamiento con LLM, logrando así una modelación más interpretable y estructurada que supera a los métodos existentes.

Yunhui Liu, Yongchao Liu, Yinfeng Chen, Chuntao Hong, Tao Zheng, Tieke He2026-03-10🤖 cs.LG

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

El informe presenta Covenant-72B, un modelo de lenguaje de 72 mil millones de parámetros pre-entrenado de manera competitiva a través de la mayor colaboración distribuida globalmente hasta la fecha, logrando una participación abierta y sin permisos mediante un protocolo blockchain y el optimizador SparseLoCo.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel Dare2026-03-10🤖 cs.LG

Is continuous CoT better suited for multi-lingual reasoning?

El estudio demuestra que el razonamiento en cadena en un espacio latente continuo (CODI) supera al razonamiento explícito en idiomas de bajos recursos y escenarios zero-shot, ofreciendo una solución escalable con una compresión de trazas de 29 a 50 veces.

Ali Hamza Bashir, Behzad Shomali, Markus Frey, Mehdi Ali, Rafet Sifa, David Berghaus2026-03-10🤖 cs.LG

ALOOD: Exploiting Language Representations for LiDAR-based Out-of-Distribution Object Detection

El artículo presenta ALOOD, un método innovador que aprovecha las representaciones lingüísticas de modelos visión-lenguaje para convertir la detección de objetos fuera de distribución en LiDAR en una tarea de clasificación zero-shot, mejorando así la seguridad en la conducción autónoma al reducir las predicciones incorrectas de objetos desconocidos.

Michael Kösel, Marcel Schreiber, Michael Ulrich, Claudius Gläser, Klaus Dietmayer2026-03-10🤖 cs.LG

AutoAdapt: An Automated Domain Adaptation Framework for LLMs

El documento presenta AutoAdapt, un marco automatizado de extremo a extremo que utiliza un sistema multiagente de debate y un sustituto basado en LLM llamado AutoRefine para optimizar la adaptación de dominio de modelos de lenguaje grandes, logrando una mejora del 25% en precisión frente a las mejores técnicas actuales con un mínimo sobrecosto.

Sidharth Sinha, Anson Bastos, Xuchao Zhang, Akshay Nambi, Chetan Bansal, Saravan Rajmohan2026-03-10🤖 cs.LG

SERQ: Saliency-Aware Low-Rank Error Reconstruction for LLM Quantization

El artículo presenta SERQ, un método de reconstrucción de errores consciente de la saliencia que utiliza una única matriz de compensación de bajo rango para mitigar eficazmente los errores de cuantización en modelos de lenguaje grandes bajo configuraciones de 4 bits, logrando una mayor precisión que los enfoques actuales con una complejidad de calibración significativamente reducida.

Yeonsik Park, Hyeonseong Kim, Seungkyu Choi2026-03-10🤖 cs.LG

Sequential Service Region Design with Capacity-Constrained Investment and Spillover Effect

Este estudio aborda el problema de diseño secuencial de regiones de servicio bajo incertidumbre de demanda y efectos de derrame, proponiendo un marco de solución que integra el análisis de opciones reales con un algoritmo de optimización de política proximal basado en transformadores (TPPO) para identificar secuencias de inversión óptimas sin necesidad de enumeración exhaustiva.

Tingting Chen, Feng Chu, Jiantong Zhang2026-03-10🤖 cs.LG

Distributional Regression with Tabular Foundation Models: Evaluating Probabilistic Predictions via Proper Scoring Rules

El artículo critica la dependencia actual de métricas de estimación puntual en los benchmarks de regresión para modelos fundacionales tabulares y propone evaluar y optimizar las predicciones probabilísticas mediante reglas de puntuación adecuadas, como el CRPS, junto con estrategias de ajuste fino o prompts para adaptar el sesgo inductivo de estos modelos.

Jonas Landsgesell, Pascal Knoll2026-03-10🤖 cs.LG

Revisiting Gradient Staleness: Evaluating Distance Metrics for Asynchronous Federated Learning Aggregation

Este artículo extiende el método de agregación adaptativa AsyncFedED para el aprendizaje federado asíncrono, demostrando que la integración de métricas de distancia alternativas al de Euclídeo mejora la robustez, la velocidad de convergencia y el rendimiento del modelo en entornos heterogéneos con datos no IID.

Patrick Wilhelm, Odej Kao2026-03-10🤖 cs.LG

Wiener Chaos Expansion based Neural Operator for Singular Stochastic Partial Differential Equations

Este artículo presenta un operador neuronal basado en la expansión del caos de Wiener con modulación lineal por características (WCE-FiLM-NO) que logra simular con alta precisión y sin factores de renormalización las ecuaciones diferenciales parciales estocásticas singulares, como los modelos dinámicos $\boldsymbol{\Phi}^4_2$ y $\boldsymbol{\Phi}^4_3$ .

Dai Shi, Luke Thompson, Andi Han, Peiyan Hu, Junbin Gao, José Miguel Hernández-Lobato2026-03-10🤖 cs.LG

The Struggle Between Continuation and Refusal: A Mechanistic Analysis of the Continuation-Triggered Jailbreak in LLMs

Este artículo realiza un análisis mecanicista que demuestra cómo la competencia inherente entre la tendencia del modelo a continuar el texto y sus defensas de seguridad, activada por instrucciones de continuación, explica la vulnerabilidad a ataques de jailbreak y revela diferencias funcionales en las cabezas de atención críticas para la seguridad entre distintas arquitecturas de modelos.

Yonghong Deng, Zhen Yang, Ping Jian, Xinyue Zhang, Zhongbin Guo, Chengzhi Li2026-03-10🤖 cs.LG

Fibration Policy Optimization

El artículo presenta Fibration Policy Optimization (FiberPO), un marco unificado que integra la teoría de regiones de confianza y una estructura algebraica de fibración para optimizar políticas de modelos de lenguaje mediante un control de estabilidad jerárquico y multi-escala que abarca desde el nivel de tokens hasta dominios completos.

Chang Li, Tshihao Tsu, Yaren Zhang, Chao Xue, Xiaodong He2026-03-10🤖 cs.LG

Optimising antibiotic switching via forecasting of patient physiology

Este artículo propone un sistema de apoyo a la decisión clínica basado en procesos neuronales que pronostica la fisiología del paciente para identificar de manera interpretable y adaptable cuándo es seguro cambiar de antibióticos intravenosos a orales, superando las limitaciones de los métodos que aprenden de decisiones históricas y demostrando su eficacia en validaciones con datos de EE. UU. y el Reino Unido.

Magnus Ross, Nel Swanepoel, Akish Luintel, Emma McGuire, Ingemar J. Cox, Steve Harris, Vasileios Lampos2026-03-10🤖 cs.LG

← Anterior Siguiente →

cs.LG