LycheeCluster: Efficient Long-Context Inference with Structure-Aware Chunking and Hierarchical KV Indexing

El artículo presenta LycheeCluster, un método innovador de gestión de caché KV que utiliza fragmentación consciente de límites y un índice jerárquico recursivo para acelerar la inferencia de modelos de lenguaje grandes en contextos largos hasta en un 3,6 veces sin comprometer significativamente su rendimiento.

Dongfang Li, Zixuan Liu, Gang Lin, Baotian Hu, Min Zhang2026-03-10🤖 cs.LG

The Boiling Frog Threshold: Criticality and Blindness in World Model-Based Anomaly Detection Under Gradual Drift

El estudio revela que la capacidad de un agente de aprendizaje por refuerzo para detectar la degradación gradual de sus observaciones depende de un umbral crítico universal que surge de la interacción entre el nivel de ruido, el detector y la dinámica específica del entorno, lo que explica tanto la existencia de un punto de ruptura agudo como la imposibilidad de detectar ciertos patrones de deriva o fallos catastróficos antes de que ocurran.

Zhe Hong2026-03-10🤖 cs.LG

Adaptive Entropy-Driven Sensor Selection in a Camera-LiDAR Particle Filter for Single-Vessel Tracking

Este artículo presenta un sistema de seguimiento de embarcaciones que fusiona datos de cámaras y LiDAR mediante un filtro de partículas con una política de selección de sensores adaptativa basada en la entropía, demostrando en un puerto real de Chipre que esta estrategia optimiza el equilibrio entre precisión y continuidad al activar dinámicamente el sensor más informativo según las condiciones ambientales.

Andrei Starodubov, Yaqub Aris Prabowo, Andreas Hadjipieris, Ioannis Kyriakides, Roberto Galeazzi2026-03-10🤖 cs.LG

Data-Driven Priors for Uncertainty-Aware Deterioration Risk Prediction with Multimodal Data

Este trabajo presenta MedCertAIn\texttt{MedCertAIn}, un marco predictivo que utiliza datos clínicos multimodales y priores basados en datos para mejorar significativamente el rendimiento y la cuantificación de incertidumbre en la predicción de riesgos intrahospitalarios, superando a los métodos deterministas y bayesianos actuales.

L. Julián Lechuga López, Tim G. J. Rudner, Farah E. Shamout2026-03-10🤖 cs.LG

Reasoning as Compression: Unifying Budget Forcing via the Conditional Information Bottleneck

Este artículo propone un enfoque unificado para la generación eficiente de razonamiento en modelos de lenguaje mediante el Principio del Cuello de Botella de Información Condicional (CIB), que reformula el problema como una compresión con pérdidas para eliminar el relleno cognitivo sin sacrificar la lógica, superando las limitaciones de los métodos actuales de "forzamiento de presupuesto" mediante una función de objetivo de aprendizaje por refuerzo que prioriza la información semántica sobre el simple conteo de tokens.

Fabio Valerio Massoli, Andrey Kuzmin, Arash Behboodi2026-03-10🤖 cs.LG

MUSA-PINN: Multi-scale Weak-form Physics-Informed Neural Networks for Fluid Flow in Complex Geometries

El artículo presenta MUSA-PINN, un método de redes neuronales informadas por física de forma débil multi-escala que reformula las leyes de conservación como integrales sobre volúmenes de control jerárquicos para resolver con mayor precisión y estabilidad el flujo de fluidos en geometrías complejas como las superficies mínimas periódicas triplemente (TPMS), superando las limitaciones de convergencia de los enfoques tradicionales.

Weizheng Zhang, Xunjie Xie, Hao Pan, Xiaowei Duan, Bingteng Sun, Qiang Du, Lin lu2026-03-10🤖 cs.LG

Integrating Lagrangian Neural Networks into the Dyna Framework for Reinforcement Learning

Este trabajo propone un marco de aprendizaje por refuerzo basado en modelos (MBRL) que integra redes neuronales lagrangianas dentro de la arquitectura Dyna para garantizar el cumplimiento de las leyes físicas y mejorar la precisión de las predicciones, demostrando que el uso de optimizadores basados en estimación de estado acelera la convergencia en comparación con los métodos basados en gradiente estocástico.

Shreya Das, Kundan Kumar, Muhammad Iqbal, Outi Savolainen, Dominik Baumann, Laura Ruotsalainen, Simo Särkkä2026-03-10🤖 cs.LG

X-AVDT: Audio-Visual Cross-Attention for Robust Deepfake Detection

El artículo presenta X-AVDT, un detector de deepfakes robusto que aprovecha las señales de alineación audio-visual internas de los generadores obtenidas mediante inversión DDIM, junto con el nuevo conjunto de datos multimodal MMDF, para lograr un rendimiento superior y una mejor generalización frente a modelos de síntesis no vistos.

Youngseo Kim, Kwan Yun, Seokhyeon Hong, Sihun Cha, Colette Suhjung Koo, Junyong Noh2026-03-10🤖 cs.LG

NN-OpInf: an operator inference approach using structure-preserving composable neural networks

El artículo presenta NN-OpInf, un marco de inferencia de operadores no intrusivo que utiliza redes neuronales composables y preservadoras de estructura para lograr una reducción de orden más precisa y estable en sistemas dinámicos con no linealidades no polinómicas, superando a los métodos polinómicos tradicionales a costa de un mayor costo computacional.

Eric Parish, Anthony Gruber, Patrick Blonigan, Irina Tezaur2026-03-10🤖 cs.LG

Echo2ECG: Enhancing ECG Representations with Cardiac Morphology from Multi-View Echos

El artículo presenta Echo2ECG, un marco de aprendizaje multimodal auto-supervisado que enriquece las representaciones de los electrocardiogramas (ECG) integrando la morfología cardíaca de ecocardiogramas multivista, logrando un rendimiento superior en tareas clínicas que requieren información estructural y superando a modelos de referencia mucho más grandes.

Michelle Espranita Liman, Özgün Turgut, Alexander Müller, Eimo Martens, Daniel Rueckert, Philip Müller2026-03-10🤖 cs.LG

Oracle-Guided Soft Shielding for Safe Move Prediction in Chess

Este trabajo presenta el Enmascaramiento Suave Guiado por Oráculo (OGSS), un marco que combina un modelo de política de aprendizaje por imitación con un predictor de errores tácticos derivado de Stockfish para permitir una exploración segura y competitiva en ajedrez, reduciendo significativamente la tasa de errores sin comprometer el rendimiento.

Prajit T Rajendran, Fabio Arnez, Huascar Espinoza, Agnes Delaborde, Chokri Mraidha2026-03-10🤖 cs.LG

Breaking the Bias Barrier in Concave Multi-Objective Reinforcement Learning

Este trabajo supera la barrera de sesgo en el aprendizaje por refuerzo multiobjetivo con escalarización cóncava mediante un algoritmo de gradiente de política natural equipado con un estimador Monte Carlo de múltiples niveles, logrando una complejidad de muestra óptima de O~(ϵ2)\widetilde{\mathcal{O}}(\epsilon^{-2}) y demostrando que, bajo suavidad de segundo orden, el sesgo de primer orden se cancela automáticamente.

Swetha Ganesh, Vaneet Aggarwal2026-03-10🤖 cs.LG

Towards Effective and Efficient Graph Alignment without Supervision

El artículo presenta \texttt{GlobAlign} y su variante eficiente \texttt{GlobAlign-E}, nuevos métodos de alineación de grafos sin supervisión que superan las limitaciones de precisión y eficiencia de las técnicas existentes mediante un paradigma de representación global y transporte óptimo jerárquico, logrando mejoras significativas en exactitud y velocidad.

Songyang Chen, Youfang Lin, Yu Liu, Shuai Zheng, Lei Zou2026-03-10🤖 cs.LG

Interactive World Simulator for Robot Policy Training and Evaluation

El artículo presenta el "Interactive World Simulator", un marco que utiliza modelos de consistencia para generar simulaciones interactivas rápidas y físicamente coherentes que permiten entrenar y evaluar políticas robóticas de manera escalable con un rendimiento comparable al obtenido con datos del mundo real.

Yixuan Wang, Rhythm Syed, Fangyu Wu, Mengchao Zhang, Aykut Onol, Jose Barreiros, Hooshang Nayyeri, Tony Dear, Huan Zhang, Yunzhu Li2026-03-10🤖 cs.LG

Impact of Connectivity on Laplacian Representations in Reinforcement Learning

Este trabajo establece límites teóricos sobre el error de aproximación en la representación de estados para el aprendizaje por refuerzo, demostrando cómo la calidad de la representación basada en autovectores del Laplaciano depende de la conectividad algebraica del grafo de transiciones y proporcionando una descomposición del error que incluye la estimación de dichos autovectores.

Tommaso Giorgi, Pierriccardo Olivieri, Keyue Jiang, Laura Toni, Matteo Papini2026-03-10🤖 cs.LG