Zero-Shot Transferable Solution Method for Parametric Optimal Control Problems

Este artículo presenta un método de solución transferible y de cero disparos para problemas de control óptimo paramétrico que, mediante el uso de políticas de codificador de funciones y una descomposición fuera de línea/en línea, permite una adaptación eficiente a nuevos objetivos con un costo computacional mínimo y un rendimiento casi óptimo.

Xingjian Li, Kelvin Kan, Deepanshu Verma, Krishna Kumar, Stanley Osher, Ján Drgona2026-03-12🤖 cs.LG

Global Minimizers of Sigmoid Contrastive Loss

Este artículo explica teóricamente las ventajas de sincronizar la temperatura inversa y el sesgo entrenables en la pérdida de contraste sigmoidea, introduciendo el concepto de "Constelaciones" para justificar el éxito de SigLIP, explicar la brecha modal observada en modelos como CLIP y SigLIP, y determinar la dimensión necesaria para generar representaciones de alta calidad.

Kiril Bangachev, Guy Bresler, Iliyas Noman, Yury Polyanskiy2026-03-12🤖 cs.LG

Multi-modal Data Spectrum: Multi-modal Datasets are Multi-dimensional

Este estudio presenta una investigación empírica a gran escala que revela que las dependencias intra e inter-modales en los conjuntos de datos multimodales varían significativamente y que muchos benchmarks diseñados para reducir sesgos textuales han inadvertidamente amplificado la dependencia de las imágenes, lo que subraya la necesidad de un diseño de evaluación más riguroso.

Divyam Madaan, Varshan Muhunthan, Kyunghyun Cho, Sumit Chopra2026-03-12💬 cs.CL

One-Prompt Strikes Back: Sparse Mixture of Experts for Prompt-based Continual Learning

El artículo presenta SMoPE, un marco novedoso que integra una arquitectura de Mezcla de Expertos Escasos (MoE) en el aprendizaje continuo basado en prompts para equilibrar la eficiencia computacional y el rendimiento, mitigando la interferencia de conocimientos mediante la activación dinámica de expertos compartidos y mecanismos de pérdida basados en prototipos.

Minh Le, Bao-Ngoc Dao, Huy Nguyen, Quyen Tran, Anh Nguyen, Nhat Ho2026-03-12🤖 cs.LG

RADAR: Reasoning-Ability and Difficulty-Aware Routing for Reasoning LLMs

El artículo presenta RADAR, un marco de enrutamiento ligero e interpretable que optimiza el equilibrio entre rendimiento y coste en modelos de razonamiento asignando dinámicamente consultas de mayor dificultad a pares de modelo-presupuesto con mayor capacidad, basándose en un modelo de respuesta a ítems inspirado en la psicometría.

Nigel Fernandez, Branislav Kveton, Ryan A. Rossi, Andrew S. Lan, Zichao Wang2026-03-12🤖 cs.AI

Composer: A Search Framework for Hybrid Neural Architecture Design

El marco de búsqueda de arquitecturas modulares "Composer" descubre nuevas arquitecturas híbridas de LLM que superan a Llama 3.2 en precisión, eficiencia y pérdida de validación al explorar sistemáticamente combinaciones de primitivas computacionales a pequeña escala y extrapolar los resultados a escalas mayores.

Bilge Acun, Prasoon Sinha, Newsha Ardalani, Sangmin Bae, Alicia Golden, Chien-Yu Lin, Meghana Madhyastha, Fei Sun, Neeraja J. Yadwadkar, Carole-Jean Wu2026-03-12🤖 cs.LG

Uncovering Semantic Selectivity of Latent Groups in Higher Visual Cortex with Mutual Information-Guided Diffusion

El artículo presenta MIG-Vis, un método que utiliza modelos de difusión guiados por información mutua para visualizar y validar la selectividad semántica de grupos latentes en la corteza visual superior, demostrando mediante datos de macacos que la información visual se organiza en subespacios neuronales estructurados y semánticamente significativos.

Yule Wang, Joseph Yu, Chengrui Li, Weihan Li, Anqi Wu2026-03-12🧬 q-bio

A Systematic Evaluation of Self-Supervised Learning for Label-Efficient Sleep Staging with Wearable EEG

Este artículo presenta la primera evaluación sistemática del aprendizaje auto-supervisado para la estadificación del sueño con EEG portátil, demostrando que este enfoque supera a los modelos supervisados y a las redes neuronales de propósito general al lograr una precisión clínica con solo un 5% al 10% de datos etiquetados.

Emilio Estevan, María Sierra-Torralba, Eduardo López-Larraz, Luis Montesano2026-03-12🤖 cs.AI

Geopolitics, Geoeconomics, and Sovereign Risk: Different Shocks, Different Channels

El artículo demuestra que los choques geopolíticos y geoeconómicos afectan de manera distinta al riesgo soberano, operando a través de canales opuestos (un patrón de tijeras) donde los primeros impactan directamente el riesgo de incumplimiento y los segundos se transmiten mediante la política monetaria y el ciclo financiero global, lo que implica que la provisión de liquidez puede mitigar el segundo tipo de riesgo pero no el componente persistente de las primas de riesgo geopolítico.

Alvaro Ortiz, Tomasa Rodrigo, Pablo Saborido2026-03-12📊 stat

HyWA: Hypernetwork Weight Adapting Personalized Voice Activity Detection

El artículo presenta HyWA, un enfoque de detección de actividad vocal personalizada que utiliza una hiperred para generar pesos adaptados a un hablante específico en capas seleccionadas de un modelo estándar, logrando mejoras consistentes en el rendimiento y facilitando el despliegue al reutilizar la misma arquitectura.

Mahsa Ghazvini Nejad, Hamed Jafarzadeh Asl, Amin Edraki, Mohammadreza Sadeghi, Masoud Asgharian, Yuanhao Yu, Vahid Partovi Nia2026-03-12⚡ eess

Predicting kernel regression learning curves from only raw data statistics

Este artículo presenta un marco teórico basado en la "ansatz de estructura de autovalores Hermite" (HEA) que permite predecir las curvas de aprendizaje del regresión de kernel en conjuntos de datos reales utilizando únicamente estadísticas de datos brutos, demostrando que la estructura de datos anisotrópica se comporta de manera suficientemente gaussiana para aplicar aproximaciones analíticas y extendiendo estos hallazgos al aprendizaje de características en redes neuronales.

Dhruva Karkada, Joseph Turnbull, Yuxi Liu, James B. Simon2026-03-12🤖 cs.LG