cs.LG artículos | Gist.Science

Proposing a Framework for Machine Learning Adoption on Legacy Systems

Este artículo presenta un marco práctico basado en API que desacopla el ciclo de vida de los modelos de aprendizaje automático de los sistemas heredados mediante una interfaz web ligera, permitiendo a las empresas integrar capacidades de ML sin costosas actualizaciones de hardware ni tiempos de inactividad operativa.

Ashiqur Rahman, Hamed Alhoori2026-03-12🤖 cs.LG

One-Prompt Strikes Back: Sparse Mixture of Experts for Prompt-based Continual Learning

El artículo presenta SMoPE, un marco novedoso que integra una arquitectura de Mezcla de Expertos Escasos (MoE) en el aprendizaje continuo basado en prompts para equilibrar la eficiencia computacional y el rendimiento, mitigando la interferencia de conocimientos mediante la activación dinámica de expertos compartidos y mecanismos de pérdida basados en prototipos.

Minh Le, Bao-Ngoc Dao, Huy Nguyen, Quyen Tran, Anh Nguyen, Nhat Ho2026-03-12🤖 cs.LG

RADAR: Reasoning-Ability and Difficulty-Aware Routing for Reasoning LLMs

El artículo presenta RADAR, un marco de enrutamiento ligero e interpretable que optimiza el equilibrio entre rendimiento y coste en modelos de razonamiento asignando dinámicamente consultas de mayor dificultad a pares de modelo-presupuesto con mayor capacidad, basándose en un modelo de respuesta a ítems inspirado en la psicometría.

Nigel Fernandez, Branislav Kveton, Ryan A. Rossi, Andrew S. Lan, Zichao Wang2026-03-12🤖 cs.AI

Composer: A Search Framework for Hybrid Neural Architecture Design

El marco de búsqueda de arquitecturas modulares "Composer" descubre nuevas arquitecturas híbridas de LLM que superan a Llama 3.2 en precisión, eficiencia y pérdida de validación al explorar sistemáticamente combinaciones de primitivas computacionales a pequeña escala y extrapolar los resultados a escalas mayores.

Bilge Acun, Prasoon Sinha, Newsha Ardalani, Sangmin Bae, Alicia Golden, Chien-Yu Lin, Meghana Madhyastha, Fei Sun, Neeraja J. Yadwadkar, Carole-Jean Wu2026-03-12🤖 cs.LG

Uncovering Semantic Selectivity of Latent Groups in Higher Visual Cortex with Mutual Information-Guided Diffusion

El artículo presenta MIG-Vis, un método que utiliza modelos de difusión guiados por información mutua para visualizar y validar la selectividad semántica de grupos latentes en la corteza visual superior, demostrando mediante datos de macacos que la información visual se organiza en subespacios neuronales estructurados y semánticamente significativos.

Yule Wang, Joseph Yu, Chengrui Li, Weihan Li, Anqi Wu2026-03-12🧬 q-bio

Communication Enables Cooperation in LLM Agents: A Comparison with Curriculum-Based Approaches

El estudio demuestra que en sistemas de agentes LLM, la comunicación directa es un mecanismo de coordinación más robusto y fiable que el aprendizaje curricular, el cual puede socavar la alineación al inducir pesimismo aprendido mediante diseños de entrenamiento inadecuados.

Hachem Madmoun, Salem Lahlou2026-03-12🤖 cs.LG

A Systematic Evaluation of Self-Supervised Learning for Label-Efficient Sleep Staging with Wearable EEG

Este artículo presenta la primera evaluación sistemática del aprendizaje auto-supervisado para la estadificación del sueño con EEG portátil, demostrando que este enfoque supera a los modelos supervisados y a las redes neuronales de propósito general al lograr una precisión clínica con solo un 5% al 10% de datos etiquetados.

Emilio Estevan, María Sierra-Torralba, Eduardo López-Larraz, Luis Montesano2026-03-12🤖 cs.AI

Geopolitics, Geoeconomics, and Sovereign Risk: Different Shocks, Different Channels

El artículo demuestra que los choques geopolíticos y geoeconómicos afectan de manera distinta al riesgo soberano, operando a través de canales opuestos (un patrón de tijeras) donde los primeros impactan directamente el riesgo de incumplimiento y los segundos se transmiten mediante la política monetaria y el ciclo financiero global, lo que implica que la provisión de liquidez puede mitigar el segundo tipo de riesgo pero no el componente persistente de las primas de riesgo geopolítico.

Alvaro Ortiz, Tomasa Rodrigo, Pablo Saborido2026-03-12📊 stat

HyWA: Hypernetwork Weight Adapting Personalized Voice Activity Detection

El artículo presenta HyWA, un enfoque de detección de actividad vocal personalizada que utiliza una hiperred para generar pesos adaptados a un hablante específico en capas seleccionadas de un modelo estándar, logrando mejoras consistentes en el rendimiento y facilitando el despliegue al reutilizar la misma arquitectura.

Mahsa Ghazvini Nejad, Hamed Jafarzadeh Asl, Amin Edraki, Mohammadreza Sadeghi, Masoud Asgharian, Yuanhao Yu, Vahid Partovi Nia2026-03-12⚡ eess

Reveal-to-Revise: Explainable Bias-Aware Generative Modeling with Multimodal Attention

Este artículo presenta un marco generativo explicable y consciente de los sesgos que unifica la fusión de atención multimodal, la atribución Grad-CAM++ y un bucle de retroalimentación de revisión para mejorar la precisión, la robustez y la equidad en aplicaciones de IA de alto riesgo.

Noor Islam S. Mohammad, Md Muntaqim Meherab2026-03-12🤖 cs.LG

Absolute indices for determining compactness, separability and number of clusters

Este artículo presenta nuevos índices absolutos de validez de clusters que permiten determinar la compacidad, la separabilidad y el número óptimo de clusters en un conjunto de datos, superando las limitaciones de los índices relativos tradicionales mediante su validación en diversos conjuntos de datos sintéticos y reales.

Adil M. Bagirov, Ramiz M. Aliguliyev, Nargiz Sultanova, Sona Taheri2026-03-12📊 stat

Predicting kernel regression learning curves from only raw data statistics

Este artículo presenta un marco teórico basado en la "ansatz de estructura de autovalores Hermite" (HEA) que permite predecir las curvas de aprendizaje del regresión de kernel en conjuntos de datos reales utilizando únicamente estadísticas de datos brutos, demostrando que la estructura de datos anisotrópica se comporta de manera suficientemente gaussiana para aplicar aproximaciones analíticas y extendiendo estos hallazgos al aprendizaje de características en redes neuronales.

Dhruva Karkada, Joseph Turnbull, Yuxi Liu, James B. Simon2026-03-12🤖 cs.LG

Revisiting Value Iteration: Unified Analysis of Discounted and Average-Reward Cases

Este trabajo presenta un análisis unificado basado en la geometría que demuestra que, bajo la suposición de una política óptima única y unichain, el algoritmo de Iteración de Valores converge geométricamente tanto en los casos de recompensa descontada como promedio, superando las tasas de convergencia establecidas por teorías anteriores.

Arsenii Mustafin, Xinyi Sheng, Dominik Baumann2026-03-12🤖 cs.LG

KV Cache Transform Coding for Compact Storage in LLM Inference

El artículo presenta KVTC, un codificador transformador ligero que comprime las cachés KV de los modelos de lenguaje grandes mediante decorrelación de características, cuantización adaptativa y codificación de entropía, logrando una reducción de memoria de hasta 20 veces sin comprometer la precisión del modelo.

Konrad Staniszewski, Adrian Łancucki2026-03-12💬 cs.CL

Causal Regime Detection in Energy Markets With Augmented Time Series Structural Causal Models

Este artículo presenta los Modelos Causales de Series Temporales Aumentados (ATSCM), un enfoque que integra la descubrimiento causal neuronal para modelar las relaciones causales dinámicas en los mercados energéticos y permitir el razonamiento contrafactual sobre escenarios de generación renovada sin depender de grafos causales predefinidos.

Dennis Thumm2026-03-12📊 stat

Towards Causal Market Simulators

El artículo presenta el TNCM-VAE, un modelo que combina autoencoders variacionales con modelos causales estructurales para generar series temporales financieras contrafactuales que preservan tanto las dependencias temporales como las relaciones causales, permitiendo así análisis de riesgo y pruebas de estrés más robustos.

Dennis Thumm, Luis Ontaneda Mijares2026-03-12📊 stat

Resource Allocation in Hybrid Radio-Optical IoT Networks using GNN with Multi-task Learning

Este artículo propone el marco DGET, que utiliza aprendizaje multitarea con redes neuronales gráficas y transformadores para optimizar la asignación de recursos en redes IoT híbridas de radio-óptico, logrando un rendimiento cercano al óptimo con menor complejidad computacional y mayor robustez ante observabilidad parcial del canal en comparación con los métodos tradicionales.

Aymen Hamrouni, Sofie Pollin, Hazem Sallouha2026-03-12🤖 cs.LG

STREAM-VAE: Dual-Path Routing for Slow and Fast Dynamics in Vehicle Telemetry Anomaly Detection

El artículo presenta STREAM-VAE, un modelo de autoencoder variacional que mejora la detección de anomalías en telemetría de vehículos mediante un enrutamiento dual que separa las dinámicas de deriva lenta y picos rápidos para generar puntuaciones estables y robustas.

Kadir-Kaan Özer, René Ebeling, Markus Enzweiler2026-03-12🤖 cs.LG

Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data

Este artículo presenta un marco de olvido selectivo jerárquico de doble estrategia que, mediante actualizaciones de gradiente geométricamente restringidas e intervenciones a nivel de tokens conscientes de conceptos, elimina eficazmente conocimientos médicos específicos de grandes modelos de lenguaje preservando sus competencias fundamentales y garantizando la privacidad con una modificación mínima de parámetros.

Yi Zhang, Chao Zhang, Zijian Li, Tianxiang Xu, Kunyu Zhang, Zhan Gao, Meinuo Li, Xiaohan Zhang, Qichao Qi, Bing Chen2026-03-12🤖 cs.LG

CostNav: A Navigation Benchmark for Real-World Economic-Cost Evaluation of Physical AI Agents

El artículo presenta CostNav, un nuevo benchmark que evalúa la viabilidad económica real de los agentes de IA física para la navegación mediante el análisis de costos y beneficios utilizando datos regulatorios y financieros de la industria, revelando que los métodos actuales, aunque exitosos en tareas simplificadas, no son económicamente viables en escenarios del mundo real.

Haebin Seong, Sungmin Kim, Yongjun Cho, Myunchul Joe, Geunwoo Kim, Yubeen Park, Sunhoo Kim, Yoonshik Kim, Suhwan Choi, Jaeyoon Jung, Jiyong Youn, Jinmyung Kwak, Sunghee Ahn, Jaemin Lee, Younggil Do, Seungyeop Yi, Woojin Cheong, Minhyeok Oh, Minchan Kim, Seongjae Kang, Samwoo Seong, Youngjae Yu, Yunsung Lee2026-03-12🤖 cs.AI

← Anterior Siguiente →