cs.LG artículos | Gist.Science

Comparative Analysis of Modern Machine Learning Models for Retail Sales Forecasting

Este estudio demuestra que, en el contexto de la previsión de ventas minoristas con demanda intermitente y datos incompletos, los métodos basados en árboles como XGBoost superan a arquitecturas de aprendizaje profundo más sofisticadas, lo que sugiere que la selección del modelo debe priorizar la adecuación a las características del problema sobre la complejidad arquitectónica.

Luka Hobor, Mario Brcic, Lidija Polutnik, Ante Kapetanovic2026-03-12🤖 cs.LG

Learning What Reinforcement Learning Can't: Interleaved Online Fine-Tuning for Hardest Questions

El artículo presenta ReLIFT, un nuevo enfoque de entrenamiento que alterna el aprendizaje por refuerzo con el ajuste fino en línea para superar las limitaciones del primero al incorporar nuevos conocimientos y patrones de razonamiento, logrando así mejoras significativas en benchmarks de alto nivel con una fracción mínima de datos de demostración.

Lu Ma, Hao Liang, Meiyi Qiang, Lexiang Tang, Xiaochen Ma, Zhen Hao Wong, Junbo Niu, Chengyu Shen, Runming He, Yanhao Li, Bin Cui, Wentao Zhang2026-03-12🤖 cs.AI

Sequential-Parallel Duality in Prefix Scannable Models

Este artículo introduce los Modelos Escaneables de Prefijo (PSMs), una clase general de modelos de secuencia que unifica arquitecturas existentes como Mamba y GLA mediante operadores de agregación no necesariamente asociativos, logrando así un equilibrio óptimo entre entrenamiento paralelo, inferencia eficiente y una fuerte generalización en longitud.

Morris Yau, Sharut Gupta, Valerie Engelmayer, Kazuki Irie, Stefanie Jegelka, Jacob Andreas2026-03-12🤖 cs.LG

Differential Privacy in Machine Learning: A Survey from Symbolic AI to LLMs

Esta encuesta revisa la evolución de la privacidad diferencial desde sus fundamentos teóricos hasta su integración en modelos de aprendizaje automático, abarcando desde la IA simbólica hasta los grandes modelos de lenguaje, con el fin de ofrecer una visión integral para el desarrollo de sistemas de IA seguros y responsables.

Francisco Aguilera-Martínez, Fernando Berzal2026-03-12🤖 cs.AI

Silhouette-Driven Instance-Weighted $k$ -means

El artículo presenta K-Sil, una variante del algoritmo $k$ -means que mejora la agrupación ponderando las instancias según una métrica de silueta adaptativa para reducir la influencia de los puntos ambiguos y ruidosos, logrando así un rendimiento superior en diversos conjuntos de datos reales.

Aggelos Semoglou, Aristidis Likas, John Pavlopoulos2026-03-12🤖 cs.LG

The Yokai Learning Environment: Tracking Beliefs Over Space and Time

Este artículo presenta el Entorno de Aprendizaje Yokai (YLE), un nuevo benchmark de código abierto para la coordinación cero-shot que supera las limitaciones del entorno Hanabi al requerir que los agentes cooperen mediante el seguimiento de creencias sobre cartas móviles y el razonamiento bajo pistas ambiguas, revelando así que los métodos de vanguardia que dominan Hanabi fallan en mantener modelos internos consistentes con socios desconocidos en este nuevo entorno.

Constantin Ruhdorfer, Matteo Bortoletto, Johannes Forkel, Jakob Foerster, Andreas Bulling2026-03-12🤖 cs.AI

Order Optimal Regret Bounds for Sharpe Ratio Optimization under Thompson Sampling

Este artículo presenta el algoritmo \texttt{SRTS} basado en muestreo de Thompson para la optimización del ratio de Sharpe en un entorno de banditos estocásticos, demostrando teóricamente que alcanza límites de arrepentimiento óptimos en orden y superando a los métodos existentes en simulaciones empíricas.

Mohammad Taha Shah, Sabrina Khurshid, Gourab Ghatak2026-03-12🤖 cs.LG

Universal Dynamics with Globally Controlled Analog Quantum Simulators

Este trabajo establece las condiciones teóricas para la universalidad en simuladores cuánticos análogos con control global, demuestra su capacidad para generar dinámicas complejas y validación experimental mediante control óptimo directo en átomos de Rydberg, logrando interacciones de tres cuerpos y dinámicas topológicas.

Hong-Ye Hu, Abigail McClain Gomez, Liyuan Chen, Aaron Trowbridge, Andy J. Goldschmidt, Zachary Manchester, Frederic T. Chong, Arthur Jaffe, Susanne F. Yelin2026-03-12⚛️ quant-ph

Tensor Train Completion from Fiberwise Observations Along a Single Mode

Este trabajo presenta un método rápido y determinista basado en álgebra lineal estándar para completar tensores mediante la descomposición en tren tensorial, aprovechando patrones de observación donde las fibras a lo largo de un único modo están completamente registradas o totalmente ausentes.

Shakir Showkat Sofi, Lieven De Lathauwer2026-03-12⚡ eess

Zero-Shot Transferable Solution Method for Parametric Optimal Control Problems

Este artículo presenta un método de solución transferible y de cero disparos para problemas de control óptimo paramétrico que, mediante el uso de políticas de codificador de funciones y una descomposición fuera de línea/en línea, permite una adaptación eficiente a nuevos objetivos con un costo computacional mínimo y un rendimiento casi óptimo.

Xingjian Li, Kelvin Kan, Deepanshu Verma, Krishna Kumar, Stanley Osher, Ján Drgona2026-03-12🤖 cs.LG

Global Minimizers of Sigmoid Contrastive Loss

Este artículo explica teóricamente las ventajas de sincronizar la temperatura inversa y el sesgo entrenables en la pérdida de contraste sigmoidea, introduciendo el concepto de "Constelaciones" para justificar el éxito de SigLIP, explicar la brecha modal observada en modelos como CLIP y SigLIP, y determinar la dimensión necesaria para generar representaciones de alta calidad.

Kiril Bangachev, Guy Bresler, Iliyas Noman, Yury Polyanskiy2026-03-12🤖 cs.LG

Deep Learning for Clouds and Cloud Shadow Segmentation in Methane Satellite and Airborne Imaging Spectroscopy

Este estudio demuestra que los modelos de aprendizaje profundo, específicamente U-Net y SCAN, superan significativamente a los métodos convencionales en la detección precisa de nubes y sombras para mejorar la cuantificación de emisiones de metano en las misiones satelitales MethaneSAT y MethaneAIR.

Manuel Perez-Carrasco, Maya Nasr, Sebastien Roche + 12 more2026-03-12🤖 cs.LG

Multi-modal Data Spectrum: Multi-modal Datasets are Multi-dimensional

Este estudio presenta una investigación empírica a gran escala que revela que las dependencias intra e inter-modales en los conjuntos de datos multimodales varían significativamente y que muchos benchmarks diseñados para reducir sesgos textuales han inadvertidamente amplificado la dependencia de las imágenes, lo que subraya la necesidad de un diseño de evaluación más riguroso.

Divyam Madaan, Varshan Muhunthan, Kyunghyun Cho, Sumit Chopra2026-03-12💬 cs.CL

Proposing a Framework for Machine Learning Adoption on Legacy Systems

Este artículo presenta un marco práctico basado en API que desacopla el ciclo de vida de los modelos de aprendizaje automático de los sistemas heredados mediante una interfaz web ligera, permitiendo a las empresas integrar capacidades de ML sin costosas actualizaciones de hardware ni tiempos de inactividad operativa.

Ashiqur Rahman, Hamed Alhoori2026-03-12🤖 cs.LG

One-Prompt Strikes Back: Sparse Mixture of Experts for Prompt-based Continual Learning

El artículo presenta SMoPE, un marco novedoso que integra una arquitectura de Mezcla de Expertos Escasos (MoE) en el aprendizaje continuo basado en prompts para equilibrar la eficiencia computacional y el rendimiento, mitigando la interferencia de conocimientos mediante la activación dinámica de expertos compartidos y mecanismos de pérdida basados en prototipos.

Minh Le, Bao-Ngoc Dao, Huy Nguyen, Quyen Tran, Anh Nguyen, Nhat Ho2026-03-12🤖 cs.LG

RADAR: Reasoning-Ability and Difficulty-Aware Routing for Reasoning LLMs

El artículo presenta RADAR, un marco de enrutamiento ligero e interpretable que optimiza el equilibrio entre rendimiento y coste en modelos de razonamiento asignando dinámicamente consultas de mayor dificultad a pares de modelo-presupuesto con mayor capacidad, basándose en un modelo de respuesta a ítems inspirado en la psicometría.

Nigel Fernandez, Branislav Kveton, Ryan A. Rossi, Andrew S. Lan, Zichao Wang2026-03-12🤖 cs.AI

Composer: A Search Framework for Hybrid Neural Architecture Design

El marco de búsqueda de arquitecturas modulares "Composer" descubre nuevas arquitecturas híbridas de LLM que superan a Llama 3.2 en precisión, eficiencia y pérdida de validación al explorar sistemáticamente combinaciones de primitivas computacionales a pequeña escala y extrapolar los resultados a escalas mayores.

Bilge Acun, Prasoon Sinha, Newsha Ardalani, Sangmin Bae, Alicia Golden, Chien-Yu Lin, Meghana Madhyastha, Fei Sun, Neeraja J. Yadwadkar, Carole-Jean Wu2026-03-12🤖 cs.LG

Uncovering Semantic Selectivity of Latent Groups in Higher Visual Cortex with Mutual Information-Guided Diffusion

El artículo presenta MIG-Vis, un método que utiliza modelos de difusión guiados por información mutua para visualizar y validar la selectividad semántica de grupos latentes en la corteza visual superior, demostrando mediante datos de macacos que la información visual se organiza en subespacios neuronales estructurados y semánticamente significativos.

Yule Wang, Joseph Yu, Chengrui Li, Weihan Li, Anqi Wu2026-03-12🧬 q-bio

Communication Enables Cooperation in LLM Agents: A Comparison with Curriculum-Based Approaches

El estudio demuestra que en sistemas de agentes LLM, la comunicación directa es un mecanismo de coordinación más robusto y fiable que el aprendizaje curricular, el cual puede socavar la alineación al inducir pesimismo aprendido mediante diseños de entrenamiento inadecuados.

Hachem Madmoun, Salem Lahlou2026-03-12🤖 cs.LG

A Systematic Evaluation of Self-Supervised Learning for Label-Efficient Sleep Staging with Wearable EEG

Este artículo presenta la primera evaluación sistemática del aprendizaje auto-supervisado para la estadificación del sueño con EEG portátil, demostrando que este enfoque supera a los modelos supervisados y a las redes neuronales de propósito general al lograr una precisión clínica con solo un 5% al 10% de datos etiquetados.

Emilio Estevan, María Sierra-Torralba, Eduardo López-Larraz, Luis Montesano2026-03-12🤖 cs.AI

← Anterior Siguiente →

cs.LG