cs.LG artículos | Gist.Science

Warm Starting State-Space Models with Automata Learning

Este trabajo demuestra que es posible realizar máquinas de Moore como modelos de espacio de estados, y propone un enfoque híbrido que utiliza el aprendizaje de autómatas simbólicos para inicializar estos modelos, logrando así una convergencia más rápida y una mayor precisión en comparación con la inicialización aleatoria.

William Fishell, Sam Nicholas Kouteili, Mark Santolucito2026-03-09🤖 cs.LG

Random Dot Product Graphs as Dynamical Systems: Limitations and Opportunities

Este artículo establece un marco geométrico basado en haces fibrados principales para analizar las limitaciones y oportunidades de aprender ecuaciones diferenciales que gobiernan la evolución de redes temporales dentro de grafos de producto escalar aleatorio, identificando obstáculos fundamentales como la libertad de gauge y la holonomía no trivial, mientras demuestra que las dinámicas simétricas pueden resolver la ambigüedad de gauge y proponiendo un pipeline constructivo para recuperar campos vectoriales a partir de secuencias de grafos ruidosos.

Giulio Valentino Dalla Riva2026-03-09🤖 cs.LG

The Rise of AI in Weather and Climate Information and its Impact on Global Inequality

El artículo advierte que la rápida adopción de la IA en la ciencia climática, al depender de una infraestructura computacional y de datos concentrada en el Norte Global, corre el riesgo de exacerbar las desigualdades globales y propone un cambio hacia un desarrollo centrado en los datos, infraestructura digital pública y co-producción de conocimiento para democratizar la soberanía tecnológica y garantizar una resiliencia sistémica equitativa.

Amirpasha Mozaffari, Amanda Duarte, Lina Teckentrup, Stefano Materia, Gina E. C. Charnley, Lluis Palma, Eulalia Baulenas Serra, Dragana Bojovic, Paula Checchia, Aude Carreric, Francisco Doblas-Reyes2026-03-09🤖 cs.AI

Unsupervised domain adaptation for radioisotope identification in gamma spectroscopy

Este estudio demuestra que la adaptación de dominio no supervisada, específicamente mediante la minimización de la discrepancia máxima del momento medio (MMD), mejora significativamente la capacidad de generalización de modelos de aprendizaje automático entrenados con datos sintéticos para la identificación de radioisótopos en espectroscopía gamma, permitiendo su despliegue efectivo en entornos operativos reales sin necesidad de datos etiquetados.

Peter Lalor, Ayush Panigrahy, Alex Hagen2026-03-09🤖 cs.LG

Revisiting the (Sub)Optimality of Best-of-N for Inference-Time Alignment

Este trabajo demuestra que la muestreo Best-of-N (BoN) es óptimo en términos estadísticos y computacionales para maximizar la tasa de victorias bajo condiciones realistas, y propone una variante simple que elimina el "reward hacking" manteniendo dicho rendimiento óptimo.

Ved Sriraman, Adam Block2026-03-09🤖 cs.AI

Full Dynamic Range Sky-Modelling For Image Based Lighting

El artículo presenta Icarus, un modelo de cielo todo tiempo basado en aprendizaje profundo que supera las limitaciones de los modelos actuales al generar mapas de entorno de alto rango dinámico completo (FDR) con nubes y posiciones solares controlables, logrando una iluminación basada en imágenes (IBL) con un realismo fotográfico y una precisión de sombras sin precedentes.

Ian J. Maquignaz2026-03-09🤖 cs.LG

MIRACL: A Diverse Meta-Reinforcement Learning for Multi-Objective Multi-Echelon Combinatorial Supply Chain Optimisation

El artículo presenta MIRACL, un marco jerárquico de meta-aprendizaje por refuerzo multiobjetivo que, mediante la descomposición de tareas y una estrategia de adaptación basada en Pareto, logra una generalización eficiente con pocos ejemplos en la optimización de cadenas de suministro multi-nivel, superando a las bases de referencia convencionales en rendimiento y adaptabilidad.

Rifny Rachman, Josh Tingey, Richard Allmendinger, Wei Pan, Pradyumn Shukla, Bahrul Ilmi Nasution2026-03-09🤖 cs.LG

Score-Guided Proximal Projection: A Unified Geometric Framework for Rectified Flow Editing

Este trabajo presenta Score-Guided Proximal Projection (SGPP), un marco geométrico unificado que reformula la edición de flujos rectificados como un problema de optimización proximal para equilibrar la fidelidad y el realismo, superando las limitaciones de los métodos actuales al garantizar la convergencia al modo posterior y ofrecer un control flexible entre la preservación de la identidad y la libertad generativa.

Vansh Bansal, James G Scott2026-03-09🤖 cs.LG

TML-Bench: Benchmark for Data Science Agents on Tabular ML Tasks

Este artículo presenta TML-Bench, un nuevo conjunto de pruebas para evaluar la eficacia y fiabilidad de agentes de IA autónomos en tareas de aprendizaje automático tabular tipo Kaggle, demostrando que el modelo MiniMax-M2.1 obtiene el mejor rendimiento global y que los resultados mejoran con mayores límites de tiempo.

Mykola Pinchuk2026-03-09🤖 cs.AI

Bridging Domains through Subspace-Aware Model Merging

El artículo presenta SCORE, un método de fusión de modelos que mejora la generalización de dominio al resolver conflictos entre subespacios singulares mediante la proyección de matrices de tareas en una base ortogonal compartida.

Levy Chaves, Chao Zhou, Rebekka Burkholz, Eduardo Valle, Sandra Avila2026-03-09🤖 cs.AI

Knowing without Acting: The Disentangled Geometry of Safety Mechanisms in Large Language Models

Este artículo propone la Hipótesis de Seguridad Desentrelazada (DSH), que revela una separación geométrica entre la detección de peligros y la ejecución de denegaciones en los modelos de lenguaje, permitiendo tanto la creación de un benchmark para validar esta disociación como el desarrollo del ataque de borrado de rechazo (REA) que logra tasas de éxito sin precedentes al eliminar quirúrgicamente el mecanismo de denegación.

Jinman Wu, Yi Xie, Shen Lin, Shiqian Zhao, Xiaofeng Chen2026-03-09🤖 cs.AI

First-Order Softmax Weighted Switching Gradient Method for Distributed Stochastic Minimax Optimization with Stochastic Constraints

Este artículo presenta un nuevo método de gradiente conmutativo ponderado por softmax para la optimización minimax estocástica distribuida con restricciones estocásticas, que garantiza una convergencia estable y de alta probabilidad en escenarios de aprendizaje federado con participación parcial, superando las limitaciones de los enfoques tradicionales basados en primal-dual o penalizaciones.

Zhankun Luo, Antesh Upadhyay, Sang Bin Moon, Abolfazl Hashemi2026-03-09🤖 cs.LG

The Coordination Gap: Alternation Metrics for Temporal Dynamics in Multi-Agent Battle of the Exes

Este artículo introduce métricas de alternancia temporalmente sensibles para evaluar la coordinación en juegos multiagente, demostrando que las métricas tradicionales pueden ocultar graves deficiencias en la dinámica temporal al revelar que las políticas aprendidas, a pesar de altos rendimientos agregados, pueden tener un desempeño significativamente inferior al de políticas aleatorias.

Nikolaos Al. Papadopoulos, Konstantinos Psannis2026-03-09🤖 cs.LG

Sparse Crosscoders for diffing MoEs and Dense models

Este estudio utiliza crosscoders para comparar modelos MoE y densos, revelando que los MoE desarrollan representaciones más especializadas con menos características únicas y mayor densidad de activación en sus características específicas, mientras que los modelos densos distribuyen la información en características más amplias y generalistas.

Marmik Chaudhari, Nishkal Hundia, Idhant Gulati2026-03-09🤖 cs.LG

MoE Lens -- An Expert Is All You Need

El artículo "MoE Lens" demuestra mediante un análisis sistemático del modelo DeepSeekMoE que la especialización de los expertos en las arquitecturas Mixture of Experts está altamente concentrada en unos pocos dominantes, lo que sugiere que es posible optimizar la inferencia mediante la poda selectiva de expertos sin comprometer significativamente el rendimiento del modelo.

Marmik Chaudhari, Idhant Gulati, Nishkal Hundia, Pranav Karra, Shivam Raval2026-03-09🤖 cs.LG

Margin and Consistency Supervision for Calibrated and Robust Vision Models

El artículo presenta MaCS, un marco de regularización simple y agnóstico a la arquitectura que mejora la calibración y la robustez de los modelos de visión mediante la combinación de una penalización de margen en el espacio de logits y un regularizador de consistencia, logrando mejores garantías teóricas y rendimiento empírico sin requerir datos adicionales ni cambios arquitectónicos.

Salim Khazem2026-03-09🤖 cs.AI

Self-Auditing Parameter-Efficient Fine-Tuning for Few-Shot 3D Medical Image Segmentation

El artículo presenta SEA-PEFT, un método de ajuste fino eficiente en parámetros que automatiza la configuración de adaptadores mediante un bucle de búsqueda-auditoría-asignación para superar los desafíos de la adaptación de modelos fundacionales a nuevos sitios clínicos con pocos datos en segmentación 3D de imágenes médicas.

Son Thai Ly, Hien V. Nguyen2026-03-09🤖 cs.LG

Test-Time Adaptation via Many-Shot Prompting: Benefits, Limits, and Pitfalls

Este estudio evalúa empíricamente la adaptación en tiempo de prueba mediante prompting con muchas muestras en modelos de lenguaje, revelando que aunque es eficaz para tareas estructuradas con alto valor informativo, su utilidad es limitada y sensible a la estrategia de selección en tareas de generación abierta, lo que permite definir sus límites prácticos frente a otras estrategias como el ICL dinámico y reforzado.

Shubhangi Upasani, Chen Wu, Jay Rainton, Bo Li, Changran Hu, Qizheng Zhang, Urmish Thakker2026-03-09🤖 cs.LG

ReflexiCoder: Teaching Large Language Models to Self-Reflect on Generated Code and Self-Correct It via Reinforcement Learning

ReflexiCoder es un nuevo marco de aprendizaje por refuerzo que entrena a modelos de lenguaje grandes para internalizar la capacidad de autocrítica y autocorrección de código de forma autónoma durante la inferencia, logrando un rendimiento de vanguardia en múltiples benchmarks sin depender de oráculos externos ni motores de ejecución.

Juyong Jiang, Jiasi Shen, Sunghun Kim, Kang Min Yoo, Jeonghoon Kim, Sungju Kim2026-03-09🤖 cs.LG

Stochastic Event Prediction via Temporal Motif Transitions

El artículo presenta STEP, un marco de predicción estocástica que reformula la predicción de enlaces temporales como un problema de pronóstico secuencial en tiempo continuo mediante transiciones de motivos temporales gobernadas por procesos de Poisson, logrando mejoras significativas en precisión y eficiencia en comparación con los métodos existentes.

\.Ibrahim Bahadır Altun, Ahmet Erdem Sarıyüce2026-03-09🤖 cs.LG

← Anterior Siguiente →