Bridging Kolmogorov Complexity and Deep Learning: Asymptotically Optimal Description Length Objectives for Transformers
Este artículo propone un marco teórico que vincula la complejidad de Kolmogorov con el aprendizaje profundo mediante objetivos de longitud de descripción asintóticamente óptimos para Transformers, demostrando su existencia teórica y viabilidad práctica a través de un objetivo variacional, aunque se identifican desafíos significativos en la optimización para encontrar soluciones de baja complejidad.