A Novel Hybrid Heuristic-Reinforcement Learning Optimization Approach for a Class of Railcar Shunting Problems
Este artículo presenta un marco híbrido novedoso que combina heurísticas específicas del ferrocarril con aprendizaje por refuerzo (Q-learning) para optimizar eficientemente la clasificación de vagones en patios ferroviarios, abordando tanto configuraciones de acceso unilateral como bilateral mediante la descomposición del problema y la reducción del espacio de estados.