A Novel Hybrid Heuristic-Reinforcement Learning Optimization Approach for a Class of Railcar Shunting Problems
Este artigo apresenta um novo framework híbrido que combina heurísticas específicas do setor ferroviário com aprendizado por reforço (Q-learning) para otimizar a formação de trens em pátios de manobra, decompondo problemas complexos de acesso bilateral com duas locomotivas em subproblemas mais simples de acesso unilateral.