Chart-RL: Generalized Chart Comprehension via Reinforcement Learning with Verifiable Rewards
El artículo presenta Chart-RL, un método de aprendizaje por refuerzo que utiliza recompensas matemáticamente verificables para superar a la fine-tuning supervisado en la comprensión de gráficos, demostrando que la complejidad de las tareas de razonamiento es más determinante que la cantidad de datos para lograr una generalización robusta y transferible.