Chart-RL: Generalized Chart Comprehension via Reinforcement Learning with Verifiable Rewards
Die Arbeit stellt Chart-RL vor, eine Reinforcement-Learning-Methode mit mathematisch überprüfbaren Belohnungen, die Vision-Language-Modelle durch den Einsatz weniger komplexer Trainingsbeispiele signifikant besser in der allgemeinen Diagrammverständnisleistung und im Transfer auf mathematische Probleme macht als herkömmliches Supervised Fine-Tuning.