Chart Deep Research in LVLMs via Parallel Relative Policy Optimization
Die Arbeit stellt PRPO und MCDR-Bench vor, ein Framework, das durch parallele relative Policy-Optimierung und eine objektive Fehler-basierte Evaluierung die tiefgehenden Analysefähigkeiten von Large Vision-Language Models für Diagramme systematisch verbessert.