FireRed-OCR Technical Report
FireRed-OCR es un marco sistemático que transforma modelos VLM generales en expertos de OCR estructural mediante una fábrica de datos "Geometría + Semántica" y una estrategia de entrenamiento progresivo de tres etapas, logrando un rendimiento superior al estado del arte en el análisis de documentos complejos.