OCR-Agent: Agentic OCR with Capability and Memory Reflection
El artículo presenta OCR-Agent, un marco iterativo de auto-corrección que mejora el razonamiento de los modelos de lenguaje visual mediante la reflexión de capacidades y memoria, logrando resultados de vanguardia en OCR sin necesidad de entrenamiento adicional.