NovaLAD: A Fast, CPU-Optimized Document Extraction Pipeline for Generative AI and Data Intelligence
이 논문은 GPU 없이도 CPU 에서 고속으로 실행 가능한 NovaLAD 라는 문서 추출 파이프라인을 제안하며, 동시 YOLO 모델과 규칙 기반 그룹화, 선택적 비전 언어 모델을 활용해 DP-Bench 벤치마크에서 상용 및 오픈소스 파서보다 우수한 성능을 달성한 것을 설명합니다.