NovaLAD: A Fast, CPU-Optimized Document Extraction Pipeline for Generative AI and Data Intelligence
NovaLAD は、2 つの YOLO モデルとルールベースのグループ化、およびオプションのビジョン言語モデルを統合し、GPU 不要で CPU 上で高速かつ高精度に動作するドキュメント抽出パイプラインとして、DP-Bench ベンチマークで既存の商用・オープンソース解析器を上回る性能を達成したことを提案しています。