Whispering to a Blackbox: Bootstrapping Frozen OCR with Visual Prompts
Deze paper introduceert Whisperer, een visueel prompting-framework dat via een vierstaps curriculum van gedragsklooning stochastisch ontdekte pixelruimteverbeteringen leert te repliceren om ingevroren OCR-modellen zoals EasyOCR aanzienlijk te verbeteren zonder hun gewichten aan te passen.