WISER: Wider Search, Deeper Thinking, and Adaptive Fusion for Training-Free Zero-Shot Composed Image Retrieval
WISER is een trainingsvrij framework voor Zero-Shot Composed Image Retrieval dat door middel van een adaptieve "retrieve-verify-refine"-pijplijn de complementaire sterkten van tekst- en beeldgebaseerde zoekopdrachten combineert om de prestaties aanzienlijk te verbeteren zonder extra training.