Multi-label Instance-level Generalised Visual Grounding in Agriculture
Dit paper introduceert gRef-CW, het eerste dataset voor generaliseerde visuele grounding in de landbouw, en Weed-VG, een modulair framework dat de bestaande kloof tussen taal en visuele objecten in veldbeelden overbrugt door multi-label hiërarchische scoring en interpolatie-gedreven regressie.