Grounding Synthetic Data Generation With Vision and Language Models
Diese Arbeit stellt ein interpretierbares, visuell-sprachlich fundiertes Framework zur synthetischen Datengenerierung für die Fernerkundung vor und führt den ARAS400k-Datensatz ein, der durch die Kombination von realen und synthetischen Bildern nachweislich die Leistung von Modellen für semantische Segmentierung und Bildunterschriften verbessert.