Grounding Synthetic Data Generation With Vision and Language Models
Deze paper introduceert ARAS400k, een groot schaalbaar dataset voor remote sensing dat synthetische data combineert met echte beelden en een visueel-taal framework voor interpreteerbare augmentatie en evaluatie, wat resulteert in superieure prestaties voor semantische segmentatie en beeldbeschrijving.