VLCE: A Knowledge-Enhanced Framework for Image Description in Disaster Assessment
Het paper introduceert VLCE, een kennisverrijkt raamwerk dat ConceptNet en WordNet integreert om generieke visueel-taalmodellen te verbeteren bij het genereren van actievere en domeinspecifieke beschrijvingen van rampenbeelden, wat resulteert in een aanzienlijke prestatieverbetering op benchmarks zoals xBD en RescueNet.