Segment-to-Act: Label-Noise-Robust Action-Prompted Video Segmentation Towards Embodied Intelligence
Deze paper introduceert ActiSeg-NL, het eerste benchmark voor actiegerichte videosegmentatie onder labelruis, en stelt een robuustheidsanalyse en een Parallel Mask Head Mechanism (PMHM) voor om de impact van onnauwkeurige tekstprompts en maskergrenzen op embodied intelligence te mitigeren.