You Only Pose Once: A Minimalist's Detection Transformer for Monocular RGB Category-level 9D Multi-Object Pose Estimation
Het paper introduceert YOPO, een minimalistisch, single-stage transformer-model dat monokulaire RGB-afbeeldingen gebruikt om de 9-DoF-pose van onbekende objecten op categorieniveau direct en nauwkeurig te schatten zonder extra data of pseudo-diepte.