Revisiting Shape from Polarization in the Era of Vision Foundation Models
Die Studie zeigt, dass ein leichtgewichtiges Modell, das auf einem hochwertigen, polarisationsbasierten Datensatz mit realen 3D-Objekten trainiert und durch DINOv3-Priors sowie sensorbewusste Daten-Augmentierung verbessert wurde, selbst mit deutlich weniger Daten und Parametern RGB-only-Vision-Foundation-Modelle bei der Schätzung von Oberflächennormalen übertrifft, indem es die zuvor bestehenden Domänenlücken schließt.