Revisiting Shape from Polarization in the Era of Vision Foundation Models
Este trabajo demuestra que, al abordar las brechas de dominio mediante un conjunto de datos sintéticos de alta calidad basado en escaneos 3D reales y aumentos de datos conscientes del sensor, un modelo ligero entrenado con señales de polarización puede superar significativamente a los modelos fundacionales de visión basados únicamente en RGB en la estimación de normales de superficie, logrando un rendimiento superior con una fracción de los datos de entrenamiento y parámetros.