GazeMoE: Perception of Gaze Target with Mixture-of-Experts
Il paper presenta GazeMoE, un nuovo framework end-to-end che utilizza un meccanismo Mixture-of-Experts su modelli visivi pre-addestrati per stimare con stato dell'arte i target dello sguardo umano integrando segnali multi-modali e affrontando lo sbilanciamento delle classi.