REACT++: Efficient Cross-Attention for Real-Time Scene Graph Generation
Le papier présente REACT++, un modèle de pointe pour la génération de graphes de scène en temps réel qui, en exploitant une extraction de caractéristiques efficace et une attention croisée sujet-objet dans l'espace des prototypes, atteint une vitesse d'inférence supérieure de 20 % et une précision de prédiction des relations améliorée de 10 % par rapport à la version précédente, tout en maintenant les performances de détection d'objets.