Time2General: Learning Spatiotemporal Invariant Representations for Domain-Generalization Video Semantic Segmentation
O artigo apresenta o Time2General, um framework para segmentação semântica de vídeo generalizada de domínio que utiliza um Decodificador de Memória Espaço-Temporal e uma nova perda de consistência temporal para eliminar o efeito de flicker e garantir previsões estáveis em diferentes condições de domínio e taxas de amostragem, alcançando alto desempenho e eficiência em benchmarks de direção.