IMTBench: A Multi-Scenario Cross-Modal Collaborative Evaluation Benchmark for In-Image Machine Translation
Il paper presenta IMTBench, un nuovo benchmark di 2.500 campioni che valuta la traduzione automatica end-to-end di testo nelle immagini attraverso scenari reali e metriche multimodali, rivelando significative lacune nelle prestazioni attuali dei modelli.