UniM: A Unified Any-to-Any Interleaved Multimodal Benchmark
Die Arbeit stellt UniM vor, das erste Benchmark-Dataset für ein einheitliches „Any-to-Any"-interleaved multimodales Lernen, das 31.000 hochwertige Instanzen über sieben Modalitäten hinweg umfasst und durch eine neue Evaluierungssuite sowie ein agentenbasiertes Basismodell die Herausforderungen für die Weiterentwicklung multimodaler Großsprachenmodelle aufzeigt.