UniM: A Unified Any-to-Any Interleaved Multimodal Benchmark
Ce papier présente UniM, le premier benchmark unifié de 31 000 instances couvrant sept modalités pour évaluer les capacités des grands modèles multimodaux à comprendre et générer des entrées et sorties multimodales entrelacées de manière arbitraire, accompagné d'une suite d'évaluation et d'un modèle de référence nommé UniMA.