Benchmarking Cross-Scale Perception Ability of Large Multimodal Models in Material Science
Cet article présente CSMBench, un nouveau benchmark conçu pour évaluer la capacité des grands modèles multimodaux à interpréter les données de science des matériaux à travers quatre échelles physiques distinctes (atomique, micro, méso et macro), révélant ainsi les limites actuelles des modèles généralistes dans la compréhension des relations structure-propriétés hiérarchiques.