Thousand-GPU Large-Scale Training and Optimization Recipe for AI-Native Cloud Embodied Intelligence Infrastructure
Ce papier présente la première plateforme de formation distribuée sur le cloud utilisant mille GPU pour l'intelligence incarnée, qui, grâce à des optimisations logicielles et matérielles complètes, a réduit le temps d'entraînement d'un modèle de 15 heures à 22 minutes tout en établissant un écosystème complet de données, d'infrastructure et d'évaluation pour accélérer le développement de l'AGI.