Thousand-GPU Large-Scale Training and Optimization Recipe for AI-Native Cloud Embodied Intelligence Infrastructure
この論文は、LeRobot フレームワークを基盤とした千 GPU クラスタ上で、データパイプラインの再構築、モデル最適化(可変長 FlashAttention や FP8 量子化など)、および高性能インフラの統合を通じて、ロボット学習のトレーニング時間を 40 倍高速化し、次世代自律型ロボットの実現に向けたクラウドネイティブな大規模トレーニング基盤と評価システムを確立したことを報告しています。