Controlled LLM Training on Spectral Sphere
Die Arbeit stellt den Spectral Sphere Optimizer (SSO) vor, einen effizienten Parallelalgorithmus, der durch die strikte Einhaltung spektraler Beschränkungen für Gewichte und Updates eine vollständige P-Ausrichtung gewährleistet und damit bei der Skalierung großer Modelle eine überlegene Konvergenz und Stabilität im Vergleich zu AdamW und Muon erreicht.