HTMuon: Improving Muon via Heavy-Tailed Spectral Correction
Die Arbeit stellt HTMuon vor, einen optimierten Muon-Algorithmus, der durch heavy-tailed spektrale Korrektur die Leistung von LLMs und Bildklassifizierung verbessert, indem er die Unterdrückung schwerer Verteilungsschwänze im Muon-Update vermeidet und theoretisch als steilster Abstieg unter Schatten-q-Norm-Bedingungen analysiert wird.