Evolution Strategy-Based Calibration for Low-Bit Quantization of Speech Models
Das Papier stellt ESC vor, eine kalibrierungsmethode auf Basis von Evolutionsstrategien, die die spezifischen Herausforderungen von Audio-Aktivierungen bei der Low-Bit-Quantisierung adressiert und erstmals nahezu verlustfreie INT4-Quantisierung sowie volle INT8-Leistung für Sprachmodelle ermöglicht.