Benchmarking Language Modeling for Lossless Compression of Full-Fidelity Audio
Die Studie stellt mit „Trilobyte" ein neues Byte-Level-Tokenisierungsschema vor, das den Einsatz autoregressiver Sprachmodelle für verlustfreie Kompression von hochauflösendem 24-Bit-Audio ermöglicht und dabei zwar FLAC übertrifft, jedoch mit abnehmenden Kompressionsgewinnen bei steigender Bittiefe konfrontiert ist.