FreeAct: Freeing Activations for LLM Quantization
Dit paper introduceert FreeAct, een nieuw kwantisatiekader voor grote taalmodellen dat statische transformaties vervangt door dynamische, token-specifieke aanpassingen om de prestaties van diffusie- en multimodale modellen aanzienlijk te verbeteren.