da4ml: Distributed Arithmetic for Real-time Neural Networks on FPGAs
Ce travail propose un nouvel algorithme basé sur l'arithmétique distribuée pour optimiser les opérations de multiplication matrice-vecteur sur FPGA, permettant de réduire considérablement l'utilisation des ressources et la latence des réseaux de neurones en temps réel, tout en étant intégré à la bibliothèque open-source `hls4ml`.