RSH-SpMM: A Row-Structured Hybrid Kernel for Sparse Matrix-Matrix Multiplication on GPUs
L'article présente RSH-SpMM, un cadre hybride de multiplication matrice-matrice creuse optimisé pour les GPU, qui améliore significativement les performances et la stabilité sur des matrices irrégulières grâce à une partitionnement adaptatif des lignes, une représentation RS-Tile compatible avec les Tensor Cores et un réordonnancement local.