RSH-SpMM: A Row-Structured Hybrid Kernel for Sparse Matrix-Matrix Multiplication on GPUs
Die Arbeit stellt RSH-SpMM vor, ein fein abgestimmtes hybrides Framework für die Sparse-Matrix-Matrix-Multiplikation auf GPUs, das durch adaptive Zeilenpartitionierung und eine RS-Tile-Darstellung Tensor-Kern-Effizienz mit der Verarbeitung unregelmäßiger Sparsity-Strukturen kombiniert und dabei im Vergleich zu aktuellen State-of-the-Art-Methoden Beschleunigungen von 1,27- bis 6,13-fach erzielt.