RSH-SpMM: A Row-Structured Hybrid Kernel for Sparse Matrix-Matrix Multiplication on GPUs
O artigo apresenta o RSH-SpMM, um framework híbrido de multiplicação de matriz esparsa por matriz densa (SpMM) para GPUs que utiliza particionamento adaptativo de linhas e uma representação RS-Tile para otimizar o uso dos Tensor Cores e manter alto desempenho em matrizes com esparsidade altamente irregular, superando as soluções existentes com acelerações de 1,27x a 6,13x.