RSH-SpMM: A Row-Structured Hybrid Kernel for Sparse Matrix-Matrix Multiplication on GPUs
El artículo presenta RSH-SpMM, un marco híbrido de multiplicación de matrices dispersas para GPU que utiliza particionamiento adaptativo de filas y una representación RS-Tile para optimizar el uso de Tensor Cores y lograr aceleraciones de 1,27x a 6,13x frente a diseños existentes en matrices con irregularidad extrema.