RSH-SpMM: A Row-Structured Hybrid Kernel for Sparse Matrix-Matrix Multiplication on GPUs
이 논문은 GPU 기반 희소 행렬 - 행렬 곱셈 (SpMM) 의 성능 저하를 해결하기 위해 적응형 행 분할, RS-Tile 표현, 그리고 부하 균형 하이브리드 커널을 도입한 RSH-SpMM 을 제안하며, 다양한 희소 작업에서 기존 최첨단 방법보다 1.27 배에서 6.13 배까지의 가속화를 달성함을 보여줍니다.