Making LLMs Optimize Multi-Scenario CUDA Kernels Like Experts
Deze paper introduceert MSKernelBench, een uitgebreide benchmark voor diverse scenario's, en CUDAMaster, een multi-agent systeem dat Large Language Models gebruikt om CUDA-kernels te optimaliseren en hiermee aanzienlijke snelheidswinst behaalt die vaak de prestaties van gespecialiseerde bibliotheken zoals cuBLAS benadert of overtreft.