Making LLMs Optimize Multi-Scenario CUDA Kernels Like Experts
Este artigo apresenta o MSKernelBench, um benchmark abrangente para múltiplos cenários de kernels CUDA, e o CUDAMaster, um sistema multiagente orientado por hardware que supera métodos existentes e rivaliza com bibliotecas proprietárias na otimização automática de kernels para diversas aplicações científicas e de aprendizado de máquina.