RedFuser: An Automatic Operator Fusion Framework for Cascaded Reductions on AI Accelerators
O artigo apresenta o RedFuser, um framework automático que utiliza uma metodologia teórica para fundir operações de redução em cascata em um único loop, gerando kernels otimizados que superam compiladores de IA existentes e igualam o desempenho de soluções manuais.