VMXDOTP: A RISC-V Vector ISA Extension for Efficient Microscaling (MX) Format Acceleration

Este artigo apresenta o VMXDOTP, uma extensão da arquitetura de instruções RISC-V Vector que otimiza a execução de produtos escalares em formatos microescalares (MX), alcançando alta eficiência energética e de área ao superar as limitações de regularidade das operações de ponto flutuante de baixa precisão em aceleradores de transformadores modernos.

Max Wipfli, Gamze İslamoğlu, Navaneeth Kunhi Purayil, Angelo Garofalo, Luca Benini

Publicado 2026-03-06
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é o gerente de uma grande fábrica de inteligência artificial (IA). O trabalho dessa fábrica é processar milhões de imagens, textos e vozes para aprender e tomar decisões.

Até pouco tempo, essa fábrica usava caixas de ferramentas muito grandes e pesadas (dados de alta precisão) para fazer seu trabalho. Isso funcionava bem, mas consumia muita energia e deixava o estoque (memória) lotado.

Recentemente, os engenheiros descobriram um novo tipo de caixa de ferramentas: as caixas "Micro" (MX). Elas são super compactas, ocupam pouco espaço e economizam muita energia. O problema? A máquina da fábrica (o processador) foi feita para as caixas grandes. Quando tentam usar as caixas pequenas, a máquina precisa parar, abrir a caixa pequena, transformar o conteúdo em algo que ela entenda, fazer o cálculo e depois guardar tudo de volta. É como tentar cozinhar um prato gourmet usando uma colher de chá em vez de uma espátula: o trabalho é feito, mas é lento e cansativo.

Este artigo apresenta uma solução genial chamada VMXDOTP. Vamos entender como funciona com algumas analogias simples:

1. O Problema: A Fábrica Travada

Os processadores atuais (como o RISC-V, que é como um "esqueleto" de processador aberto e flexível) são ótimos para fazer contas em bloco. Mas as novas caixas "Micro" (MX) têm uma regra estranha: elas agrupam 32 números pequenos e dão a eles um único "termômetro" (escala) para todos.

Quando o software tenta usar isso no processador comum, ele precisa:

  1. Pegar os 32 números.
  2. Aumentar o tamanho deles (transformar de "mini" para "normal").
  3. Pegar o "termômetro" e aplicá-lo a cada um.
  4. Fazer a conta.

Isso faz o processador gastar mais tempo transformando dados do que realmente calculando. É como se um entregador de pizza gastasse 10 minutos trocando de sapatos antes de entregar cada pizza. O resultado? A fábrica fica lenta e gasta muita energia.

2. A Solução: VMXDOTP (A Nova Ferramenta Mágica)

Os autores criaram uma nova instrução, uma "ferramenta mágica" chamada VMXDOTP. Em vez de pedir ao entregador para trocar de sapatos, eles construíram uma esteira rolante especial dentro da fábrica.

  • O que ela faz: Ela pega a caixa "Micro" fechada, lê os 32 números pequenos e o único "termômetro" de uma só vez, faz a conta matemática complexa (multiplicação e soma) e entrega o resultado pronto, tudo em um único passo.
  • A analogia do "Kit de Montagem": Imagine que você tem que montar 32 brinquedos.
    • Sem VMXDOTP: Você pega uma peça, a coloca na mesa, pega a instrução, monta, guarda, pega a próxima...
    • Com VMXDOTP: Você tem uma máquina que pega o pacote fechado, aperta um botão e sai 32 brinquedos montados instantaneamente.

3. Os Resultados: Velocidade e Eficiência

Quando os pesquisadores testaram essa nova ferramenta em um protótipo de processador (chamado Spatz), os resultados foram impressionantes:

  • Velocidade: A fábrica ficou até 7 vezes mais rápida. O que antes levava 7 horas, agora leva 1 hora.
  • Energia: A máquina gastou quase 5 vezes menos energia para fazer o mesmo trabalho. É como trocar um carro que bebe 20 litros de gasolina por um elétrico que anda o mesmo caminho com uma bateria minúscula.
  • Flexibilidade: Diferente de outras máquinas que só aceitam caixas de um tamanho fixo, essa nova ferramenta aceita caixas de vários tamanhos (definidos pelo software), o que é crucial porque a tecnologia de IA muda muito rápido.

4. Por que isso importa para o futuro?

Hoje, os modelos de IA (como os que geram texto ou criam imagens) estão ficando gigantes. Eles precisam de muita memória e muita energia. Se continuarmos usando as ferramentas antigas, nossos celulares e computadores vão ficar lentos e as baterias vão acabar em minutos.

O VMXDOTP é como uma atualização de sistema operacional para o hardware. Ele permite que usamos dados compactos (que economizam espaço e energia) sem perder a velocidade. Isso significa que, no futuro, poderemos ter assistentes de IA super inteligentes rodando diretamente no nosso relógio ou celular, sem precisar de uma nuvem gigante e sem gastar a bateria do dia todo.

Em resumo: Os autores pegaram uma ideia brilhante de compactação de dados (MX) que estava "travada" por falta de suporte no hardware, e criaram uma nova peça de engenharia (VMXDOTP) que desbloqueou todo o potencial de velocidade e economia de energia, tornando a inteligência artificial mais rápida, mais barata e mais verde.