Fair and Square: Replacing One Real Multiplication with a Single Square and One Complex Multiplication with Three Squares When Performing Matrix Multiplication and Convolutions

Este artículo demuestra que es posible sustituir asintóticamente cada multiplicación real por una sola operación de cuadrado y cada multiplicación compleja por tres, logrando reducciones significativas en el uso de recursos hardware al implementar estas técnicas en arquitecturas como arrays sistólicos y núcleos tensoriales.

Vincenzo Liguori

Publicado Wed, 11 Ma
📖 4 min de lectura☕ Lectura para el café

Each language version is independently generated for its own context, not a direct translation.

¡Hola! Imagina que tienes una cocina gigante donde preparas millones de platos a la vez (esto es lo que hacen las computadoras en la Inteligencia Artificial). Para cocinar estos platos, necesitas mezclar ingredientes. En el mundo de las matemáticas de las computadoras, esa "mezcla" se llama multiplicación.

El problema es que las "batidoras" (los multiplicadores) que usa la computadora son muy grandes, ocupan mucho espacio en el chip y consumen mucha energía, como si fueran electrodomésticos industriales pesados.

Este paper (documento) de Vincenzo Liguori propone una idea genial: ¿Y si en lugar de usar esas batidoras pesadas, usáramos algo más ligero y eficiente?

Aquí te explico la idea principal con analogías sencillas:

1. El Truco del "Cuadrado" en lugar de la Multiplicación

Imagina que tienes dos números, digamos A y B, y quieres multiplicarlos (A × B).
Normalmente, la computadora hace un esfuerzo enorme para calcular eso.

El autor dice: "¡Espera! No necesitas multiplicar. Solo necesitas cuadrar números".
¿Qué significa cuadrar? Es multiplicar un número por sí mismo (A × A).

El truco matemático es este:

Si quieres saber cuánto es A × B, puedes hacer esto:

  1. Suma A y B, y cuadra el resultado (como si hicieras una foto cuadrada de la suma).
  2. Cuadra solo a A.
  3. Cuadra solo a B.
  4. Haz una pequeña resta con esos tres resultados y ¡listo! Tienes tu multiplicación.

La analogía: Es como si en lugar de construir un mueble complejo desde cero (multiplicar), pudieras construirlo usando piezas pre-cortadas (cuadrados) que ya tienes en el almacén.

2. ¿Por qué es esto un gran ahorro?

El paper menciona algo crucial: Un circuito de computadora que hace un "cuadrado" (A × A) es la mitad de pequeño y consume la mitad de energía que un circuito que hace una multiplicación normal (A × B).

  • Antes: Usabas 100 batidoras gigantes.
  • Ahora: Usas 100 batidoras pequeñas (cuadrados) y un poco de mano de obra extra (sumas y restas).
  • Resultado: Ahoras mucho espacio y batería en tu teléfono o computadora.

3. Aplicaciones en la Vida Real

El autor aplica esto a tres cosas que las computadoras hacen todo el tiempo:

  • Multiplicación de Matrices: Imagina una cuadrícula gigante de números (como un tablero de ajedrez) que se mezcla con otra. Esto es lo que hace la IA para reconocer caras o traducir idiomas. El paper dice que puedes hacer todo esto usando solo "cuadrados" en lugar de multiplicaciones.
  • Convoluciones: Esto es como pasar un filtro sobre una foto para suavizarla o detectar bordes. En lugar de multiplicar cada píxel por el filtro, usamos el truco de los cuadrados.
  • Transformaciones Lineales: Son como cambiar la perspectiva de una imagen o comprimir un archivo de audio.

4. El Caso de los Números "Fantasma" (Complejos)

En matemáticas avanzadas, a veces usamos números que tienen una parte "real" y una parte "imaginaria" (llamados números complejos). Multiplicar estos es aún más difícil.

  • La vieja forma: Requería 4 multiplicaciones normales.
  • La nueva forma (4 cuadrados): El paper muestra cómo hacerlo con 4 cuadrados.
  • La forma super-eficiente (3 cuadrados): ¡El paper tiene un truco aún mejor! Muestra cómo hacer esa multiplicación compleja usando solo 3 cuadrados.

La analogía: Imagina que antes necesitabas 4 obreros para mover una caja pesada. Con este nuevo método, logras moverla con solo 3 obreros, y además, esos obreros son más ligeros y rápidos.

5. ¿Cómo se ve esto en el hardware (el chip)?

El paper no solo habla de matemáticas, sino de cómo construir los chips.

  • Arreglos Sistólicos: Imagina una línea de montaje donde los datos fluyen de una caja a otra. El autor propone cambiar las cajas que "multiplican" por cajas que "cuadran".
  • Núcleos Tensor (Tensor Cores): Son los motores de las tarjetas gráficas modernas para IA. El paper sugiere rediseñar estos motores para que usen cuadrados en lugar de multiplicadores.

En Resumen

Este paper es como un manual de "bricolaje" para ingenieros de computadoras. Les dice:

"¡Dejen de usar la herramienta pesada y costosa (multiplicador)! Si usan la herramienta ligera (cuadrado) y un poco de ingenio matemático (sumas y restas), pueden hacer el mismo trabajo, pero ahorrando casi la mitad de espacio y energía en sus chips."

Es una forma de hacer que la Inteligencia Artificial sea más rápida, más barata de producir y consuma menos batería, simplemente cambiando la forma en que hacemos las cuentas.