Arbitrary control over multimode wave propagation for machine learning

Este artículo presenta una guía de onda programable bidimensional con aproximadamente 10410^4 grados de libertad espaciales que permite el control arbitrario sobre la propagación de ondas multimodo para realizar la inferencia de redes neuronales en una sola pasada, ofreciendo al mismo tiempo mejoras significativas en la eficiencia del área del dispositivo y en la escalabilidad en comparación con las arquitecturas tradicionales de componentes discretos.

Autores originales: Tatsuhiro Onodera, Martin M. Stein, Benjamin A. Ash, Mandar M. Sohoni, Melissa Bosch, Ryotatsu Yanagimoto, Marc Jankowski, Timothy P. McKenna, Tianyu Wang, Gennady Shvets, Maxim R. Shcherbakov, Logan
Publicado 2026-06-15
📖 5 min de lectura🧠 Análisis profundo

Autores originales: Tatsuhiro Onodera, Martin M. Stein, Benjamin A. Ash, Mandar M. Sohoni, Melissa Bosch, Ryotatsu Yanagimoto, Marc Jankowski, Timothy P. McKenna, Tianyu Wang, Gennady Shvets, Maxim R. Shcherbakov, Logan G. Wright, Peter L. McMahon

Artículo original bajo licencia CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Esta es una explicación generada por IA del artículo a continuación. No ha sido escrita ni avalada por los autores. Para mayor precisión técnica, consulte el artículo original. Leer descargo de responsabilidad completo

Imagina que estás intentando resolver un rompecabezas complejo, como reconocer un número escrito a mano o identificar una vocal hablada. Usualmente, las computadoras hacen esto pasando los datos a través de una larga línea de engranajes y palancas diminutos y separados (componentes discretos). Cada engranaje hace un trabajo pequeño, y los datos tienen que viajar de uno al siguiente. Esto ocupa mucho espacio y consume mucha energía, especialmente a medida que los rompecabezas se vuelven más grandes.

Los investigadores en este artículo construyeron un tipo de máquina completamente diferente. En lugar de usar una línea de engranajes separados, crearon una única y gigante "lámina" de vidrio programable (una guía de ondas) que actúa como una lente inteligente y cambiante de forma.

Así es como funciona su invento, desglosado en conceptos simples:

1. La "Lámina Inteligente" frente al "Tren de Engranajes"

Piensa en los chips de computadora tradicionales como un tren de vagones separados. Para ir del punto A al punto B, la carga (los datos) tiene que saltar de vagón en vagón. Esto es voluminoso y lento.

Este nuevo dispositivo es como un trampolín masivo único. En lugar de saltar entre vagones, lanzas una pelota (un haz de luz) sobre el trampolín. Al cambiar la tensión y la forma de la superficie del trampolín, puedes hacer que la pelota rebote en cualquier patrón específico que desees. Toda la superficie trabaja junta a la vez para guiar la pelota hacia su destino.

2. ¿Cómo le dan "forma" al vidrio?

No puedes simplemente tallar este vidrio como si fuera una estatua; una vez que está tallado, se queda así. Los investigadores necesitaban una forma de cambiar la forma del vidrio sobre la marcha.

Utilizaron un truco ingenioso que involucra luz y electricidad:

  • La configuración: Tienen una lámina especial de vidrio (Niobato de Litio) sándwich entre electrodos.
  • El control: Proyectan un patrón de luz verde sobre la lámina desde arriba, como un proyector mostrando una imagen.
  • La magia: Donde la luz verde impacta, la lámina se vuelve ligeramente más conductora (como un cable). Esto cambia el campo eléctrico dentro del vidrio. Debido a una propiedad especial de este vidrio, cambiar el campo eléctrico cambia su índice de refracción (cuánto dobla la luz).
  • El resultado: El patrón de luz verde proyectado "esculpe" instantáneamente el paisaje invisible dentro del vidrio. Si proyectas una forma de "Y", el vidrio se convierte en un camino en forma de Y para la luz. Si proyectas un laberinto complejo, el vidrio se convierte en un laberinto complejo.

Pueden cambiar este patrón de "escultura" unas 3 veces por segundo, lo que permite reprogramar la máquina instantáneamente.

3. Haciendo matemáticas con luz

El objetivo de la máquina es realizar Aprendizaje Automático (enseñar a una computadora a reconocer patrones).

  • Entrada: Toman datos (como la forma de un "7" escrito a mano) y los convierten en un patrón de haces de luz que entran en la lámina.
  • Procesamiento: A medida que la luz viaja a través de la lámina, rebota en el paisaje "esculpido" que han creado. Las ondas de luz interfieren entre sí, mezclándose y combinándose de formas complejas. Esta mezcla es el cálculo matemático.
  • Salida: La luz sale por el otro lado. Miden qué tan brillante es la luz en diferentes puntos. El punto más brillante indica la respuesta (por ejemplo, "¡Eso era un 7!").

Lo probaron en dos tareas:

  1. Sonidos vocálicos: Identificar qué vocal se pronunció basándose en las frecuencias de sonido. Lo lograron con un 96% de precisión.
  2. Dígitos escritos a mano (MNIST): Reconocer números del 0 al 9. Lo lograron con un 86% de precisión.

4. ¿Por qué es esto importante? (La sorpresa de la "Raíz Cuadrada")

Usualmente, si quieres construir una computadora que pueda manejar rompecabezas cada vez más grandes (más datos), tienes que hacer la máquina mucho, mucho más grande. Si duplicas la complejidad, usualmente necesitas cuatro veces el espacio (una relación cuadrática).

Los investigadores descubrieron algo sorprendente con su "Lámina Inteligente". Debido a que están utilizando toda la lámina a la vez (interferencia multimodo) en lugar de una línea de engranajes, el tamaño de la máquina solo necesita crecer según la raíz cuadrada de la complejidad.

  • Analogía: Si quieres construir un puente para 100 autos, un diseño tradicional podría necesitar 100 unidades de largo. Su diseño sugiere que podrías necesitar un puente de solo 10 unidades de largo (ya que la raíz cuadrada de 100 es 10) para hacer el mismo trabajo.

Esto significa que su máquina podría ser potencialmente mucho más pequeña y eficiente energéticamente que las computadoras ópticas actuales, especialmente para tareas muy grandes.

Resumen

El equipo construyó un procesador óptico reprogramable que utiliza una sola lámina de vidrio para realizar cálculos complejos. En lugar de usar miles de partes pequeñas y separadas, utilizan un proyector para "dibujar" el problema matemático directamente sobre el vidrio usando luz. La luz luego resuelve el problema mientras viaja a través del vidrio. Demostraron que esto funciona para reconocer sonidos y números, y sus matemáticas sugieren que este enfoque podría conducir a computadoras mucho más pequeñas, rápidas y eficientes energéticamente en el futuro.

¿Ahogado en artículos de tu campo?

Recibe resúmenes diarios de los artículos más novedosos que coincidan con tus palabras clave de investigación — con resúmenes técnicos, en tu idioma.

Probar Digest →