Approximation Error and Complexity Bounds for ReLU Networks on Low-Regular Function Spaces

Este trabajo demuestra que las redes neuronales con activación ReLU pueden aproximar una amplia clase de funciones acotadas con regularidad mínima, estableciendo un límite superior para el error de aproximación proporcional a la norma uniforme de la función objetivo e inversamente proporcional al producto del ancho y la profundidad de la red, mediante una construcción que hereda estas propiedades de las redes residuales de características de Fourier.

Owen Davis, Gianluca Geraci, Mohammad Motamed

Publicado 2026-02-27
📖 4 min de lectura☕ Lectura para el café

Each language version is independently generated for its own context, not a direct translation.

Imagina que tienes un dibujo muy complejo y desordenado hecho en una pizarra (este es el función objetivo que queremos aprender). Este dibujo no es suave ni perfecto; tiene bordes irregulares, como si lo hubiera hecho un niño con prisa o un artista abstracto. En el mundo de las matemáticas, a esto le llamamos "baja regularidad".

El problema es: ¿Cómo podemos usar una red neuronal (un tipo de cerebro artificial) para copiar ese dibujo lo más fielmente posible?

Aquí es donde entra el papel de esta investigación:

1. El Reto: Copiar el "Boceto Desordenado"

Normalmente, las redes neuronales usan un tipo de interruptor llamado ReLU (que es como un grifo que solo deja pasar agua si lo abres, pero si lo cierras, no pasa nada). El problema es que este grifo es un poco "tosco" para dibujar líneas curvas suaves o formas muy extrañas.

Los autores dicen: "No importa cuán raro o irregular sea tu dibujo, podemos copiarlo bien, pero necesitamos saber cuánto nos va a costar (en tiempo y memoria) y qué tan cerca estaremos de la realidad".

2. La Solución Mágica: El "Dibujo Fantasma"

Para lograrlo, los investigadores no atacaron el problema directamente. En su lugar, usaron una estrategia de "paso intermedio":

  • Paso A: Primero, imaginaron un tipo de red neuronal muy especial y sofisticada que usa ondas de radio o frecuencias (llamadas redes de Fourier). Imagina que esta red es un artista que tiene pinceles mágicos capaces de dibujar cualquier curva perfecta instantáneamente. Esta red "fantasma" es muy buena copiando el dibujo desordenado.
  • Paso B: Luego, se dieron cuenta de que no podemos usar esa red fantasma en la vida real porque es demasiado compleja. Así que se propusieron a construir una réplica de ese artista mágico usando solo nuestros grifos simples (las redes ReLU).

3. El Truco: La Construcción

El papel demuestra que podemos construir esa réplica de grifos simples para que se comporte casi igual que el artista mágico.

  • La Analogía de la Escalera: Imagina que quieres subir a un techo alto (la solución perfecta). La red de Fourier es como un ascensor mágico que te lleva directo arriba. La red ReLU es como una escalera de madera. El papel demuestra que, si construyes la escalera con suficientes escalones (profundidad) y suficientemente anchos (ancho), puedes llegar casi a la misma altura que el ascensor.

4. El Resultado: La Regla de Oro

Los autores descubrieron una fórmula simple para saber qué tan bien funcionará tu copia:

El error (qué tan mal se parece el dibujo) es igual a:
(La complejidad del dibujo original) dividida por (El tamaño total de tu red neuronal).

En lenguaje sencillo:

  • Si tu red es muy grande (muchos escalones y muy ancha), el error será muy pequeño.
  • Si tu red es pequeña, el error será grande.

Es como decir: "Si quieres copiar un mapa del tesoro muy detallado, necesitas un lápiz muy fino y mucho espacio en el papel. Si usas un lápiz grueso y poco espacio, el mapa se verá borroso".

En Resumen

Este trabajo es como un manual de instrucciones que dice: "No te preocupes si tu problema es muy difícil o 'sucio' (poca regularidad). Si usas redes neuronales con la función ReLU, puedes resolverlo. Solo necesitas asegurarte de que tu red sea lo suficientemente grande (ancho y profundidad) para que el error sea aceptable".

Lo genial es que no solo lo dicen, sino que dibujan el plano exacto (la prueba constructiva) de cómo convertir esa red teórica perfecta en una red práctica y real que podemos usar hoy en día.

Recibe artículos como este en tu bandeja de entrada

Resúmenes diarios o semanales personalizados según tus intereses. Gists o resúmenes técnicos, en tu idioma.

Probar Digest →