HiAP: A Multi-Granular Stochastic Auto-Pruning Framework for Vision Transformers

El artículo presenta HiAP, un marco de auto-poda estocástica multi-granular que optimiza de forma continua y en una sola fase de entrenamiento Vision Transformers mediante el uso de puertas Gumbel-Sigmoid para eliminar selectivamente tanto componentes macro (cabezas de atención y bloques FFN) como micro (dimensiones intra-cabeza y neuronas), logrando arquitecturas eficientes con alto rendimiento en dispositivos de borde sin necesidad de heurísticas manuales o procesos multi-etapa.

Andy Li, Aiden Durrant, Milan Markovic, Georgios Leontidis

Publicado 2026-03-13
📖 4 min de lectura☕ Lectura para el café

Each language version is independently generated for its own context, not a direct translation.

¡Hola! Imagina que tienes un gigante intelectual (un modelo de Inteligencia Artificial llamado "Vision Transformer") que es increíblemente inteligente, pero tan pesado y lento que no cabe en tu teléfono móvil ni en un reloj inteligente. Necesita demasiada energía y memoria para pensar.

El problema es que, hasta ahora, para hacerlo más ligero, los ingenieros tenían que actuar como arquitectos muy estrictos y manuales: tenían que decidir a mano qué partes del cerebro del gigante cortar, probarlo, ver si seguía funcionando, y repetir el proceso muchas veces. Era un trabajo tedioso, costoso y a veces resultaba en un gigante que ya no sabía ver bien.

Aquí es donde entra HiAP (el marco de "Poda Automática Jerárquica").

La Analogía: El Gran Hotel y el Gerente Inteligente

Imagina que el modelo de IA es un gigantesco hotel con muchas plantas (capas), cada una con muchas habitaciones (cabezas de atención) y dentro de cada habitación, muchos muebles (neuronas y dimensiones).

  1. El problema de los métodos antiguos:
    Los métodos anteriores eran como un gerente que entra y dice: "¡Quiero quitar el 30% de los muebles de todas las habitaciones!" o "¡Quiero cerrar el 20% de las plantas!".

    • Si quitas demasiados muebles, la habitación se siente vacía y el cliente (la imagen) no se siente cómodo (baja la precisión).
    • Si solo quitas muebles pero dejas todas las plantas abiertas, el hotel sigue gastando mucha energía en mantener las puertas y los pasillos abiertos (problema de memoria), aunque las habitaciones estén vacías.
    • Además, este gerente necesitaba un manual de instrucciones muy complejo y tenía que hacer varias rondas de inspección.
  2. La solución de HiAP (El Gerente que Aprende):
    HiAP es como un gerente inteligente y autónomo que vive dentro del hotel y aprende a gestionar el edificio mientras el hotel está abierto y funcionando. No necesita un manual ni un jefe que le diga qué hacer.

    HiAP tiene dos niveles de control (como dos tipos de llaves maestras):

    • Las Llaves Macro (Macro-gates): Son las llaves que cierran plantas enteras o alas completas del hotel. Si una planta entera no es necesaria, HiAP la apaga por completo. Esto ahorra una cantidad enorme de energía porque no tienes que caminar por esos pasillos (ahorro de memoria).
    • Las Llaves Micro (Micro-gates): Son las llaves que quitan muebles específicos de las habitaciones que se quedan abiertas. Si una habitación es necesaria, HiAP decide quitar solo la cama de invitados o la mesa de noche, pero deja la cama principal. Esto hace que la habitación sea más ligera pero sigue siendo funcional (ahorro de cálculos).

¿Cómo funciona la magia? (El proceso de "Aprendizaje")

En lugar de cortar y pegar manualmente, HiAP usa un truco matemático llamado "Gumbel-Sigmoid".

  • Imagina que es como un termostato: Al principio del entrenamiento, el "termostato" está muy suave. Las puertas y los muebles están "semi-abiertos" o "semi-cerrados". El hotel está experimentando: "¿Qué pasa si cierro esta planta? ¿Qué pasa si quito este mueble?".
  • El aprendizaje conjunto: Mientras el hotel experimenta con estas puertas semi-abiertas, los empleados (los pesos de la red neuronal) aprenden a trabajar mejor con lo que tienen. Se adaptan.
  • El enfriamiento (Annealing): A medida que pasa el tiempo, el termostato se va enfriando. Las puertas "semi-abiertas" se deciden: o se abren del todo (se quedan) o se cierran del todo (se eliminan).
  • El resultado final: Al final del proceso, el hotel se ha reorganizado solo. Ha encontrado su propia forma ideal: tiene las plantas exactas que necesita y los muebles justos. Lo mejor de todo es que no hubo que cerrar el hotel para remodelarlo; todo ocurrió mientras funcionaba.

¿Por qué es tan genial?

  1. Todo en uno: No necesitas dos pasos (primero buscar qué cortar, luego volver a entrenar). HiAP hace todo en un solo viaje.
  2. Equilibrio perfecto: Entiende que a veces es mejor cerrar una planta entera (para ahorrar memoria) que dejarla abierta con solo un mueble (que sigue costando memoria). Y a veces es mejor dejar la planta abierta pero quitar muebles. Lo decide solo.
  3. Listo para usar: Al final, obtienes un edificio físico, real y compacto. No es un plano teórico; es un hotel listo para recibir huéspedes en un teléfono móvil, sin necesidad de herramientas especiales.

En resumen

Piensa en HiAP como un arquitecto autodidacta que entra en un edificio gigante, camina por él mientras vive en él, y decide: "Esta planta no hace nada, la cierro. En esta otra, solo necesito la cocina, así que quito los dormitorios".

Al final, tienes un edificio pequeño, eficiente y rápido, que sigue funcionando perfectamente, y todo esto ocurrió sin que nadie tuviera que dibujar planos ni hacer cálculos manuales complicados. ¡Es la IA aprendiendo a ser más eficiente por sí misma!