An Open-Source Training Dataset for Foundation Models for Black-box Optimization

Este artículo presenta BBO-Pile, el primer conjunto de datos de código abierto a gran escala que contiene más de 500.000 trayectorias de optimización en 3.095 funciones de caja negra, y demuestra que los modelos fundacionales entrenados con estos datos pueden aprender e imitar eficazmente estrategias de optimización de caja negra mediante un preentrenamiento escalable.

Autores originales: Aaron Klein, Herilalaina Rakotoarison, Luca Thale-Bombien, David Salinas

Publicado 2026-05-25✓ Author reviewed
📖 5 min de lectura🧠 Análisis profundo

Autores originales: Aaron Klein, Herilalaina Rakotoarison, Luca Thale-Bombien, David Salinas

Artículo original bajo licencia CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Esta es una explicación generada por IA del artículo a continuación. No ha sido escrita por los autores. Para mayor precisión técnica, consulte el artículo original. Leer descargo de responsabilidad completo

El Gran Problema: El Misterio de la "Caja Negra"

Imagina que estás intentando hornear el pastel perfecto, pero tienes un horno mágico que está completamente sellado. No puedes ver dentro, no conoces la receta y no puedes medir la temperatura. La única forma de aprender es poner un pastel dentro, esperar a que se hornee, sacarlo y probarlo.

  • El Pastel: Esta es la "función objetivo" (el problema que quieres resolver).
  • Los Ingredientes: Estos son los "hiperparámetros" (configuraciones como la tasa de aprendizaje, el número de capas, etc.).
  • El Sabor: Esta es la "puntuación" (qué tan bueno es el resultado).

Esto se llama Optimización de Caja Negra. Ocurre en todas partes: ajustando modelos de IA, diseñando nuevos fármacos o configurando robots. El problema es que encontrar el "pastel" perfecto generalmente requiere que un experto humano adivine, ajuste y pruebe miles de veces. Es lento, costoso y los trucos del experto a menudo no funcionan si cambias de hornear un pastel a hornear pan.

La Vieja Forma vs. La Nueva Idea

La Vieja Forma: Los científicos han construido muchos "expertos en probar" (algoritmos) diferentes a lo largo de los años. Un experto es genial para encontrar recetas de pasteles, pero terrible para encontrar recetas de pan. Son herramientas especializadas.

La Nueva Idea (Modelos Fundacionales): ¿Y si pudiéramos entrenar a una sola IA súper inteligente para aprender los principios generales de la repostería? En lugar de ser un experto en pasteles o un experto en pan, sería un "Maestro Panadero" que entiende cómo optimizar cualquier receta simplemente observando miles de intentos de horneado pasados.

El Ingrediente Faltante: Un Libro de Recetas Gigante

Para entrenar a este "Maestro Panadero", necesitas una biblioteca masiva de intentos de horneado pasados (datos).

  • El Problema: Los intentos anteriores de hacer esto dependían de datos secretos (que nadie más podía ver) o de datos inventados (que no reflejaban la vida real). Era como intentar enseñar a un chef usando un libro de recetas escrito en un idioma que nadie habla, o usando ingredientes falsos.
  • La Solución (BBO-Pile): Los autores crearon BBO-Pile, el primer "Libro de Recetas" de código abierto para esta tarea.
    • Contiene 557,100 intentos de horneado diferentes (trayectorias).
    • Estos intentos cubren 3,095 tipos diferentes de problemas (desde ajustar modelos de IA hasta diseño químico).
    • Incluye datos de 6 "expertos en probar" diferentes (algoritmos) para que la IA pueda aprender diferentes estrategias.
    • Es masivo: aproximadamente 2.5 mil millones de palabras (tokens) de datos.

Cómo Entrenaron al "Maestro Panadero"

Los autores no solo le dieron a la IA el libro de recetas; entrenaron a una familia de modelos de IA (como chefs de diferentes tamaños) para leerlo.

  • Los Modelos: Construyeron modelos que van desde pequeños (2 millones de parámetros) hasta grandes (80 millones de parámetros).
  • El Entrenamiento: Alimentaron a los modelos con los datos y les pidieron que predijeran el siguiente paso en un proceso de horneado.
    • Entrada: "Aquí está la receta hasta ahora, y aquí es cómo sabía el último pastel".
    • Salida: "Aquí está la siguiente mezcla de ingredientes que deberías probar".
  • El Resultado: La IA aprendió a imitar el comportamiento de los expertos humanos originales. Si le decías a la IA que actuara como "Experto A", actuaba como el Experto A. Si le decías que actuara como "Experto B", cambiaba de estrategia.

Lo Que Descubrieron

  1. Más Grande es Mejor (pero con límites): A medida que hacían los modelos de IA más grandes y les daban más datos, los modelos mejoraban en imitar a los expertos. Sin embargo, la mejora no fue tan explosiva como con los chatbots (LLM); fue una subida constante y predecible.
  2. Generalización: La IA no solo memorizó las recetas del libro. Cuando la probaron en un nuevo tipo de problema que nunca había visto antes (como un tipo completamente nuevo de pan), todavía funcionó sorprendentemente bien. Había aprendido la lógica de la optimización, no solo las respuestas específicas.
  3. Velocidad: Una vez entrenada, la IA puede sugerir el siguiente paso casi instantáneamente, mucho más rápido que ejecutar simulaciones matemáticas complejas desde cero.

La Conclusión

Este artículo es como construir la primera biblioteca pública de "historias de optimización". Al compartir este conjunto de datos masivo (BBO-Pile), los autores han permitido que otros investigadores entrenen su propia IA "Maestro Panadero".

Probaron que puedes entrenar una IA de propósito general para entender cómo resolver problemas complejos y desconocidos simplemente mostrándole cómo otros métodos resolvieron problemas similares en el pasado. Es un paso hacia una IA que no solo resuelve un rompecabezas, sino que sabe cómo resolver cualquier rompecabezas.

Nota Importante: El artículo se centra exclusivamente en crear este conjunto de datos y entrenar estos modelos para imitar métodos de optimización existentes. No afirma haber resuelto problemas específicos del mundo real (como curar una enfermedad o diseñar un cohete específico) aún, ni discute futuras aplicaciones clínicas. El objetivo fue simplemente probar que este enfoque de "Modelo Fundacional" funciona y proporcionar los datos para que otros lo intenten.

¿Ahogado en artículos de tu campo?

Recibe resúmenes diarios de los artículos más novedosos que coincidan con tus palabras clave de investigación — con resúmenes técnicos, en tu idioma.

Probar Digest →