Handling Infinite Domain Parameters in Planning Through Best-First Search with Delayed Partial Expansions

Este artículo propone un algoritmo de búsqueda heurística de mejor primero con expansiones parciales diferidas que trata explícitamente los parámetros de control de dominio infinito como puntos de decisión, demostrando ser una alternativa competitiva y completa en el límite frente a los enfoques existentes.

Ángel Aso-Mollar, Diego Aineto, Enrico Scala, Eva Onaindia

Publicado 2026-03-09
📖 5 min de lectura🧠 Análisis profundo

Each language version is independently generated for its own context, not a direct translation.

¡Claro que sí! Imagina que estás intentando resolver un rompecabezas gigante, pero con una regla muy extraña: algunas piezas no solo tienen una forma fija, sino que puedes estirarlas o encogerlas infinitamente para que encajen.

Este es el problema que resuelve el artículo que has compartido. Aquí te lo explico como si fuera una historia de aventuras, usando analogías sencillas.

1. El Problema: El "Infinito" que asusta a los planificadores

En la planificación automática (como cuando un robot decide cómo moverse o un software decide cómo organizar tu agenda), normalmente las opciones son finitas.

  • Ejemplo clásico: Tienes 3 cajas y 2 habitaciones. ¿Dónde pongo la caja? Solo hay un número limitado de lugares.

Pero, ¿qué pasa si la caja puede tener cualquier tamaño? ¿O si el robot puede moverse a cualquier velocidad (1.5 m/s, 1.5001 m/s, 1.5000001 m/s...)?
Aquí es donde entran los parámetros de control. Son como "perillas" que puedes girar a cualquier valor dentro de un rango. El problema es que hay infinitos valores posibles.

La vieja forma de hacerlo:
Los métodos anteriores trataban estos valores como si fueran reglas estrictas (como un código de vestimenta: "debes llevar zapatos negros"). El sistema intentaba adivinar el valor perfecto usando matemáticas complejas (como programación lineal) para ver si encajaba con las reglas. Era como intentar adivinar la combinación exacta de una cerradura infinita probando solo las más obvias. A veces funcionaba, pero se quedaban atascados si la solución requería un valor muy específico y extraño.

2. La Nueva Idea: "Explorar a lo loco, pero con sentido"

Los autores proponen una nueva forma de pensar: en lugar de tratar esos valores infinitos como reglas, trátalos como decisiones reales. Imagina que eres un explorador en un bosque infinito.

Su algoritmo se llama Búsqueda de Mejor Primero con Muestreo (S-BFS). Aquí está la magia en tres pasos:

A. No mires todo el bosque de una vez (Expansión Parcial Diferida)

Si intentas mirar todos los caminos posibles en un bosque infinito, te volverás loco y nunca avanzarás.

  • La analogía: Imagina que estás en una encrucijada. En lugar de abrir todas las puertas infinitas que hay, abres solo una puerta al azar (o la que parece más prometedora).
  • Si esa puerta te lleva a un lugar interesante, ¡genial! Avanzas.
  • Si no, cierras esa puerta, la marcas en tu mapa y vuelves a la encrucijada para probar otra. No descartas la primera puerta para siempre; la dejas "en espera" por si acaso.

B. El "Muestreo" (Elegir qué puerta abrir)

Como no puedes probar todas las puertas, necesitas un sistema para elegir cuáles abrir.

  • Muestreo Sistemático: Abres la puerta de la izquierda, luego la derecha, luego la del medio, luego las cuartas partes... como si estuvieras probando todos los extremos y el centro.
  • Muestreo Uniforme: Abres puertas al azar, como lanzar un dado.
  • Muestreo Guiado: Usas una brújula (una heurística) para abrir primero las puertas que parecen llevar a la salida.

C. El "Castigo" Inteligente (Función de Rectificación)

Aquí viene la parte más inteligente. Si vuelves a la misma encrucijada muchas veces probando puertas que no funcionan, el algoritmo se vuelve "pesimista" con esa encrucijada.

  • La analogía: Imagina que cada vez que regresas a una encrucijada y no encuentras la salida, le pones una "etiqueta de precio" más alta a esa opción. Al principio, la etiqueta es baja. Pero si la sigues probando y fallando, el precio sube (como un castigo por perder el tiempo).
  • Esto asegura que el explorador no se quede dando vueltas en círculos en el mismo lugar para siempre. Eventualmente, el precio de esa encrucijada será tan alto que el explorador preferirá probar un camino nuevo que nunca antes había visto.

3. ¿Por qué es genial esto?

El artículo demuestra que, aunque el bosque sea infinito, si usas esta estrategia de:

  1. Abrir solo una puerta a la vez.
  2. Volver a probar las puertas viejas si son prometedoras.
  3. Aumentar el "precio" de las puertas que te hacen perder el tiempo.

...entonces, con el tiempo suficiente, es casi seguro que encontrarás la salida (si es que existe). A esto lo llaman "completitud probabilística". No te garantiza la salida más rápida o perfecta, pero te garantiza que no te quedarás atascado en un callejón sin fin.

4. Los Resultados: ¿Funciona en la vida real?

Los autores probaron su algoritmo (S-BFS) contra otros métodos famosos (como NextFLAP y árboles de búsqueda aleatoria).

  • El resultado: Su método encontró soluciones en muchos más problemas que los otros.
  • La compensación: A veces, las soluciones que encontró no fueron las más cortas o perfectas (porque el algoritmo prioriza encontrar alguna solución en un espacio infinito antes que la perfecta), pero ¡encontró soluciones donde los otros se rindieron!

En resumen

Imagina que tienes que encontrar una aguja en un pajar infinito.

  • Los métodos viejos intentaban calcular matemáticamente dónde podría estar la aguja basándose en reglas, pero se perdían si la aguja estaba en un lugar raro.
  • El método nuevo (S-BFS) es como un aventurero que entra al pajar, busca un poco, si no encuentra nada, vuelve al inicio, marca ese lugar y prueba otro. Si vuelve muchas veces al mismo sitio sin éxito, decide que ese sitio no es bueno y prueba uno nuevo.

Es una forma inteligente de navegar lo infinito sin volverse loco, asegurándose de que, tarde o temprano, se encontrará la solución.

Recibe artículos como este en tu bandeja de entrada

Resúmenes diarios o semanales personalizados según tus intereses. Gists o resúmenes técnicos, en tu idioma.

Probar Digest →