Learning to Solve Orienteering Problem with Time Windows and Variable Profits

Este artículo presenta DeCoST, un enfoque de aprendizaje basado en dos etapas que desacopla las variables discretas y continuas del problema de orientación con ventanas de tiempo y beneficios variables, logrando una calidad de solución superior y una aceleración de inferencia de hasta 6,6 veces en comparación con los métodos existentes.

Songqun Gao, Zanxi Ruan, Patrick Floor, Marco Roveri, Luigi Palopoli, Daniele Fontanelli

Publicado 2026-03-09
📖 4 min de lectura☕ Lectura para el café

Each language version is independently generated for its own context, not a direct translation.

¡Hola! Imagina que eres el jefe de una flota de robots que deben trabajar en una fábrica. Tienes un tiempo limitado (digamos, una hora) y muchos puntos de trabajo en el suelo.

Aquí está el problema:

  1. No puedes visitar a todos: Tienes que elegir qué puntos visitar y en qué orden.
  2. El tiempo es oro: Si pasas más tiempo en un punto, el robot hace un trabajo mejor y gana más "puntos" (dinero). Pero si pasas demasiado tiempo, no te alcanza para ir a otros puntos.
  3. Ventanas de tiempo: Algunos puntos solo están disponibles en momentos específicos. Si llegas muy temprano o muy tarde, no puedes entrar.

A esto los expertos lo llaman el Problema de Orientación con Ventanas de Tiempo y Beneficios Variables. Suena complicado, ¿verdad? Es como intentar planear el viaje perfecto de un día: quieres ver las mejores atracciones, pero cada una te toma un tiempo diferente para disfrutarla, y algunas solo abren a ciertas horas.

¿Qué propone este papel? (La Solución: DeCoST)

Los autores presentan una nueva inteligencia artificial llamada DeCoST. Para explicarlo, usemos una analogía de un director de orquesta y un editor de video.

Antes, las computadoras intentaban decidir todo a la vez: qué ruta tomar y cuánto tiempo dedicar a cada parada. Era como intentar escribir una novela y editar el video de la película al mismo tiempo; ¡se volvía un caos y tardaba muchísimo!

DeCoST divide el trabajo en dos etapas claras:

Etapa 1: El Director de Orquesta (La Ruta y el Primer Intento)

Imagina que el sistema primero dibuja un mapa rápido. Decide: "Vamos a ir a la A, luego a la C, luego a la E".

  • La novedad: Mientras dibuja la ruta, también hace una estimación rápida de cuánto tiempo debería pasar en cada lugar. No es perfecto, pero es un buen punto de partida.
  • El truco: Usa una "brújula" especial (llamada pTAR) que le dice: "Oye, si pasas mucho tiempo aquí, no llegarás a ese otro lugar que da muchos puntos". Esto ayuda a que el sistema no se fije solo en un punto y olvide el resto.

Etapa 2: El Editor de Video (El Ajuste Fino)

Una vez que la ruta está fija (ya sabemos qué puntos visitaremos), el sistema cambia de modo. Ahora, en lugar de adivinar, usa matemáticas puras y rápidas (como un cálculo de Excel súper avanzado) para decir: "Dado que vamos a ir a A, C y E, aquí está la cantidad exacta y perfecta de tiempo que debes pasar en cada uno para ganar la máxima cantidad de puntos sin violar las reglas".

Es como si el director de orquesta dijera: "Vamos a tocar estas tres canciones", y luego el editor de video ajustara los segundos exactos de cada canción para que el álbum suene perfecto.

¿Por qué es genial esto?

  1. Velocidad: Las computadoras viejas tardaban horas en resolver estos problemas para fábricas grandes. DeCoST lo hace en segundos. Es como pasar de caminar a usar un cohete. En pruebas, fue hasta 6.6 veces más rápido que los métodos anteriores.
  2. Calidad: No solo es rápido, sino que encuentra soluciones mejores. Consigue más "puntos" (dinero/productividad) que los algoritmos más inteligentes que existían antes.
  3. Flexibilidad: Funciona bien incluso si el problema cambia de tamaño (pocos puntos o cientos de puntos).

En resumen

Imagina que tienes que organizar una fiesta con un presupuesto de tiempo limitado.

  • Los métodos viejos intentaban decidir la lista de invitados, el orden en que llegan y cuánto tiempo hablar con cada uno, todo al mismo tiempo, y se agotaban.
  • DeCoST primero elige a los invitados y el orden (Etapa 1) y luego, con una calculadora mágica, determina exactamente cuánto tiempo hablar con cada uno para que la fiesta sea la mejor posible sin que nadie se quede sin hablar (Etapa 2).

El resultado es una herramienta que ayuda a robots, camiones de reparto y fábricas a trabajar de forma más inteligente, rápida y eficiente, ahorrando tiempo y dinero. ¡Es como darle un superpoder de planificación a las máquinas!