Graph machine learning for flight delay prediction due to holding manouver

Este estudo aplica técnicas de Aprendizado de Máquina em Grafos para prever atrasos de voos causados por manobras de espera, demonstrando que um modelo CatBoost enriquecido com características de grafos supera as Redes de Atenção Gráfica (GAT) em dados desbalanceados e oferece uma ferramenta web para simulação em tempo real, visando melhorar a eficiência operacional e a experiência dos passageiros.

Jorge L. Franco, Manoel V. Machado Neto, Filipe A. N. Verri, Diego R. Amancio

Publicado 2026-03-12
📖 5 min de leitura🧠 Leitura aprofundada

Each language version is independently generated for its own context, not a direct translation.

Imagine que o céu é uma cidade gigante e muito movimentada, onde os aviões são como carros em um trânsito caótico. Às vezes, quando o aeroporto de destino está cheio, chove muito ou o controle de tráfego precisa organizar a fila, os pilotos recebem uma ordem para ficar dando voltas no ar (o que chamamos de "manobra de espera" ou holding).

Isso é como se você estivesse dirigindo e, ao chegar no seu destino, o semáforo estivesse fechado. Você é obrigado a dar voltas no quarteirão até que alguém diga: "Agora pode entrar".

O problema é que essas voltas gastam muito combustível, poluem o ar e deixam os passageiros nervosos. A pergunta que os autores deste estudo fizeram foi: "Será que conseguimos prever, antes mesmo de o avião decolar, se ele vai ter que dar essas voltas no ar?"

Aqui está a explicação do que eles fizeram, usando analogias simples:

1. O Grande Desafio: O "Trânsito" não é uma Lista

A maioria dos computadores tenta prever atrasos olhando para uma planilha (como o Excel). Eles veem dados como: "Vento forte", "Aeroporto lotado", "Horário do voo". É como tentar prever um engarrafamento olhando apenas para a lista de carros, sem olhar para a rua onde eles estão.

Os autores disseram: "Espera aí! O céu não é uma lista, é uma rede."
Um voo de São Paulo para o Rio não depende só desses dois lugares. Ele depende de tudo o que acontece em Minas Gerais, no Rio, e em como os voos se conectam. É como se cada aeroporto fosse uma pessoa em uma festa, e o voo fosse uma conversa entre elas.

2. A Solução: Transformando o Céu em um Mapa de Conexões

Para resolver isso, eles transformaram os dados em um Grafo (um desenho de pontos e linhas).

  • Pontos (Nós): São os aeroportos.
  • Linhas (Arestas): São os voos entre eles.
  • Espessura das Linhas: Mostra quantos voos passam por ali (mais grossa = mais trânsito).

Eles usaram duas "ferramentas" (inteligências artificiais) diferentes para tentar prever se um avião vai ficar dando voltas:

Ferramenta A: O Detetive Experiente (CatBoost + Métricas de Rede)

Imagine um detetive muito esperto que não usa redes neurais complexas, mas sim dicas do mapa.

  • Antes de analisar o voo, ele olha para o mapa inteiro e calcula coisas como: "Quem é o aeroporto mais importante?", "Quais rotas são as mais congestionadas?", "Se um aeroporto fecha, quem fica isolado?".
  • Ele pega essas "dicas" (chamadas de métricas de centralidade e conectividade) e as coloca na planilha junto com os dados do clima.
  • Resultado: O detetive foi muito eficiente. Como o problema é difícil (a maioria dos voos não fica dando voltas, é um evento raro), ele aprendeu a não se confundir e acertou bastante, além de poder explicar por que achou que haveria um atraso (ex: "O aeroporto X está muito sobrecarregado").

Ferramenta B: O Estudante Genial (Graph Attention Network - GAT)

Imagine um estudante super inteligente que tenta aprender sozinho olhando para a estrutura da rede, sem receber dicas prévias.

  • Ele tenta aprender quais vizinhos são importantes olhando diretamente para as conexões. É como se ele dissesse: "Vou prestar mais atenção no voo que vem do aeroporto A do que no que vem do B".
  • O Problema: Como o evento (ficar dando voltas) é muito raro, esse estudante ficou confuso. Ele tentou aprender padrões muito complexos e acabou "decorando" os dados de treino em vez de aprender a regra geral. Ele teve um desempenho pior e menos estável do que o detetive.

3. O Veredito: O que Funcionou?

O estudo descobriu que, para esse problema específico de voos, o Detetive (CatBoost) venceu o Estudante Genial (GAT).

  • Por que? Porque o problema é desequilibrado (muitos voos normais, poucos atrasos por espera). O modelo que usou as "dicas do mapa" (as métricas de rede) conseguiu entender o contexto melhor do que o modelo que tentou aprender tudo do zero.
  • A Grande Lição: Às vezes, adicionar inteligência humana (entender a estrutura da rede e criar boas características) é melhor do que apenas jogar dados brutos em uma inteligência artificial supercomplexa.

4. O Presente: Um "Simulador de Trânsito"

Para mostrar que isso é útil no mundo real, eles criaram um site interativo (uma ferramenta web).

  • Imagine um mapa do Brasil onde você pode clicar em um voo e ver, em tempo real, a probabilidade dele ter que dar voltas no ar.
  • Isso ajuda as companhias aéreas e o controle de tráfego a planejar melhor, economizar combustível e deixar os passageiros mais felizes.

Resumo Final

Os autores pegaram um problema chato (voos dando voltas no ar), transformaram o céu em um mapa de conexões e usaram uma inteligência artificial que combinou dados de clima com inteligência sobre a estrutura da rede de voos. Eles provaram que, para prever esses atrasos raros, é melhor usar um modelo que entende o "cenário" (o mapa) do que um modelo que tenta adivinhar tudo sozinho.

É como prever o trânsito: não basta olhar para o carro; você precisa entender como a cidade inteira está conectada!