Each language version is independently generated for its own context, not a direct translation.
Imagine que você é o gerente de uma grande frota de caminhões (os servidores da Databricks) que precisa entregar pacotes (tarefas de dados) para milhares de clientes todos os dias. O seu grande desafio é: quanto tempo cada caminhão vai levar para fazer a entrega?
Se você errar a estimativa:
- Se achar que é mais rápido do que realmente é, o caminhão chega atrasado e o cliente fica bravo (violação de prazo).
- Se achar que é mais lento, você contrata caminhões gigantes e caros para uma entrega simples, desperdiçando dinheiro (custo desnecessário).
Até agora, para prever esse tempo, as empresas usavam "engenheiros humanos" que criavam regras manuais e estáticas. Era como tentar prever o trânsito olhando apenas para o mapa da cidade, sem saber se choveu, se houve um acidente ou se a estrada estava cheia de buracos. Funcionava, mas era lento e não pegava as surpresas do dia a dia.
Aqui entra o LeJOT-AutoML, a solução apresentada neste artigo. Vamos entender como ele funciona usando uma analogia simples:
1. O Problema: O Mapa vs. A Realidade
Os métodos antigos olhavam apenas para o "mapa estático" (o código do programa e o tamanho da tabela de dados). Mas, na vida real, o tempo de entrega depende de coisas que só acontecem durante a viagem:
- Desvios de rota: O sistema decide ignorar partes da estrada (pruning de partições).
- Trânsito inesperado: Um caminhão fica lento porque um pacote é muito pesado (desequilíbrio de dados).
- Paradas na estrada: O caminhão precisa trocar de carga várias vezes (shuffling).
Os engenheiros humanos tinham dificuldade em criar regras para todas essas surpresas, e atualizar essas regras levava semanas.
2. A Solução: O "Detetive Inteligente" (LeJOT-AutoML)
O LeJOT-AutoML é como um sistema de detetives automatizados que usam Inteligência Artificial (LLMs) para investigar cada tarefa antes de ela começar. Em vez de um humano desenhando as regras, temos três agentes (detectives) trabalhando juntos:
- O Analista (FAA): Ele lê manuais antigos, logs de viagens passadas e o código da tarefa. Com a ajuda de uma IA, ele diz: "Ei, olha! Na última vez que fizemos isso, o trânsito ficou ruim porque choveu. Vamos criar uma regra para medir a 'umidade' da estrada agora!" Ele gera uma lista de coisas novas para medir.
- O Coletor (FExA): Ele pega a lista do Analista e vai até a "fábrica de dados" (usando ferramentas seguras) para medir essas coisas. Ele abre o código, lê os registros de erros e faz perguntas ao banco de dados para ver o que está acontecendo agora.
- O Fiscal (FEvA e os Portões de Segurança): Antes de usar qualquer nova regra, ele verifica duas coisas cruciais:
- Código Funciona? A regra foi escrita corretamente?
- Não é Trapaça? A regra não pode usar informações do futuro (como saber o tempo final da entrega antes dela acontecer). Isso é chamado de "vazamento de dados".
3. A Mágica: Aprendizado Rápido
A grande vantagem é a velocidade.
- Método Antigo: Um engenheiro humano levava um mês para criar, testar e ajustar as regras de previsão.
- LeJOT-AutoML: O sistema faz todo esse ciclo (criar regras, testar, ajustar) em 20 a 30 minutos.
É como se, em vez de esperar um mês para aprender que "chuva atrapalha o trânsito", o sistema aprendesse isso em 20 minutos e já aplicasse a regra para a próxima viagem.
4. Os Resultados: Economizando Dinheiro
O sistema foi testado em uma empresa real usando a plataforma Databricks.
- Quantidade de Dados: O sistema automático criou mais de 200 tipos de regras (medindo coisas como desequilíbrio, tempo de espera, etc.), enquanto o método manual tinha apenas cerca de 40.
- Precisão: O método manual ainda é um pouco mais preciso (91% de acerto vs. 81% do automático), mas o automático é "bom o suficiente" e muito mais ágil.
- Economia: Ao usar as previsões do sistema automático para escolher os caminhões certos, a empresa economizou 19% no custo total da operação.
Resumo em uma Frase
O LeJOT-AutoML é um sistema que usa Inteligência Artificial para criar, testar e melhorar automaticamente as regras de previsão de tempo de tarefas de dados, transformando um processo que levava meses em algo que acontece em minutos, economizando muito dinheiro ao evitar o desperdício de recursos computacionais.
É como trocar um engenheiro de tráfego que atualiza o mapa uma vez por ano, por um sistema de GPS em tempo real que aprende com cada carro que passa e ajusta a rota instantaneamente.