LeJOT-AutoML: LLM-Driven Feature Engineering for Job Execution Time Prediction in Databricks Cost Optimization

Het paper introduceert LeJOT-AutoML, een door LLM-agenten aangedreven AutoML-framework dat automatisch complexe runtime-kenmerken genereert voor het voorspellen van uitvoeringstijden in Databricks, waardoor de feature-engineeringcyclus van weken naar minuten wordt teruggebracht en de kosten met 19,01% worden verlaagd.

Lizhi Ma, Yi-Xiang Hu, Yihui Ren, Feng Wu, Xiang-Yang Li

Gepubliceerd 2026-03-10
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een gigantische, complexe fabriek hebt (zoals Databricks) waar duizenden taken elke dag worden uitgevoerd. Sommige taken zijn simpel, andere zijn zwaar als een vrachtwagen. Het doel van het systeem LeJOT is om te beslissen: "Welke machine (computer) gebruiken we voor deze taak om het goedkoopst te zijn, zonder dat het te lang duurt?"

Het probleem? Als je de verkeerde machine kiest, is het te duur of te traag. Om dit te weten, moet je precies kunnen voorspellen hoe lang een taak duurt.

Hier komt LeJOT-AutoML in beeld. Dit is een slimme, nieuwe manier om die voorspellingen te maken, met behulp van kunstmatige intelligentie (LLM's). Hier is de uitleg in gewone taal, met een paar creatieve vergelijkingen:

1. Het Oude Probleem: De "Handgemaakte" Chef-kok

Vroeger deden mensen dit werk. Ze waren als chef-koks die een recept schreven voor het voorspellen van de tijd.

  • Ze keken naar statische dingen: "Hoe groot is het bestand?" of "Hoeveel CPU heeft de machine?"
  • Het nadeel: Dit is als een kookboek dat niet weet dat de oven warm is of dat de kip nat is. In de echte wereld verandert alles constant. Soms is een taak sneller omdat de data al gesorteerd is, of trager omdat de data scheef ligt (zoals een auto die vastzit in modder).
  • Mensen moesten maanden werken om nieuwe regels te bedenken als de situatie veranderde. Het was traag, duur en vaak onnauwkeurig.

2. De Nieuwe Oplossing: Het "AI-Team"

LeJOT-AutoML is geen enkele robot, maar een team van slimme agenten die samenwerken. Denk aan een super-efficiënte keuken met drie specialisten:

  • De Onderzoeker (Feature Analyzer Agent):
    Deze agent leest duizenden oude rapporten en kookboeken (de kennisbank). Hij zegt: "Hé, ik heb gezien dat als er veel data wordt verplaatst, het vaak trager gaat. Laten we dat gaan meten!" Hij bedenkt honderden nieuwe manieren om de taak te analyseren.
  • De Uitvoerder (Feature Extraction Agent):
    Deze agent is de "handjes". Hij pakt de ideeën van de Onderzoeker en gaat ze direct testen in de fabriek. Hij kijkt in de logboeken, vraagt aan de database en simuleert kleine tests. Hij verzamelt de feiten: "Oké, deze taak heeft inderdaad veel data verplaatst, hier is het exacte getal."
  • De Kwaliteitscontroleur (Feature Evaluation Agent):
    Deze agent is de strenge keurmeester. Hij kijkt of de nieuwe data nuttig is en of er geen fouten in zitten. Hij zorgt dat niemand "valsspelen" (bijvoorbeeld door de uitkomst al te kennen voordat de taak begint).

3. De "Veiligheidspoortjes"

Voordat de AI iets doet, moet het door twee poortjes:

  1. De Code-Controle: Is het recept wel compleet? (Zitten er ingrediënten in die ontbreken?)
  2. De Data-Lek-Controle: Kijkt de AI niet naar het antwoord voordat de taak is gedaan? (Dat zou valsspelen zijn).

4. Wat levert dit op? (De Resultaten)

  • Snelheid: Waar mensen maanden nodig hadden om een nieuw voorspellingssysteem te bouwen, doet dit AI-team het in 20 tot 30 minuten. Het is alsof je van handmatig koken overschakelt op een robot die in een seconde een perfect maaltijd bereidt.
  • Meer Inzichten: Het systeem vindt meer dan 200 nieuwe factoren om naar te kijken (zoals hoe de data zich gedraagt tijdens het draaien), terwijl mensen er maar ongeveer 40 vonden.
  • Kostenbesparing: Omdat de voorspellingen beter zijn, kiest het systeem de juiste, goedkopere machines. In de praktijk heeft dit geleid tot 19% kostenbesparing. Dat is alsof je voor hetzelfde eten 19% minder betaalt.

Samenvattend

LeJOT-AutoML is als het vervangen van een ouderwetse, trage planner door een slim, zelflerend team van detectives. Ze kijken niet alleen naar wat er op papier staat, maar voelen ook hoe de machine echt aanvoelt tijdens het werk. Hierdoor wordt het bedrijf goedkoper, sneller en slimmer, zonder dat mensen urenlang hoeven te knutselen aan de code.