LeJOT-AutoML: LLM-Driven Feature Engineering for Job Execution Time Prediction in Databricks Cost Optimization

Il paper presenta LeJOT-AutoML, un framework AutoML guidato da agenti LLM che automatizza l'ingegneria delle caratteristiche per la previsione dei tempi di esecuzione su Databricks, riducendo drasticamente i cicli di sviluppo e ottenendo un risparmio dei costi del 19,01% grazie a una migliore ottimizzazione dell'orchestrazione dei job.

Lizhi Ma, Yi-Xiang Hu, Yihui Ren, Feng Wu, Xiang-Yang Li

Pubblicato 2026-03-10
📖 4 min di lettura☕ Lettura da pausa caffè

Each language version is independently generated for its own context, not a direct translation.

Immagina di dover organizzare una festa enorme per migliaia di persone (i "lavori" o jobs su Databricks). Il tuo obiettivo è assicurarti che la festa finisca in tempo, che non ci siano code alla cucina e, soprattutto, che non spendere una fortuna in cibo e alcol che non servono.

In questo scenario, LeJOT-AutoML è come un chef intelligente e super-veloce che ha appena imparato a usare un assistente magico (l'Intelligenza Artificiale) per prevedere esattamente quanto tempo servirà per cucinare ogni piatto, permettendoti di risparmiare soldi.

Ecco come funziona, spiegato in modo semplice:

1. Il Problema: La Scommessa Costosa

Fino a poco tempo fa, per prevedere quanto tempo avrebbe impiegato un lavoro informatico, gli ingegneri umani dovevano fare da "detective". Dovevano guardare vecchi registri, capire le ricette (il codice) e indovinare.

  • Il problema: Era lento (ci volevano settimane).
  • Il limite: Spesso sbagliavano perché non vedevano cosa succedeva durante la cottura. Ad esempio, un piatto potrebbe sembrare veloce sulla carta, ma se gli ingredienti sono appiccicosi (dati disordinati) o se la cucina è affollata, ci vuole il doppio del tempo. Gli umani non vedevano questi "dettagli nascosti" in tempo reale.

2. La Soluzione: L'Agente Chef con il Bastone Magico

Gli autori hanno creato LeJOT-AutoML, un sistema che usa un LLM (un modello linguistico gigante, come un cervello digitale molto colto) aiutato da un braccio robotico (chiamato MCP, che legge i dati reali).

Immagina tre assistenti che lavorano insieme:

  • L'Analista (Feature Analyzer Agent): È il "ricercatore". Legge tutti i libri di cucina, le vecchie ricette e i rapporti di ieri. Usa la sua intelligenza artificiale per dire: "Ehi, ho notato che quando piove (un certo tipo di dato), la pasta si cuoce diversamente. Dobbiamo misurare l'umidità!".
  • L'Esecutore (Feature Extraction Agent): È il "cameriere veloce". Non si limita a immaginare, ma corre in cucina, apre i registri, guarda i contatori e misura davvero l'umidità, il tempo di cottura e il disordine. Usa strumenti sicuri (come una cucina di prova) per non rovinare il lavoro vero.
  • Il Controllore (Safety Gates): È il "sommelier severo". Prima che il cameriere porti il dato allo chef, lo controlla: "Sei sicuro che questo dato non sia stato rubato dal futuro? Non puoi dire quanto è durata la festa se la festa non è ancora finita!". Questo evita errori pericolosi.

3. La Magia: Da Settimane a Minuti

Prima, per creare un nuovo modo di prevedere i tempi, servivano settimane di lavoro manuale.
Ora, con questo sistema:

  1. L'Analista pensa a nuove idee in pochi secondi.
  2. L'Esecutore le prova e le misura in pochi minuti.
  3. Il Controllore approva tutto.
    Risultato: Invece di 4 settimane, il sistema crea un nuovo modello predittivo in 20-30 minuti. È come passare dal dover scrivere una ricetta a mano a usare una stampante 3D che la crea istantaneamente.

4. Il Risultato: Risparmiare Soldi

Grazie a questa velocità e precisione, il sistema LeJOT (il manager della festa) può scegliere la cucina più economica possibile senza rischiare che la festa finisca in ritardo.

  • Il sistema ha scoperto oltre 200 nuovi indizi (dati) che gli umani avevano ignorato.
  • Anche se il modello umano era leggermente più preciso su certi scenari, il sistema automatico ha permesso di risparmiare quasi il 19% dei costi totali.
  • Inoltre, se la situazione cambia (es. arriva un nuovo tipo di ingrediente), il sistema si adatta da solo, mentre gli umani dovrebbero ricominciare da capo.

In Sintesi

LeJOT-AutoML è come aver dato a un manager di un'azienda un assistente personale che:

  1. Legge tutto quello che c'è da sapere.
  2. Fa esperimenti rapidi e sicuri.
  3. Impara dagli errori in tempo reale.
  4. Fa risparmiare soldi scegliendo le opzioni migliori al momento giusto.

Non serve più aspettare mesi per migliorare il lavoro; il sistema si aggiorna da solo, velocemente e in modo intelligente, proprio come un atleta che si allina ogni giorno per diventare più veloce.