Ecco un numero che dovrebbe preoccuparti: 59%. Se ogni step del tuo agente AI ha il 90% di probabilità di riuscita - che sembra ottimo - dopo cinque step consecutivi la probabilità di successo complessiva crolla al 59%. Come hobby va bene. Per un’azienda è inaccettabile. Antigravity, il nuovo editor di codice AI di Google, con l’architettura giusta risolve esattamente questo problema.
Il problema non è la qualità dei modelli. I modelli sono già bravissimi. Il problema è la stocasticità: ogni volta che lasci un LLM fare un’azione, stai lanciando un dado. E i dadi, uno dopo l’altro, si moltiplicano contro di te.
La soluzione? Non eliminare l’AI - sarebbe assurdo. Ma spingere la complessità in codice deterministico e lasciare all’AI solo il ruolo che sa fare meglio: orchestrare.
Questo è il cuore del framework DOE.
DOE: il framework che cambia tutto
DOE sta per Directive, Orchestration, Execution. Non è un concetto astratto - sono tre cartelle. Letteralmente. E la metafora aziendale è perfetta.
Directive
SOP in markdown nella cartella /directives. Definiscono obiettivi, input, strumenti da usare e casi limite. Istruzioni in linguaggio naturale, come le daresti a un dipendente.
Orchestration
L’LLM (Gemini, Claude o GPT). Legge le direttive, chiama gli script, coordina il flusso. Non improvvisa: segue le istruzioni del manager.
Execution
Script Python deterministici nella cartella /execution. Ogni script è come un nodo n8n: fa una cosa, la fa sempre uguale, la fa bene.
Il framework DOE: tre livelli, tre responsabilità, zero ambiguità.
La chiave è nella separazione. Il manager (le direttive) non esegue nulla. Il dipendente (l’LLM) non decide la strategia. Gli strumenti (gli script Python) non ragionano - eseguono. Ogni livello fa esattamente una cosa.
Perché funziona? Perché gli script Python sono deterministici. Dato lo stesso input, producono sempre lo stesso output. Nessun dado da lanciare. E quando qualcosa si rompe, sai esattamente dove cercare.
Il self-learning: errori che rendono il sistema più forte
Qui la cosa diventa interessante. Nella maggior parte dei sistemi AI, un errore è un problema. Nel framework DOE, un errore è un aggiornamento.
Esecuzione
Lo script Python viene eseguito
Errore
Qualcosa si rompe, i log parlano
Correzione
L’LLM legge i log, riscrive lo script
Evoluzione
Le direttive vengono aggiornate
Il loop di self-learning: ogni errore rende il sistema più intelligente.
Il ciclo funziona così: uno script va in errore, l’LLM legge i log, capisce il problema, riscrive lo script, lo testa, e - questa è la parte cruciale - aggiorna le direttive per evitare lo stesso errore in futuro.
Il risultato? Un sistema che non ripete mai lo stesso errore due volte. Ogni fallimento è un upgrade permanente.
Caso pratico: da un video YouTube a uno script completo
La teoria è bella, ma funziona? Ecco cosa è stato costruito in 15 minuti con Antigravity e il framework DOE: un’applicazione che prende il link di un video YouTube, ne estrae il trascritto, identifica i topic principali con Claude Sonnet 4.5, li ricerca sul web con Perplexity Sonar, e genera uno script video originale combinando tutto.
Quattro step, quattro script Python deterministici, un LLM che orchestra il flusso. E quando Perplexity Sonar non era disponibile su OpenRouter? Il sistema ha trovato l’errore, cambiato modello, aggiornato la configurazione e riprovato. Self-learning in azione.
Il setup pratico è sorprendentemente semplice: si crea un file gemini.md nel progetto Antigravity con le istruzioni del framework DOE, si seleziona il modello (Claude Opus 4.5 per l’architettura, Gemini 3 Pro per il frontend) e si descrive cosa si vuole costruire. Antigravity crea le cartelle, le direttive, gli script. Il template gemini.md e le risorse sono scaricabili dalla pagina delle risorse.
Perché Antigravity e non gli altri
Il vantaggio competitivo di Antigravity non è la qualità del codice generato - quella è comparabile a Cursor o Claude Code. Il vantaggio è strutturale:
- Multi-modello - Gemini, Claude e GPT nella stessa interfaccia. Scegli il modello giusto per ogni task, non quello imposto dall’editor
- Agent Manager - Lancia più agenti in parallelo su progetti diversi. Una inbox per gestirli come dipendenti virtuali
- Modalità planning - Prima di scrivere codice, l’agente crea un piano con task separati. Come un ingegnere che scompone il problema prima di attaccarlo
- Gratuito - Ad oggi Antigravity è ancora gratis, mentre Claude Code richiede un piano Pro o Max
Detto questo, serve onestà: la funzionalità di auto-testing nel browser funziona male - circa il 60% delle volte non va o rallenta tutto. Per testare una singola funzionalità va bene, per un’applicazione con più pagine non è ancora scalabile. E la secure mode disattivata (necessaria per lavorare senza interruzioni) è un tradeoff di sicurezza che va valutato caso per caso.
La domanda che conta davvero
Il framework DOE non è una rivoluzione. È buon senso applicato all’AI: separa chi pensa da chi esegue, rendi deterministico ciò che deve essere affidabile, lascia all’LLM solo l’orchestrazione. È lo stesso principio che funziona nelle aziende da decenni.
La domanda vera è: quanta complessità puoi spostare dal probabilistico al deterministico? Più ne sposti, più il tuo agente è affidabile. Meno ne sposti, più lanci dadi.
Per le aziende che vogliono costruire agenti AI che funzionano davvero - non demo da conferenza, ma strumenti di produzione - questo framework è un punto di partenza solido. Non l’unico possibile, ma uno che ha il merito di trasformare ogni errore in un investimento. Se vuoi capire come integrare strumenti come questo nella tua operatività quotidiana, la chiave è sempre la stessa: partire dal problema, non dal tool.