Un agente AI che gira in locale è un esperimento. Uno che gira in produzione è un prodotto - e i problemi che emergono nel passaggio arrivano quasi sempre dall’infrastruttura, prima ancora che dal modello. Esecuzione sicura del codice, gestione delle credenziali senza esporle al contesto dell’agente, tenuta sotto carico reale. Il 19 maggio 2026, Cloudflare e Anthropic hanno annunciato un’integrazione che prova ad affrontare questi tre problemi insieme.
Risposta diretta: Claude Managed Agents su Cloudflare separa il loop dell’agente dalla sua esecuzione. Claude - il cervello - gira sull’infrastruttura Anthropic e decide cosa fare. Cloudflare - le mani - esegue il codice, gestisce le connessioni sicure e inietta le credenziali tramite proxy, senza mai esporle all’agente nel suo contesto. I sandbox girano su Dynamic Workers basati su V8 isolate, con avvio dell’ordine dei millisecondi, progettati per scalare a decine di migliaia di sessioni parallele.
Il problema reale: eseguire codice in modo sicuro non è banale
Chiunque abbia deployato un agente AI in produzione sa che il vero collo di bottiglia spesso non è il modello. È l’esecuzione sicura del codice che il modello genera. Un agente con accesso a un interprete Python può fare quasi tutto - e questo è sia il punto di forza che il rischio principale. Servono ambienti isolati, con limiti precisi su cosa l’agente può toccare, credenziali iniettate senza essere visibili nel contesto, networking che separa i servizi interni da Internet.
Costruire tutto questo da zero richiede settimane. Mantenerlo in produzione ne richiede altre. In Martes AI lo vediamo regolarmente con i clienti: il gap tra “abbiamo un agente che funziona in locale” e “abbiamo un agente in produzione che regge il carico reale” è spesso più profondo di quanto ci si aspetti. Il costo di colmarlo è quello che blocca l’adozione. Questa è la premessa su cui si regge l’intera integrazione - e su cui vale la pena essere precisi su cosa risolve e cosa no.
Separare il cervello dalle mani: l’architettura dell’integrazione
Il principio è espresso chiaramente nel post Cloudflare: “disaccoppiare il cervello dalle mani.” Claude - il ragionamento, la pianificazione, la sequenza di azioni - gira su infrastruttura Anthropic. L’esecuzione - il codice, le chiamate agli strumenti, le connessioni ai servizi - gira su Cloudflare, in sandbox isolati per sessione.
Claude Managed Agents - già in public beta dall’aprile 2026 - fornisce il harness che gestisce il ciclo agente. Quando un agente apre una sessione, il control plane basato su Workers provvede a istanziare un sandbox dedicato. L’agente comunica attraverso un proxy Cloudflare che intercetta le chiamate in uscita, applica le politiche di sicurezza configurate e inietta le credenziali necessarie prima che la richiesta raggiunga il servizio di destinazione.
Architettura: cervello (Anthropic) e mani (Cloudflare)
Claude Platform (Anthropic)
Ragionamento · Pianificazione · Loop agente
Control Plane (Workers)
Policy · Routing · Sessioni · Proxy
Dynamic Worker
V8 · ms boot · JS/WASM
CF Container
Linux VM · completo
Mesh (rete privata)
Servizi interni sicuri
Il loop decisionale gira su Anthropic; l’esecuzione su Cloudflare in sandbox isolati per sessione
Dynamic Workers vs container: perché il tipo di sandbox cambia i conti
L’integrazione offre due tipi di ambiente di esecuzione con trade-off concreti. I Dynamic Workers usano V8 isolate - lo stesso runtime di Chrome - e si avviano in millisecondi, senza warm-up, con un costo per invocazione significativamente inferiore a quello di un container. I Cloudflare Containers sono Linux microVM completi, con avvio in secondi ma con accesso all’intero ecosistema di strumenti Linux.
La differenza economica è rilevante. Se un sistema deve gestire diecimila sessioni parallele, un microVM per sessione brucia risorse computazionali in modo proporzionale. Un V8 isolate si istanzia, esegue il codice e si libera in pochi millisecondi. Per agenti che fanno molte operazioni brevi - trasformazioni dati, chiamate API, parsing di file - i Dynamic Workers sono la scelta che rende il costo operativo sostenibile a scala. Cloudflare dichiara un vantaggio di circa 100x rispetto ai container tradizionali per esecuzioni brevi.
Dynamic Workers vs Cloudflare Containers
Dynamic Workers (V8 isolate)
- ⚡ Avvio in millisecondi
- 💰 Costo per invocazione
- 📈 Scala a milioni di esecuzioni
- ⚠️ Solo JavaScript / WASM
- ✅ Operazioni brevi e frequenti
Cloudflare Containers (Linux VM)
- 🐢 Avvio in secondi
- 💰 Costo per CPU / ora
- 📦 Linux completo con qualsiasi CLI
- 🔧 Python, Rust, strumenti shell
- ✅ Task complessi a lunga durata
La scelta dipende dal tipo di task: operazioni brevi e parallele → Dynamic Workers; ambienti Linux completi → Containers
Credenziali che l’agente non vede mai: il modello zero-trust
Il punto architetturalmente più interessante è il modello di gestione dei segreti. Il proxy in uscita di Cloudflare intercetta le richieste dell’agente e inietta chiavi API, token OAuth, o qualsiasi credenziale necessaria - fuori dal contesto dell’agente. In pratica: l’agente dice “chiama questo servizio”, e il proxy aggiunge le credenziali reali prima che la richiesta parta, senza che l’agente le abbia mai avute nel proprio context window.
Questo risolve un problema che chi lavora seriamente con agenti in produzione conosce bene: la gestione sicura dei segreti in un sistema dove il contesto è, per definizione, ampio e potenzialmente leggibile. Con questo approccio, un attacco di prompt injection sofisticato non porta a nessun segreto. Le credenziali non esistono nel contesto - non si può esfiltrare ciò che non c’è.
Cloudflare aggiunge anche Cloudflare Mesh: identità distinte per ogni agente con politiche di accesso granulari. Un agente di coding può leggere il database di staging senza vedere quello di produzione. La network policy è definita a livello di agente, non di applicazione. Per le aziende che lavorano con dati sensibili, questa granularità è un cambiamento significativo rispetto alla gestione tradizionale delle credenziali in variabili d’ambiente.
Le alternative nel 2026: quando Cloudflare non è la risposta giusta
Cloudflare non è l’unico provider sandbox compatibile con Claude Managed Agents. Nella public beta sono già supportati anche Daytona, Modal e Vercel. Per chi vuole uscire del tutto dall’ecosistema Anthropic, LangChain ha lanciato Deep Agents Deploy, un’alternativa open source e model-agnostic. Le differenze principali:
| Provider | Modelli | Sandbox | Lock-in | Pricing |
|---|---|---|---|---|
| Cloudflare | Solo Claude | V8 / Linux VM | Anthropic + CF | TBD (beta) |
| Daytona / Modal | Solo Claude | Container | Anthropic + provider | Pubblico |
| Deep Agents Deploy | Qualsiasi | Variabile | Nessuno | Open source |
| Self-hosted | Qualsiasi | DIY | Nessuno | Solo infrastruttura |
Per chi costruisce sistemi agentici per le aziende e valuta la flessibilità di modello come requisito non negoziabile, le opzioni model-agnostic restano la scelta più difendibile a lungo termine.
Cosa manca ancora: i limiti da nominare esplicitamente
I post di annuncio raramente elencano i vincoli. Vale la pena farlo.
Il primo è il lock-in doppio: funziona solo con Claude (vincolo Anthropic) su infrastruttura Cloudflare (vincolo infrastrutturale). Chi costruisce su questa integrazione ha due dipendenze critiche da fornitori esterni. Non è un problema se entrambe le scelte sono consapevoli e deliberate - lo diventa se non lo sono, soprattutto se il pricing definitivo post-beta si rivela significativo.
Il secondo è che il pricing non è ancora pubblico. Né Anthropic né Cloudflare hanno comunicato il costo definitivo. La beta non è un indicatore affidabile: le regole cambiano quando il servizio diventa generally available.
Il terzo è che non è un servizio completamente gestito. Il punto di partenza è un template GitHub da fare il fork e configurare - Workers, policy di sicurezza, gestione dell’infrastruttura. Non è il clic su una dashboard: è ancora infrastructure-as-code con la parte di orchestrazione a carico dello sviluppatore. La complessità è ridotta rispetto al partire da zero, ma non è eliminata.
La domanda che rimane aperta è se la separazione “cervello su Anthropic, mani su Cloudflare” sia un’architettura stabile o un momento di transizione verso qualcosa di più integrato. Il mercato degli agenti AI in produzione si sta consolidando rapidamente - e chi controlla il layer di esecuzione ha un ruolo non banale nella catena del valore. Vale la pena seguire come evolve questa partnership nei prossimi trimestri, non per il singolo annuncio, ma per capire dove si stanno spostando le dipendenze critiche dei sistemi AI aziendali.