A febbraio 2026, Cloudflare ha rinominato il proprio crawler da Cloudflare-AutoRAG a Cloudflare-AI-Search. Stessa tecnologia, nome più esplicito: una pipeline RAG automatica per qualsiasi sito web, a costo zero, senza toccare una riga di backend.
Cloudflare gestisce il traffico del 20% del web mondiale. Quando decidono di costruire un layer AI tra i loro server e i contenuti, le implicazioni non sono solo tecniche. Sono strutturali.
Negli ultimi due mesi hanno rilasciato quattro funzionalità che, messe insieme, disegnano una direzione precisa: Cloudflare vuole diventare il middleware tra il web e gli agenti AI.
Cloudflare AutoRAG - in sintesi
- Cos’è: pipeline RAG managed per qualsiasi sito, senza infrastruttura propria
- Costo: gratuito in open beta (fino a 1.000.000 file/istanza)
- Setup: zero modifiche al codice del sito
- Include: RAG managed, Markdown for Agents, endpoint /mcp, Pay per Crawl (in arrivo)
- Lanciato: febbraio-marzo 2026
1. RAG automatico per il tuo sito: pipeline gestita, zero infrastruttura
Costruire una pipeline RAG per il proprio sito da zero non è banale. Servono: un crawler che indicizzi i documenti, un sistema di chunking, un database vettoriale, un AI gateway per le query, e un layer di re-ranking. Una configurazione seria richiede settimane di lavoro e un costo operativo continuo.
Cloudflare AutoRAG ha impacchettato tutto questo in un servizio managed. Punti il crawler al tuo sito, lui indicizza automaticamente il contenuto, lo trasforma in embedding vettoriali e espone un endpoint che accetta query in linguaggio naturale. Il risultato è una ricerca semantica sul tuo sito - o su qualsiasi sito pubblico - senza toccare una riga di backend.
In open beta gratuita. Con supporto fino a 1.000.000 di file per istanza.
Per le aziende che vogliono attivare un RAG sul proprio sito, sulla propria documentazione o knowledge base, è un punto di partenza concreto e immediato. L’articolo su RAG e ricerca semantica nei file offre un confronto utile con gli approcci alternativi.
2. Markdown for Agents: -80% di token senza toccare il sito
A marzo Cloudflare ha annunciato una funzione apparentemente semplice, con implicazioni concrete per chi costruisce agenti AI che consultano siti web.
Se un agente fa una richiesta HTTP con l’header Accept: text/markdown, Cloudflare intercetta la risposta e converte automaticamente l’HTML in Markdown prima di consegnarla all’agente. Il sito non sa che sta succedendo. Il server non cambia nulla. La trasformazione avviene al livello CDN.
HTML vs Markdown: impatto reale sui token
HTML
16.180
token per articolo
MARKDOWN
3.150
-80% token
Dati Cloudflare su un articolo blog standard. La conversione avviene al livello CDN, senza modifiche al sito.
Per chi costruisce agenti AI che consultano siti web - ricerca, monitoring, data extraction - il risparmio è reale su ogni singola query. Non serve modificare i siti visitati. Basta aggiungere un header alla richiesta.
3. Ogni sito diventa un MCP server nativo
Da marzo, Cloudflare AI Search espone un endpoint /mcp nativo su ogni sito che lo attiva. Invece dello scraping grezzo - parsing HTML, gestione di cambiamenti nel markup, rate limiting - un agente AI può interrogare il sito come se fosse un tool strutturato.
Si integra con NLWeb, un protocollo aperto sviluppato in partnership con Microsoft per standardizzare le query in linguaggio naturale sul web. La visione è un web dove i siti rispondono agli agenti esattamente come rispondono alle persone, ma in modo semantico.
Per chi sta costruendo agenti che raccolgono informazioni da più fonti web, è un’alternativa concreta al web scraping tradizionale. L’articolo sul protocollo MCP e l’integrazione con dati esterni approfondisce l’architettura.
Le quattro funzionalità di Cloudflare AutoRAG / AI Search
| Funzionalità | Cosa fa | Stato |
|---|---|---|
| RAG managed (AutoRAG) | Indicizzazione + endpoint query NL | Open beta gratuita |
| Markdown for Agents | HTML → Markdown via header HTTP | Disponibile |
| Endpoint /mcp | Sito come MCP tool strutturato | Disponibile da marzo 2026 |
| Pay per Crawl (x402) | Monetizzazione accesso crawler AI | In arrivo |
4. Pay per Crawl: monetizzare i contenuti nell’era degli agenti
Cloudflare ha annunciato “Pay per Crawl” tramite il protocollo x402: i publisher possono impostare un costo per ogni richiesta effettuata da crawler AI al proprio sito. Il meccanismo funziona a livello CDN, senza integrazioni backend.
Per chi produce contenuti di valore - documentazione tecnica, ricerca, database - è la prima infrastruttura concreta per far pagare i modelli AI per l’accesso ai propri dati. Fino ad oggi, l’unica opzione era bloccare il crawler nel robots.txt e sperare che venisse rispettato.
Non è ancora disponibile pubblicamente, ma l’annuncio è formale. Arriverà nelle prossime settimane.
La domanda che vale la pena porsi prima di adottarlo
Quattro funzionalità significative, tutte gratuite, tutte in open beta. Il pattern è riconoscibile: fase di adozione con zero barriere, poi - quando l’infrastruttura è al centro dei flussi di lavoro di migliaia di aziende - arriva il pricing.
Non è una critica. È la logica di qualsiasi piattaforma infrastrutturale. AWS ha fatto lo stesso con S3, Stripe con i pagamenti, Twilio con le comunicazioni.
La domanda concreta è: quando la fase gratuita finirà e chi ci ha costruito sopra avrà poche alternative, quanto sarà caro uscire?
Chi valuta Cloudflare AutoRAG oggi dovrebbe ragionare su tre punti. Primo: quanto profondo sarà il coupling con Cloudflare nei propri flussi AI. Secondo: quali parti dell’architettura RAG sono replicabili su infrastruttura propria. Terzo: qual è il valore reale del servizio rispetto al costo futuro di mantenerlo o sostituirlo.
In sintesi - Cloudflare AutoRAG (AI Search)
- ✓ RAG automatico per qualsiasi sito, senza modifiche al codice
- ✓ Gratuito in open beta fino a 1.000.000 file per istanza
- ✓ Markdown for Agents: -80% token via header HTTP
- ✓ Endpoint /mcp nativo per integrazione con agenti AI
- ✓ Pay per Crawl in arrivo tramite protocollo x402
- ⚠ Pricing futuro non ancora annunciato
- ⚠ Lock-in infrastrutturale da valutare prima dell’adozione
Il prodotto è in open beta e molte funzionalità stanno ancora arrivando. È il momento giusto per esplorarlo - con consapevolezza di dove si sta mettendo il piede.
Per le aziende che stanno costruendo agenti AI autonomi con accesso a fonti web, Cloudflare AI Search merita un posto nella valutazione tecnica. Con gli occhi aperti.