180.000 stelle GitHub in quattro mesi. Hermes Agent di Nous Research è il progetto open source per agenti AI a crescita più rapida del 2026, e dal 2 giugno ha un’app desktop nativa per macOS, Windows e Linux. La notizia che interessa davvero: Hermes Desktop funziona con Ollama e modelli locali, senza dipendere da API cloud a pagamento.
Un agente AI che gira sul tuo hardware, impara dalle proprie esperienze e costa zero in abbonamenti. Sembra il pitch di una startup. Invece è software MIT, verificabile riga per riga. Vediamo cosa c’è dentro e dove sono i limiti reali.
Hermes Agent è un agente AI self-improving open source che crea skill riutilizzabili dopo ogni task, mantiene memoria persistente tra sessioni, e costruisce un modello progressivo dell’utente. Si installa con un solo comando Ollama, supporta oltre 70 skill integrate e si connette a Telegram, Discord, Slack, WhatsApp, Signal e email da un’unica sessione.
Come funziona il ciclo di auto-miglioramento di Hermes Agent
La caratteristica che distingue Hermes Agent da qualsiasi altro framework è il ciclo di apprendimento integrato. Non è un concetto teorico: è un meccanismo concreto.
Dopo ogni task completato, l’agente valuta la propria performance, estrae i pattern riutilizzabili e li salva come file Markdown nella propria libreria di skill. Nelle esecuzioni successive, consulta queste skill prima di affrontare un task simile.
I numeri di Nous Research: agenti con oltre 20 skill auto-create completano task ricorrenti il 40% più velocemente, in token consumati e tempo di esecuzione. Dato da contestualizzare: il miglioramento è specifico per dominio. Se usi Hermes per analizzare report finanziari, le skill accumulate non ti aiuteranno a scrivere codice Python. L’apprendimento è verticale, non trasversale.
Installare Hermes Desktop con Ollama: tre comandi e via
L’installazione è, onestamente, la parte più semplice. Serve Ollama versione 0.21 o superiore. Se non lo hai ancora installato, scaricalo da ollama.com.
Il comando di avvio:
ollama launch hermes-desktop
Ollama gestisce tutto automaticamente: download del runtime, configurazione iniziale, avvio dell’interfaccia desktop. Al primo lancio, scegli il modello e inizi a lavorare.
Nota tecnica critica: il context length predefinito di Ollama è troppo basso per un uso agente. Per funzionare correttamente con le skill, la memoria e le conversazioni lunghe, Hermes ha bisogno di almeno 16.000-32.000 token di contesto. Puoi impostarlo con la variabile d’ambiente OLLAMA_CONTEXT_LENGTH o tramite un Modelfile personalizzato.
Quali modelli usare con Hermes Agent: locale, Apple Silicon e cloud
La scelta del modello è dove si gioca la partita vera. Non tutti i modelli sono equivalenti per un uso agente, e la differenza tra “funziona” e “funziona bene” è enorme.
Modelli consigliati per Hermes Agent su Ollama
| Modello | Tipo | Requisiti | Costo |
|---|---|---|---|
| qwen3.6:27b | Locale (GPU) | 16+ GB VRAM | Gratuito |
| gemma4:12b | Locale (GPU) | 12+ GB VRAM | Gratuito |
| qwen3.6:27b-mlx | Apple Silicon | 32+ GB RAM unificata | Gratuito |
| gemma4:26b-mlx | Apple Silicon | 32+ GB RAM unificata | Gratuito |
| minimax-m3:cloud | Cloud (Ollama) | Solo connessione internet | Pay-per-use |
| kimi-k2.6:cloud | Cloud (Ollama) | Solo connessione internet | Pay-per-use |
I modelli con suffisso :cloud girano sui server Ollama, non sul tuo hardware. Kimi K2.6 ha 1 trilione di parametri: non eseguibile in locale.
Precisazione necessaria: i modelli con suffisso :cloud come kimi-k2.6:cloud non girano sul tuo computer. Sono modelli enormi eseguiti sui server di Ollama. L’interfaccia è identica, ma privacy e autonomia offline non ci sono.
Quanto costa davvero usare Hermes Agent nel 2026
L’app e l’agente sono gratuiti, licenza MIT. Il costo reale sta nell’inferenza LLM, e qui ci sono tre percorsi concreti:
- Modelli locali con Ollama: costo zero in abbonamenti. Serve hardware con GPU adeguata o un Mac con Apple Silicon e almeno 32 GB di RAM unificata. L’investimento è nell’hardware, non nel software.
- API cloud proprie: usi le tue chiavi Anthropic, OpenAI o di qualsiasi altro provider. Paghi il consumo effettivo di token. Hermes supporta oltre 20 provider.
- Nous Portal: il piano Plus costa 20 dollari al mese e include accesso a oltre 400 modelli. Esiste un tier gratuito con 0,10 dollari di credito mensile, sufficiente solo per una valutazione rapida.
Per un uso reale e continuativo, la scelta si riduce a: hai l’hardware per il locale? Allora costo zero. Non ce l’hai? API cloud o Nous Portal, con costi paragonabili a qualsiasi altro servizio LLM.
Hermes Agent vs altri agenti AI: cosa cambia davvero
È inevitabile il confronto con gli altri strumenti che usiamo quotidianamente. Ma conviene essere precisi su cosa si confronta, perché Hermes Agent non compete direttamente con i coding agent.
Hermes Agent vs Coding Agent
| Hermes Agent | Claude Code / Codex | |
|---|---|---|
| Obiettivo | Assistente autonomo generalista | Sviluppo software |
| Modelli | Qualsiasi (locale, cloud, 20+ provider) | Proprietari ottimizzati |
| Memoria | Skill auto-generate + memoria persistente | Contesto sessione + CLAUDE.md |
| Canali | Telegram, Discord, Slack, WhatsApp, Signal, email | Terminale, IDE, web |
| Costo | Gratis (MIT) + costo modello | Abbonamento o API |
Strumenti con obiettivi diversi: Hermes punta sull’autonomia e la versatilità, i coding agent sulla qualità del codice prodotto.
In pratica: se il tuo obiettivo è sviluppo software, Claude Code resta lo strumento più potente che conosciamo. Se cerchi un assistente personale autonomo che gestisca comunicazioni su più piattaforme, automazioni ricorrenti e accumulazione di conoscenza nel tempo, Hermes Agent è la proposta più interessante nel panorama open source.
Casi d’uso concreti: dove Hermes Agent ha senso
Dove si traduce in valore reale? Gli scenari più convincenti:
- Assistente personale autonomo: gestione agenda, ricerche web, sintesi documenti, con memoria che si accumula tra sessioni.
- Bot multi-piattaforma unificato: un’unica sessione connessa a Telegram, Discord, Slack, WhatsApp, Signal e email contemporaneamente.
- Automazioni pianificate in linguaggio naturale: “ogni lunedì mattina, analizza i report della settimana e mandami un riepilogo su Telegram”.
- Sviluppo codice con sub-agenti: orchestrazione di agenti specializzati per task complessi.
Un’osservazione da chi lavora con agenti AI in produzione: la qualità dell’output è direttamente proporzionale al modello sottostante. Un modello locale da 12 miliardi di parametri non produrrà risultati paragonabili a Claude Opus o GPT-5. Il risparmio economico c’è, ma ha un costo in qualità.
I limiti che nessuno menziona
- Il self-improvement è verticale: le skill accumulate sono specifiche per dominio. L’agente non diventa “generalmente più intelligente”.
- L’hardware locale non è opzionale: servono almeno 16 GB di VRAM o 32 GB di RAM unificata su Apple Silicon. Sotto queste soglie, la latenza rende l’uso frustrante.
- La public preview è una preview: uscito il 2 giugno 2026, bug e cambiamenti di API sono da mettere in conto.
- Contesto lungo = consumo elevato: 32k token di contesto su un modello locale da 27B parametri richiede risorse significative.
Un agente che impara: promessa o realtà?
Hermes Agent rappresenta un’idea che il settore insegue da tempo: software che accumula esperienza. Il meccanismo di skill auto-generate è la prima implementazione open source credibile di questo concetto, con numeri verificabili e codice ispezionabile.
La domanda aperta non è se funziona, perché i dati mostrano che funziona. È se il miglioramento del 40% su task ricorrenti giustifica la complessità di gestire un agente autonomo in locale, rispetto a un servizio cloud ottimizzato per il tuo caso d’uso specifico.
Per chi ha l’hardware e la curiosità, Hermes Desktop con Ollama è il punto di ingresso più accessibile mai esistito per gli agenti AI locali. Per chi ha bisogno di risultati in produzione oggi, la risposta è più sfumata.