AGENTI AI 7 min

Hermes Desktop + Ollama: agente AI locale e gratuito

Hermes Desktop di Nous Research è un agente AI open source che impara dalle proprie esperienze. Ecco come installarlo gratis con Ollama e modelli locali.

180.000 stelle GitHub in quattro mesi. Hermes Agent di Nous Research è il progetto open source per agenti AI a crescita più rapida del 2026, e dal 2 giugno ha un’app desktop nativa per macOS, Windows e Linux. La notizia che interessa davvero: Hermes Desktop funziona con Ollama e modelli locali, senza dipendere da API cloud a pagamento.

Un agente AI che gira sul tuo hardware, impara dalle proprie esperienze e costa zero in abbonamenti. Sembra il pitch di una startup. Invece è software MIT, verificabile riga per riga. Vediamo cosa c’è dentro e dove sono i limiti reali.

Hermes Agent è un agente AI self-improving open source che crea skill riutilizzabili dopo ogni task, mantiene memoria persistente tra sessioni, e costruisce un modello progressivo dell’utente. Si installa con un solo comando Ollama, supporta oltre 70 skill integrate e si connette a Telegram, Discord, Slack, WhatsApp, Signal e email da un’unica sessione.

Come funziona il ciclo di auto-miglioramento di Hermes Agent

La caratteristica che distingue Hermes Agent da qualsiasi altro framework è il ciclo di apprendimento integrato. Non è un concetto teorico: è un meccanismo concreto.

Dopo ogni task completato, l’agente valuta la propria performance, estrae i pattern riutilizzabili e li salva come file Markdown nella propria libreria di skill. Nelle esecuzioni successive, consulta queste skill prima di affrontare un task simile.

I numeri di Nous Research: agenti con oltre 20 skill auto-create completano task ricorrenti il 40% più velocemente, in token consumati e tempo di esecuzione. Dato da contestualizzare: il miglioramento è specifico per dominio. Se usi Hermes per analizzare report finanziari, le skill accumulate non ti aiuteranno a scrivere codice Python. L’apprendimento è verticale, non trasversale.

Installare Hermes Desktop con Ollama: tre comandi e via

L’installazione è, onestamente, la parte più semplice. Serve Ollama versione 0.21 o superiore. Se non lo hai ancora installato, scaricalo da ollama.com.

Il comando di avvio:

ollama launch hermes-desktop

Ollama gestisce tutto automaticamente: download del runtime, configurazione iniziale, avvio dell’interfaccia desktop. Al primo lancio, scegli il modello e inizi a lavorare.

Nota tecnica critica: il context length predefinito di Ollama è troppo basso per un uso agente. Per funzionare correttamente con le skill, la memoria e le conversazioni lunghe, Hermes ha bisogno di almeno 16.000-32.000 token di contesto. Puoi impostarlo con la variabile d’ambiente OLLAMA_CONTEXT_LENGTH o tramite un Modelfile personalizzato.

Quali modelli usare con Hermes Agent: locale, Apple Silicon e cloud

La scelta del modello è dove si gioca la partita vera. Non tutti i modelli sono equivalenti per un uso agente, e la differenza tra “funziona” e “funziona bene” è enorme.

Modelli consigliati per Hermes Agent su Ollama

ModelloTipoRequisitiCosto
qwen3.6:27bLocale (GPU)16+ GB VRAMGratuito
gemma4:12bLocale (GPU)12+ GB VRAMGratuito
qwen3.6:27b-mlxApple Silicon32+ GB RAM unificataGratuito
gemma4:26b-mlxApple Silicon32+ GB RAM unificataGratuito
minimax-m3:cloudCloud (Ollama)Solo connessione internetPay-per-use
kimi-k2.6:cloudCloud (Ollama)Solo connessione internetPay-per-use

I modelli con suffisso :cloud girano sui server Ollama, non sul tuo hardware. Kimi K2.6 ha 1 trilione di parametri: non eseguibile in locale.

Precisazione necessaria: i modelli con suffisso :cloud come kimi-k2.6:cloud non girano sul tuo computer. Sono modelli enormi eseguiti sui server di Ollama. L’interfaccia è identica, ma privacy e autonomia offline non ci sono.

Quanto costa davvero usare Hermes Agent nel 2026

L’app e l’agente sono gratuiti, licenza MIT. Il costo reale sta nell’inferenza LLM, e qui ci sono tre percorsi concreti:

  • Modelli locali con Ollama: costo zero in abbonamenti. Serve hardware con GPU adeguata o un Mac con Apple Silicon e almeno 32 GB di RAM unificata. L’investimento è nell’hardware, non nel software.
  • API cloud proprie: usi le tue chiavi Anthropic, OpenAI o di qualsiasi altro provider. Paghi il consumo effettivo di token. Hermes supporta oltre 20 provider.
  • Nous Portal: il piano Plus costa 20 dollari al mese e include accesso a oltre 400 modelli. Esiste un tier gratuito con 0,10 dollari di credito mensile, sufficiente solo per una valutazione rapida.

Per un uso reale e continuativo, la scelta si riduce a: hai l’hardware per il locale? Allora costo zero. Non ce l’hai? API cloud o Nous Portal, con costi paragonabili a qualsiasi altro servizio LLM.

Hermes Agent vs altri agenti AI: cosa cambia davvero

È inevitabile il confronto con gli altri strumenti che usiamo quotidianamente. Ma conviene essere precisi su cosa si confronta, perché Hermes Agent non compete direttamente con i coding agent.

Hermes Agent vs Coding Agent

Hermes AgentClaude Code / Codex
ObiettivoAssistente autonomo generalistaSviluppo software
ModelliQualsiasi (locale, cloud, 20+ provider)Proprietari ottimizzati
MemoriaSkill auto-generate + memoria persistenteContesto sessione + CLAUDE.md
CanaliTelegram, Discord, Slack, WhatsApp, Signal, emailTerminale, IDE, web
CostoGratis (MIT) + costo modelloAbbonamento o API

Strumenti con obiettivi diversi: Hermes punta sull’autonomia e la versatilità, i coding agent sulla qualità del codice prodotto.

In pratica: se il tuo obiettivo è sviluppo software, Claude Code resta lo strumento più potente che conosciamo. Se cerchi un assistente personale autonomo che gestisca comunicazioni su più piattaforme, automazioni ricorrenti e accumulazione di conoscenza nel tempo, Hermes Agent è la proposta più interessante nel panorama open source.

Casi d’uso concreti: dove Hermes Agent ha senso

Dove si traduce in valore reale? Gli scenari più convincenti:

  • Assistente personale autonomo: gestione agenda, ricerche web, sintesi documenti, con memoria che si accumula tra sessioni.
  • Bot multi-piattaforma unificato: un’unica sessione connessa a Telegram, Discord, Slack, WhatsApp, Signal e email contemporaneamente.
  • Automazioni pianificate in linguaggio naturale: “ogni lunedì mattina, analizza i report della settimana e mandami un riepilogo su Telegram”.
  • Sviluppo codice con sub-agenti: orchestrazione di agenti specializzati per task complessi.

Un’osservazione da chi lavora con agenti AI in produzione: la qualità dell’output è direttamente proporzionale al modello sottostante. Un modello locale da 12 miliardi di parametri non produrrà risultati paragonabili a Claude Opus o GPT-5. Il risparmio economico c’è, ma ha un costo in qualità.

I limiti che nessuno menziona

  • Il self-improvement è verticale: le skill accumulate sono specifiche per dominio. L’agente non diventa “generalmente più intelligente”.
  • L’hardware locale non è opzionale: servono almeno 16 GB di VRAM o 32 GB di RAM unificata su Apple Silicon. Sotto queste soglie, la latenza rende l’uso frustrante.
  • La public preview è una preview: uscito il 2 giugno 2026, bug e cambiamenti di API sono da mettere in conto.
  • Contesto lungo = consumo elevato: 32k token di contesto su un modello locale da 27B parametri richiede risorse significative.

Un agente che impara: promessa o realtà?

Hermes Agent rappresenta un’idea che il settore insegue da tempo: software che accumula esperienza. Il meccanismo di skill auto-generate è la prima implementazione open source credibile di questo concetto, con numeri verificabili e codice ispezionabile.

La domanda aperta non è se funziona, perché i dati mostrano che funziona. È se il miglioramento del 40% su task ricorrenti giustifica la complessità di gestire un agente autonomo in locale, rispetto a un servizio cloud ottimizzato per il tuo caso d’uso specifico.

Per chi ha l’hardware e la curiosità, Hermes Desktop con Ollama è il punto di ingresso più accessibile mai esistito per gli agenti AI locali. Per chi ha bisogno di risultati in produzione oggi, la risposta è più sfumata.

Hermes Desktop è davvero gratuito?

Sì, Hermes Desktop e Hermes Agent sono rilasciati con licenza MIT, quindi completamente gratuiti e open source. Il costo reale sta nell'inferenza LLM: puoi usare Ollama con modelli locali (gratuito, ma serve hardware adeguato), le tue chiavi API cloud, oppure il Nous Portal con piano Plus a 20 dollari al mese.

Come si installa Hermes Desktop con Ollama?

Serve Ollama versione 0.21 o superiore. Una volta installato, basta eseguire il comando ollama launch hermes-desktop nel terminale. Ollama scarica automaticamente il runtime e i componenti necessari. Al primo avvio puoi scegliere un modello locale come qwen3.6:27b o gemma4:12b.

Quali modelli funzionano meglio con Hermes Agent in locale?

Per GPU dedicate con almeno 16 GB di VRAM, i modelli consigliati sono qwen3.6:27b e gemma4:12b. Su Apple Silicon, le varianti MLX come qwen3.6:27b-mlx e gemma4:26b-mlx sfruttano la memoria unificata. Per chi non ha hardware adeguato, Ollama offre modelli cloud come kimi-k2.6:cloud che girano sui server di Ollama.

Hermes Agent funziona offline senza internet?

Sì, se usi un modello locale tramite Ollama o vLLM, Hermes Agent funziona completamente offline. Le skill integrate, la memoria persistente e l'elaborazione avvengono tutte in locale. Servirà internet solo per le integrazioni esterne come Telegram, Discord o la ricerca web.

Qual è la differenza tra Hermes Agent e Claude Code?

Claude Code e Hermes Agent hanno filosofie diverse. Claude Code è un coding agent cloud-first, ottimizzato per lo sviluppo software con modelli Anthropic. Hermes Agent è un assistente autonomo generalista che impara dall'uso, crea skill riutilizzabili e funziona con qualsiasi modello, inclusi quelli locali. Hermes è più versatile come assistente personale, Claude Code è più potente per il coding.

Cosa sono le skill auto-generate di Hermes Agent?

Dopo ogni task completato, Hermes Agent valuta la propria performance, estrae i pattern riutilizzabili e li salva come file Markdown nella propria libreria di skill. Nelle esecuzioni successive, consulta queste skill per completare task simili più velocemente. Nous Research riporta che agenti con oltre 20 skill auto-create completano task ricorrenti il 40% più velocemente.

Posso usare Hermes Agent con Telegram, WhatsApp e Discord contemporaneamente?

Sì, Hermes Agent supporta sessioni condivise su Telegram, Discord, Slack, WhatsApp, Signal e email. Tutti i canali accedono alla stessa memoria e alla stessa sessione, quindi puoi iniziare una conversazione su Telegram e continuarla su Discord senza perdere contesto.