Mergulho Profundo em IA

Guia do Hermes Agente: O Agente de AI de Código Aberto que Cresce com Você

Hermes Agent é a tentativa da Nous Research's de construir um agente pessoal durável em vez de apenas mais uma janela de chat descartável. Ele combina uma UI de terminal, gateway de mensagens, memória persistente, skills de padrão aberto, cron, MCP e múltiplos backends de execução em uma única stack. Analisamos o repo, o site de docs, as notas de arquitetura e o issue tracker para ver o que é real, o que é diferenciado e onde ainda existem arestas a aparar.

O site oficial do Hermes descreve o produto de uma forma deliberadamente direta: ele não é um copilot de código vinculado a uma IDE e não é um wrapper de chatbot simples em torno de um único provedor. A proposta é um agente persistente que você instala em uma máquina, conecta à sua stack de modelos preferida e interage via CLI ou apps de mensagens, enquanto ele continua trabalhando no mesmo ambiente ao longo do tempo. Essa é uma definição de produto mais ambiciosa do que a maioria dos projetos de agentes de código aberto tenta alcançar.

🎬 Assista à Visão Geral em Vídeo

Prefere ler? O artigo completo abaixo detalha a arquitetura, as skills, o modelo de memória e os tradeoffs do Hermes Agent.

Get the latest on AI, LLMs & developer tools

New MCP servers, model updates, and guides like this one — delivered weekly.

1. Por que isso é importante

O Hermes é importante porque ataca uma das maiores frustrações nas ferramentas de agentes: a ausência de estado (statelessness). A maioria das ferramentas de codificação com IA é boa para uma única sessão, um editor, um prompt, um provedor e uma máquina. O Hermes foi construído sob uma premissa diferente: o agente útil é aquele que permanece, acumula conhecimento de trabalho e pode ser acessado de mais de uma interface.

É por isso que a abordagem de lançamento ressoou. O anúncio público da Nous Research no X apresentou o Hermes como “o agente de código aberto que cresce com você,” e a documentação oficial repete a mesma tese: memória persistente, habilidades reutilizáveis, tarefas agendadas, execução remota e continuidade de mensagens são a proposta de valor central, em vez de recursos extras adicionados posteriormente.

Por que este repositório se destacou

O Hermes não se espalhou porque prometeu um prompt melhor. Ele se espalhou porque reuniu um modelo de agente durável: memória, habilidades, gateways, cron, MCP e backends de execução mais seguros em uma única stack de código aberto. Essa é uma afirmação muito maior do que “assistente de codificação de IA,” e é por isso que os desenvolvedores começaram a compará-lo a uma camada completa de infraestrutura de agentes, em vez de apenas uma ferramenta.

2. O que o Hermes realmente é

De acordo com o GitHub repo e o site oficial, o Hermes é um framework de agentes com licença MIT, construído pela Nous Research, que pode ser executado localmente, em uma VPS ou dentro de ambientes de execução em containers e baseados em nuvem.

A documentação de início rápido destaca outro ponto importante: o Hermes é agnóstico em relação ao modelo. A lista de provedores suportados na documentação abrange Nous Portal, OpenAI Codex, Anthropic, OpenRouter, DeepSeek, GitHub Copilot, Gemini via OAuth, endpoints personalizados compatíveis com OpenAI e muito mais. A troca de provedores é tratada como configuração, não como um fork do produto.

Há também uma forte inclinação arquitetônica para modelos de contexto amplo. O guia de início rápido alerta que o Hermes requer uma janela de contexto de pelo menos 64K, pois foi projetado para fluxos de trabalho de tool-calling em várias etapas, contexto persistente e horizontes de tarefas mais longos do que um simples agente de estilo autocomplete.

CamadaO que isso significa na prática
CLI / TUIUm modo de terminal clássico mais uma TUI mais recente para sessões interativas longas.
GatewayUm único processo pode conectar o Hermes ao Telegram, Discord, Slack, WhatsApp, Signal, Email e outras plataformas.
ExecuçãoOs comandos podem ser executados localmente ou através de backends estilo Docker, SSH, Modal, Daytona e Singularity.
ExtensõesSuporte a MCP, plugins, skills integradas, skills opcionais e integração de editor via ACP.

Esta é a principal mudança de modelo mental: o Hermes não é apenas uma UI de chat em torno de ferramentas. Ele é um runtime com estado para agentes que por acaso expõe o chat como interface.

3. Como Funciona

A documentação oficial de arquitetura é excepcionalmente transparente aqui. O Hermes roteia múltiplos pontos de entrada para um AIAgent core: CLI, gateway, ACP, batch runner e servidor de API, todos alimentam o mesmo loop de orquestração. Esse loop coordena a construção de prompts, resolução de provedores, despacho de ferramentas, compressão e persistência.

A página de arquitetura também mostra por que o Hermes parece mais abrangente que muitos concorrentes. A montagem do prompt não é apenas uma string de prompt de sistema. Ela combina camadas de arquivos de personalidade, arquivos de memória, skills e arquivos de contexto de projeto como AGENTS.md, instruções específicas do modelo e orientações de uso de ferramentas. Os dados da sessão são armazenados em SQLite com FTS5, enquanto as sessões de gateway e o estado do agente são rastreados em diferentes superfícies.

Uma visão sob o capô

O Hermes documenta uma stack construída em torno de:

  • AIAgent como o loop central de conversa
  • prompt_builder.py para a montagem do prompt de sistema
  • runtime_provider.py para seleção de modelo/provedor
  • registry.py além de arquivos de ferramentas para despacho e disponibilidade
  • SQLite + FTS5 para armazenamento de sessão e busca
  • Adaptadores de Gateway para superfícies de mensagens e entrega

O modelo de segurança é igualmente explícito.

4. O Sistema de Skills é o Real Diferencial

Se o Hermes tem um recurso que faz todo o resto do produto fazer sentido, é o sistema de skills.

As skills residem em ~/.hermes/skills/, podem ser empacotadas, instaladas via hub ou criadas por agentes, e cada skill instalada torna-se disponível como um comando de barra. /github-pr-workflow, /plan, e comandos diretos de busca/instalação através da CLI.

# Browse and install skills
hermes skills search kubernetes
hermes skills search react --source skills-sh
hermes skills install openai/skills/k8s

# Or use the slash command inside Hermes
/skills

O modelo de divulgação progressiva é o que torna isso elegante em vez de inchado. SKILL.md quando ele realmente precisa da skill, e só carrega arquivos de referência mais profundos se a tarefa exigir. Este é o mesmo padrão de design que faz com que as melhores toolchains de agentes pareçam rápidas em vez de sufocadas por prompts.

O Hermes também leva as skills além da invocação única. A documentação de cron mostra jobs que podem anexar uma ou mais skills antes da execução do prompt, o que significa que tarefas agendadas podem herdar workflows estruturados em vez de depender de um bloco gigante de instruções inline.

# Conceptually, Hermes cron jobs can attach skills
hermes cron edit <job_id> --skill blogwatcher --skill find-nearby

# Or you can ask naturally:
"Every morning at 9am, check Hacker News for AI news and send me a summary on Telegram."

O sistema de memória do Hermes' é mais disciplinado do que a palavra de marketing “memória” costuma sugerir. A documentação descreve dois arquivos delimitados, MEMORY.md e USER.md, com limites explícitos de caracteres. Eles são injetados no prompt como um snapshot congelado no início da sessão, para que o Hermes possa reter fatos duradouros sem mutar constantemente seu próprio prefixo.

Esse design é importante porque trata a memória como estado curado, não como um depósito sem limites. O Hermes lembra fatos do projeto, preferências do usuário e procedimentos aprendidos úteis, mas ainda depende de armazenamento de sessão e busca de sessão separados para uma recuperação histórica mais profunda. A documentação de arquitetura detalha que a persistência da sessão reside no SQLite com FTS5 e rastreamento de linhagem.

Nuance importante

A memória do Hermes não é um raciocínio mágico de longo prazo. É um sistema delimitado para fatos e preferências duradouros, além de um histórico de sessão pesquisável. Essa é uma boa escolha de design, mas também significa que você não deve confundir “lembrar entre sessões” com “nunca mais perder o contexto.”

6. Como Começar

O quickstart oficial é direto. Instale o Hermes, escolha um provedor, inicie a TUI ou CLI e, em seguida, decida se deseja execução local ou um backend remoto/container mais seguro. Para a maioria das pessoas, a primeira etapa deve ser intencionalmente simples: coloque uma única sessão para funcionar e, depois, adicione camadas de gateway, skills, MCP e cron.

# Install Hermes Agent
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

# Configure provider and tools
hermes setup

# Start Hermes
hermes --tui

Se você quiser usar o Hermes para trabalho real em vez de experimentação, o próximo passo deve ser uma execução de terminal mais segura:

# Safer execution backends from the docs
hermes config set terminal.backend docker
hermes config set terminal.backend ssh

# Optional: connect messaging platforms
hermes gateway setup

O quickstart também inclui um exemplo mínimo de MCP, que é exatamente o tipo de coisa que torna o Hermes mais útil do que uma ilha de ferramentas fechada:

mcp_servers:
  github:
    command: npx
    args: ["-y", "@modelcontextprotocol/server-github"]
    env:
      GITHUB_PERSONAL_ACCESS_TOKEN: "ghp_xxx"

Vale a pena declarar claramente duas ressalvas de configuração. Primeiro, a documentação oficial ainda direciona usuários de Windows para o WSL2. Segundo, o rastreador de problemas mostra que bugs de instalação e gerenciamento de ambiente ainda surgem em ritmo acelerado, portanto, trate o instalador como uma infraestrutura em rápida evolução, não como um pacote empresarial maduro.

7. Exemplos do Mundo Real

Exemplo 1: Não execute tarefas arriscadas no backend local por padrão

Errado: instalar o Hermes localmente, deixar o backend do terminal em local, e permitir que ele execute comandos shell abrangentes em sua estação de trabalho real.

Certo: mude para Docker ou SSH primeiro, mantenha a aprovação de comandos perigosos ativada e trate o backend local como uma opção de conveniência, em vez de uma opção de produção.

Exemplo 2: Não codifique cada workflow em um único prompt gigante

Errado: continuar adicionando instruções permanentes até que cada tarefa comece com uma parede de contexto.

Certo: install or create skills for recurring workflows, then let Hermes load them on demand or attach them to cron jobs. This is exactly what the skills system was designed to solve.

Exemplo 3: Não confunda memória com completude de conhecimento

Errado: assumir que a memória do Hermes significa que o agente agora entende permanentemente cada detalhe do seu sistema.

Certo: use a memória para fatos estáveis e preferências, a busca de sessão para o histórico, e MCP ou ferramentas externas para uma recuperação mais profunda da fonte da verdade.

Use o Hermes se você quiser...Não espere que o Hermes seja...
Um agente de longa duração que pode transitar entre o terminal e mensagensUm produto de consumo no-ops, zero-admin
Skills reutilizáveis, MCP e cron em uma única stackUm copilot de IDE de propósito único com configurações padrão refinadas em todos os lugares
Execução remota ou em containers com controles de segurança explícitosAutonomia livre de riscos apenas porque a documentação menciona camadas de segurança

8. Reações da Comunidade

A reação geral ao Hermes é interessante porque não se trata apenas de hype. É uma mistura de empolgação genuína por parte dos operadores, curiosidade óbvia em torno de stacks de agentes self-hosted e um ceticismo saudável sobre a capacidade do produto de cumprir suas promessas em cargas de trabalho reais.

Pelo lado positivo, a mensagem de lançamento público da Nous Research apostou forte na narrativa de “cresce com você”, e essa mesma descrição ecoou em toda a documentação e em posts de terceiros. Um post no LinkedIn da Tenten repetiu quase literalmente a mesma abordagem de acesso à memória e à máquina, o que demonstra como a história do produto se espalhou de forma clara para além do público nativo do GitHub.

O Reddit capturou a reação dividida de forma mais honesta. Na primeira thread do LocalLLaMA sobre o lançamento, um comentarista respondeu à ideia de fornecer contas de mensagens ao Hermes com um seco:

“Instale em uma máquina, dê a ele suas contas de mensagens”... Sei, tá bom.

Esse ceticismo não é irracional. O Hermes exige confiança em automação, credenciais, processos de longa duração e execução de ferramentas. No entanto, o comentário seguinte na mesma thread foi prático, em vez de desdenhoso:

“Planejo usar isso no Render + Supabase.”

Esse é provavelmente o resumo mais preciso do momento atual do Hermes: algumas pessoas ouvem a proposta e se preocupam imediatamente com a segurança; outras ouvem a mesma proposta e já começam a planejar os alvos de deployment.

O issue tracker reforça que este é um projeto de infraestrutura agressivo e de rápida evolução. Issues recentes incluem um agente destruindo seu próprio virtualenv de runtime,travamentos no fluxo de instalação, incompatibilidades de gateway-install entre container/systemd. Nada disso invalida o Hermes. Significa apenas que o repositório sofre uma pressão real de adoção e apresenta riscos reais de execução (footguns) para o operador ao mesmo tempo.

Veredito da comunidade

O Hermes está sendo tratado como uma infraestrutura séria, não como uma demo de brinquedo. Isso é bom para a credibilidade, mas também significa que o nível de exigência é maior: as pessoas perdoam comportamentos estranhos em uma ferramenta de hobby, mas não em algo que guarda suas credenciais de gateway e acesso ao shell.

9. O Veredito: Vale a pena usar o Hermes Agent?

Nossa Opinião

Sim, se você quer um runtime de agente real em vez de apenas mais um chat shell.O Hermes é uma das tentativas open-source mais coerentes de combinar skills, memória, mensageria, cron, MCP e execução segura em uma única stack voltada para o operador. A ideia é sólida, a documentação é excepcionalmente concreta e a arquitetura é muito mais séria do que a média dos repositórios de agentes.

Use-o se:

  • Você quer um agente que possa rodar em uma VPS, container ou máquina remota, em vez de ficar restrito apenas ao seu editor.
  • Você se importa com workflows duráveis construídos a partir de skills, MCP, cron e histórico de sessões pesquisável.
  • Você se sente confortável pensando como um operador: backends, credenciais, limites de segurança e modos de falha.

Pule se:

  • Você quer principalmente um copilot de código polido, com setup mínimo e menos partes móveis.
  • Você não quer ter que pensar em gateways, containers, configurações ou seleção de backend.
  • Você precisa de empacotamento maduro e estabilidade de produção com baixo atrito, mais do que precisa de abrangência e flexibilidade.

10. O Panorama Geral

O Hermes é importante além do seu próprio repositório porque aponta para um modelo diferente de software de agente. O agente vencedor pode não ser aquele com a UX de chat mais chamativa. Pode ser aquele que se comporta mais como infraestrutura: estado explícito, procedimentos reutilizáveis, histórico pesquisável, múltiplos ambientes de execução e interfaces que sobrevivem a trocas de contexto.

É também por isso que o Hermes se encaixa naturalmente na mesma conversa sobre open skills, servidores MCP e orquestração multi-agente. Ele trata tudo isso como blocos de construção combináveis, em vez de funcionalidades isoladas. Se você tem acompanhado nossa cobertura de skills portáteis,ferramentas MCP customizadas, e orquestração multi-agente, o Hermes parece menos um ponto fora da curva e mais um ponto de convergência denso.

Se o Hermes em si se tornará o runtime de agentes open-source dominante ainda é uma questão em aberto. Mas a direção do produto já está clara: o agente que as pessoas realmente mantêm é aquele que consegue lembrar o suficiente, delegar o suficiente, executar com segurança suficiente e permanecer acessível em todas as superfícies onde o trabalho real acontece.

11. Perguntas Frequentes

P: O que torna o Hermes Agent diferente de um copilot de codificação comum?

O Hermes foi projetado como um agente de longa execução, não apenas um assistente de IDE. A documentação oficial o posiciona como um sistema que pode residir no seu servidor, funcionar através de aplicativos de mensagens, manter memória delimitada, carregar habilidades sob demanda e agendar tarefas recorrentes.

P: O Hermes pode rodar em um VPS ou máquina remota?

Sim. A documentação oficial descreve explicitamente o Hermes como algo que você pode rodar em um VPS, cluster de GPU ou servidor remoto, e o sistema de backend de terminal suporta SSH, Docker, Modal, Daytona e Singularity, além da execução local.

P: Como as habilidades funcionam no Hermes?

As habilidades são armazenadas em `~/.hermes/skills/` e carregadas progressivamente. O Hermes primeiro visualiza metadados leves, depois abre o `SKILL.md` completo apenas quando a tarefa corresponde, e pode carregar arquivos de referência mais profundos somente se necessário.

P: A memória do Hermes é a mesma coisa que o histórico do chat?

Não. A documentação de memória descreve um armazenamento delimitado em `MEMORY.md` e `USER.md` para fatos duradouros e preferências, enquanto o histórico da sessão é armazenado separadamente em SQLite com busca FTS5 e rastreamento de linhagem.

P: O Hermes suporta servidores MCP?

Sim. A documentação de início rápido mostra a configuração do servidor MCP diretamente no `config.yaml`, e os documentos posicionam o MCP como uma forma de primeira classe para estender o Hermes com ferramentas externas.

P: Como posso tornar o uso do Hermes mais seguro?

Comece evitando o backend de terminal local para tarefas arriscadas. A documentação recomenda Docker ou SSH para isolamento, e a página de segurança descreve aprovação de comandos, isolamento de containers, filtragem de credenciais e varredura de prompt-injection como parte do modelo de defesa em profundidade do Hermes.

12. Todas as Fontes & Links

Fontes Primárias

Documentação

Comunidade

Threads de Issues Referenciadas

Fontes da Web

Links Internos

Related Guides

Sponsored AI assistant. Recommendations may be paid.