Inmersión profunda en IA

Guía de Hermes Agente: El agente de AI de código abierto que crece contigo

Hermes Agent es el intento de Nous Research por construir un agente personal duradero en lugar de otra ventana de chat desechable. Combina una interfaz de terminal, una pasarela de mensajería, memoria persistente, habilidades de estándar abierto, cron, MCP y múltiples backends de ejecución en un solo stack. Revisamos el repo, el sitio de documentación, las notas de arquitectura y el rastreador de problemas para ver qué es real, qué es diferenciado y dónde están todavía los puntos débiles.

El sitio oficial de Hermes describe el producto de una manera deliberadamente directa: es no un copilot de programación vinculado a un IDE y no un simple wrapper de chatbot para un solo proveedor. La propuesta es un agente persistente que instalas en una máquina, conectas a tu stack de modelos preferido y con el que hablas desde la CLI o aplicaciones de mensajería mientras sigue trabajando en el mismo entorno a lo largo del tiempo. Es una definición de producto más ambiciosa que la que intentan la mayoría de los proyectos de agentes de código abierto.

🎬 Ver el video de introducción

¿Prefieres leer? El artículo completo a continuación desglosa la arquitectura, las habilidades, el modelo de memoria y los tradeoffs de Hermes Agent.

Get the latest on AI, LLMs & developer tools

New MCP servers, model updates, and guides like this one — delivered weekly.

1. Por qué es importante

Hermes es importante porque aborda una de las mayores frustraciones en las herramientas de agentes: la falta de estado (statelessness). La mayoría de las herramientas de codificación con IA son buenas para una sesión, un editor, un prompt, un proveedor y una máquina. Hermes se basa en una premisa diferente: el agente útil es aquel que permanece, acumula conocimiento práctico y puede ser contactado desde más de una superficie.

Por eso el enfoque del lanzamiento resonó. El anuncio público de Nous Research en X presentó a Hermes como “el agente de código abierto que crece contigo”, y la documentación oficial repite la misma tesis: la memoria persistente, las habilidades reutilizables, las tareas programadas, la ejecución remota y la continuidad en la mensajería son la propuesta de valor central, en lugar de funciones adicionales añadidas a posteriori.

Por qué este repositorio destacó

Hermes no se difundió por prometer un mejor prompt. Se difundió porque agrupó un modelo de agente duradero: memoria, habilidades, gateways, cron, MCP y backends de ejecución más seguros en un único stack de código abierto. Esa es una propuesta mucho más ambiciosa que un “asistente de codificación por IA”, y es por eso que los desarrolladores comenzaron a compararlo con una capa completa de infraestructura de agentes en lugar de una sola herramienta.

2. Qué es Hermes en realidad

Según el repositorio de GitHub y el sitio web oficial, Hermes es un framework de agentes con licencia MIT creado por Nous Research que puede ejecutarse localmente, en un VPS o dentro de entornos de ejecución en contenedores y respaldados por la nube.

La documentación de inicio rápido destaca otro punto importante: Hermes es agnóstico respecto al modelo. La lista de proveedores compatibles en la documentación abarca Nous Portal, OpenAI Codex, Anthropic, OpenRouter, DeepSeek, GitHub Copilot, Gemini a través de OAuth, endpoints personalizados compatibles con OpenAI y más. Cambiar de proveedor se trata como una configuración, no como un fork del producto.

También existe un marcado sesgo arquitectónico hacia modelos de contexto amplio. La guía de inicio rápido advierte que Hermes requiere una ventana de contexto de al menos 64K porque está diseñado para flujos de trabajo de tool-calling de varios pasos, contexto persistente y horizontes de tareas más largos que un simple agente de estilo autocompletado.

CapaQué significa en la práctica
CLI / TUIUn modo de terminal clásico más una TUI más reciente para sesiones interactivas largas.
GatewayUn solo proceso puede conectar Hermes con Telegram, Discord, Slack, WhatsApp, Signal, Email y otras plataformas.
EjecuciónLos comandos pueden ejecutarse localmente o a través de backends tipo Docker, SSH, Modal, Daytona y Singularity.
ExtensionesSoporte para MCP, plugins, habilidades integradas, habilidades opcionales e integración con editores vía ACP.

Este es el principal cambio de modelo mental: Hermes no es solo una interfaz de chat para herramientas. Es un runtime con estado para agentes que simplemente expone el chat como interfaz.

3. Cómo funciona

La documentación oficial de la arquitectura es inusualmente transparente en este punto. Hermes dirige múltiples puntos de entrada hacia un AIAgent núcleo: CLI, gateway, ACP, batch runner y el servidor API se alimentan del mismo bucle de orquestación. Ese bucle coordina la construcción de prompts, la resolución de proveedores, el despacho de herramientas, la compresión y la persistencia.

La página de arquitectura también muestra por qué Hermes se siente más completo que muchos competidores. El ensamblaje de prompts no es solo una cadena de system prompt. Combina archivos de personalidad, archivos de memoria, habilidades y archivos de contexto del proyecto como AGENTS.md, instrucciones específicas del modelo y guías de uso de herramientas. Los datos de la sesión se almacenan en SQLite con FTS5, mientras que las sesiones del gateway y el estado del agente se rastrean en todas las superficies.

Funcionamiento interno

Hermes documenta un stack construido en torno a:

  • AIAgent como el bucle central de conversación
  • prompt_builder.py para el ensamblaje del prompt del sistema
  • runtime_provider.py para la selección de modelo/proveedor
  • registry.py además de archivos de herramientas para el despacho y la disponibilidad
  • SQLite + FTS5 para el almacenamiento de sesiones y búsqueda
  • Adaptadores de Gateway para superficies de mensajería y entrega

El modelo de seguridad es igualmente explícito. La documentación describe un enfoque de defensa en profundidad de siete capas que incluye la aprobación de comandos peligrosos, aislamiento de contenedores, filtrado de credenciales para subprocesos MCP, escaneo de archivos de contexto para inyección de prompts y parámetros de directorio de trabajo validados. Esto no hace que Hermes sea infalible, pero significa que el proyecto ha considerado seriamente el riesgo para el operador.

4. El sistema de habilidades es el verdadero diferenciador

Si Hermes tiene una característica que hace que el resto del producto tenga sentido, es el sistema de habilidades. La documentación oficial define las habilidades como documentos de conocimiento bajo demanda cargados a través de un patrón de divulgación progresiva para minimizar el uso de tokens. Es una forma elegante de decir que Hermes se esfuerza por no saturar el prompt con todo el conocimiento procedimental a la vez.

Las habilidades residen en ~/.hermes/skills/, pueden empaquetarse, instalarse desde el hub o crearse mediante agentes, y cada habilidad instalada queda disponible como un comando slash. La documentación muestra ejemplos como /github-pr-workflow, /plan, y comandos directos de búsqueda/instalación a través de la CLI.

# Browse and install skills
hermes skills search kubernetes
hermes skills search react --source skills-sh
hermes skills install openai/skills/k8s

# Or use the slash command inside Hermes
/skills

El modelo de divulgación progresiva es lo que hace que esto sea elegante en lugar de sobrecargado. Hermes solo carga primero metadatos ligeros de la habilidad, y luego abre la versión completa SKILL.md cuando realmente necesita la habilidad, y solo carga archivos de referencia más profundos si la tarea lo requiere. Este es el mismo patrón de diseño que hace que las mejores cadenas de herramientas de agentes se sientan rápidas en lugar de asfixiadas por el prompt.

Hermes también lleva las habilidades más allá de la invocación única. La documentación de cron muestra trabajos que pueden adjuntar una o más habilidades antes de que se ejecute el prompt, lo que significa que las tareas programadas pueden heredar flujos de trabajo estructurados en lugar de depender de un bloque gigante de instrucciones inline.

# Conceptually, Hermes cron jobs can attach skills
hermes cron edit <job_id> --skill blogwatcher --skill find-nearby

# Or you can ask naturally:
"Every morning at 9am, check Hacker News for AI news and send me a summary on Telegram."

El sistema de memoria de Hermes es más disciplinado de lo que el término de marketing “memoria” suele implicar. La documentación describe dos archivos acotados, MEMORY.md y USER.md, con límites de caracteres explícitos. Se inyectan en el prompt como una instantánea congelada al inicio de la sesión para que Hermes pueda retener hechos duraderos sin mutar constantemente su propio prefijo.

Ese diseño es importante porque trata la memoria como un estado curado, no como un vertedero sin límites. Hermes recuerda datos del proyecto, preferencias del usuario y procedimientos aprendidos útiles, pero sigue dependiendo de un almacenamiento de sesión y una búsqueda de sesión independientes para un recuerdo histórico más profundo. La documentación de arquitectura detalla que la persistencia de la sesión reside en SQLite con FTS5 y seguimiento de linaje.

Matiz importante

La memoria de Hermes no es un razonamiento mágico a largo plazo. Es un sistema acotado para hechos y preferencias duraderos, además de un historial de sesiones con capacidad de búsqueda. Es una buena elección de diseño, pero también significa que no se debe confundir “recordar entre sesiones” con “no volver a perder el contexto nunca más”.

6. Cómo empezar

La guía de inicio rápido oficial es sencilla. Instala Hermes, elige un proveedor, inicia la TUI o CLI, y luego decide si quieres ejecución local o un backend remoto/contenedor más seguro. Para la mayoría, el primer paso debería ser intencionadamente aburrido: haz que funcione una sola sesión y luego añade capas de gateway, habilidades, MCP y cron después.

# Install Hermes Agent
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

# Configure provider and tools
hermes setup

# Start Hermes
hermes --tui

Si quieres usar Hermes para trabajo real en lugar de experimentación, el siguiente paso debería ser una ejecución de terminal más segura:

# Safer execution backends from the docs
hermes config set terminal.backend docker
hermes config set terminal.backend ssh

# Optional: connect messaging platforms
hermes gateway setup

El inicio rápido también incluye un ejemplo mínimo de MCP, que es exactamente el tipo de cosas que hacen que Hermes sea más útil que una isla de herramientas cerrada:

mcp_servers:
  github:
    command: npx
    args: ["-y", "@modelcontextprotocol/server-github"]
    env:
      GITHUB_PERSONAL_ACCESS_TOKEN: "ghp_xxx"

Vale la pena mencionar claramente dos advertencias de configuración. Primero, la documentación oficial todavía dirige a los usuarios de Windows a WSL2. Segundo, el rastreador de problemas muestra que los errores de instalación y gestión de entornos siguen apareciendo con frecuencia, así que trata al instalador como infraestructura en rápida evolución, no como un empaquetado empresarial maduro.

7. Ejemplos del mundo real

Ejemplo 1: No ejecutes tareas de riesgo en el backend local por defecto

Incorrecto: instalar Hermes localmente, dejar el backend de la terminal activado local, y permitir que empiece a ejecutar comandos de shell amplios contra tu estación de trabajo real.

Correcto: cambia a Docker o SSH primero, mantén activada la aprobación de comandos peligrosos y trata al backend local como una opción de conveniencia en lugar de una opción de producción.

Ejemplo 2: No codifiques cada flujo de trabajo en un solo prompt gigante

Incorrecto: seguir añadiendo instrucciones permanentes hasta que cada tarea comience con un muro de contexto.

Correcto: install or create skills for recurring workflows, then let Hermes load them on demand or attach them to cron jobs. This is exactly what the skills system was designed to solve.

Ejemplo 3: No confundas la memoria con la completitud del conocimiento

Incorrecto: asumir que la memoria de Hermes significa que el agente ahora comprende permanentemente cada detalle de tu sistema.

Correcto: usa la memoria para hechos estables y preferencias, la búsqueda de sesión para el historial, y MCP o herramientas externas para una recuperación más profunda de la fuente de verdad.

Usa Hermes si quieres...No esperes que Hermes sea...
Un agente de larga ejecución que puede moverse entre la terminal y la mensajeríaUn producto de consumo no-ops y sin administración
Habilidades reutilizables, MCP y cron en un solo stackUn copilot para IDE de propósito único con valores predeterminados pulidos en todas partes
Ejecución remota o en contenedores con controles de seguridad explícitosAutonomía sin riesgos solo porque la documentación mencione capas de seguridad

8. Reacciones de la comunidad

La reacción general ante Hermes es interesante porque no es solo hype. Es una mezcla de entusiasmo genuino por parte de los operadores, una curiosidad evidente en torno a los stacks de agentes autoalojados y un escepticismo saludable sobre si el producto puede cumplir sus promesas bajo cargas de trabajo reales.

Por el lado positivo, el mensaje de lanzamiento público de Nous Research se apoyó fuertemente en la narrativa de “crece contigo”, y esa misma descripción ha resonado en la documentación y en publicaciones de terceros. Un post en LinkedIn de Tenten repitió casi textualmente el mismo enfoque de acceso a memoria y máquina, lo que demuestra lo bien que se ha difundido la historia del producto más allá de las audiencias nativas de GitHub.

Reddit capturó la reacción dividida de forma más honesta. En el primer hilo de LocalLLaMA sobre el lanzamiento, un comentarista respondió a la idea de darle a Hermes cuentas de mensajería con un tajante:

“Instálalo en una máquina, dale tus cuentas de mensajería”... Sí, claro.

Ese escepticismo no es irracional. Hermes pide confianza en la automatización, las credenciales, los procesos de larga duración y la ejecución de herramientas. Pero el siguiente comentario en el mismo hilo fue práctico en lugar de despectivo:

“Planeo usar esto en Render + Supabase.”

Ese es probablemente el resumen más preciso del momento actual de Hermes: algunas personas escuchan la propuesta e inmediatamente se preocupan por la seguridad; otras escuchan la misma propuesta y comienzan a planificar los objetivos de despliegue.

El issue tracker refuerza que este es un proyecto de infraestructura agresivo y de rápida evolución. Los problemas recientes incluyen un agente destruyendo su propio virtualenv de ejecución,bloqueos en el flujo de instalación, y desajustes en gateway-install de contenedor/systemd. Nada de eso invalida a Hermes. Simplemente significa que el repo tiene una presión de adopción real y, al mismo tiempo, riesgos operativos reales para el usuario.

Veredicto de la comunidad

Hermes se está tratando como una infraestructura seria, no como una demo de juguete. Eso es bueno para la credibilidad, pero también significa que el listón está más alto: la gente perdonará asperezas en una herramienta de hobby, pero no en aquello que custodia sus credenciales de gateway y acceso a la shell.

9. El veredicto: ¿Vale la pena usar Hermes Agent?

Nuestra opinión

Sí, si buscas un runtime de agentes real en lugar de otra shell de chat.Hermes es uno de los intentos de código abierto más coherentes para combinar skills, memoria, mensajería, cron, MCP y ejecución segura en un único stack orientado al operador. La idea es sólida, la documentación es inusualmente concreta y la arquitectura es mucho más seria que la del repositorio de agentes promedio.

Úsalo si:

  • Quieres un agente que pueda residir en un VPS, contenedor o máquina remota, en lugar de limitarse solo a tu editor.
  • Te interesan los flujos de trabajo duraderos construidos a partir de skills, MCP, cron e historial de sesiones con capacidad de búsqueda.
  • Te sientes cómodo pensando como un operador: backends, credenciales, límites de seguridad y modos de fallo.

Omítelo si:

  • Principalmente buscas un copilot de programación pulido, con una configuración mínima y menos piezas móviles.
  • No quieres pensar en gateways, contenedores, configuración o selección de backends.
  • Necesitas un empaquetado maduro y estabilidad en producción con poca fricción, más que amplitud y flexibilidad.

10. El panorama general

Hermes es importante más allá de su propio repositorio porque apunta hacia un modelo diferente de software de agentes. El agente ganador puede que no sea el que tenga la UX de chat más llamativa. Puede que sea el que se comporte más como infraestructura: estado explícito, procedimientos reutilizables, historial con capacidad de búsqueda, múltiples entornos de ejecución e interfaces que sobrevivan a los cambios de contexto.

Por eso Hermes encaja de forma natural en la misma conversación que las skills abiertas, los servidores MCP y la orquestación multi-agente. Trata todo esto como bloques de construcción combinables en lugar de características aisladas. Si has seguido nuestra cobertura sobre skills portátiles,herramientas MCP personalizadas, y orquestación multi-agente, Hermes parece menos un caso aislado y más un punto de convergencia denso.

Si el propio Hermes se convierte en el runtime de agentes de código abierto dominante sigue siendo una pregunta abierta. Pero la dirección del producto ya está clara: el agente que la gente realmente conserva es el que puede recordar lo suficiente, delegar lo suficiente, ejecutarse de forma segura y mantenerse accesible en las superficies donde ocurre el trabajo real.

11. Preguntas frecuentes

P: ¿Qué hace que Hermes Agent sea diferente de un copilot de programación convencional?

Hermes está diseñado como un agente de larga ejecución, no solo como un asistente de IDE. La documentación oficial lo posiciona como un sistema que puede residir en tu servidor, funcionar a través de aplicaciones de mensajería, mantener una memoria acotada, cargar habilidades bajo demanda y programar tareas recurrentes.

P: ¿Puede Hermes ejecutarse en un VPS o en una máquina remota?

Sí. La documentación oficial describe explícitamente a Hermes como algo que puedes ejecutar en un VPS, clúster de GPUs o servidor remoto, y el sistema de backend de terminal es compatible con SSH, Docker, Modal, Daytona y Singularity, además de la ejecución local.

P: ¿Cómo funcionan las habilidades en Hermes?

Las habilidades se almacenan en `~/.hermes/skills/` y se cargan progresivamente. Hermes primero lee metadatos ligeros, luego abre el archivo `SKILL.md` completo solo cuando la tarea coincide, y puede cargar archivos de referencia más profundos solo si es necesario.

P: ¿Es la memoria de Hermes lo mismo que el historial de chat?

No. La documentación de memoria describe un almacenamiento acotado en `MEMORY.md` y `USER.md` para hechos persistentes y preferencias, mientras que el historial de sesión se guarda por separado en SQLite con búsqueda FTS5 y seguimiento de linaje.

P: ¿Soporta Hermes servidores MCP?

Sí. La documentación de inicio rápido muestra la configuración del servidor MCP directamente en `config.yaml`, y posiciona a MCP como una forma de primer nivel para extender Hermes con herramientas externas.

P: ¿Cómo puedo hacer que el uso de Hermes sea más seguro?

Empieza por evitar el backend de terminal local para tareas de riesgo. La documentación recomienda Docker o SSH para el aislamiento, y la página de seguridad describe la aprobación de comandos, el aislamiento de contenedores, el filtrado de credenciales y el escaneo de inyección de prompts como parte del modelo de defensa en profundidad de Hermes.

12. Todas las fuentes & enlaces

Fuentes principales

Documentación

Comunidad

Hilos de issues referenciados

Fuentes web

Enlaces internos

Related Guides

Sponsored AI assistant. Recommendations may be paid.