KI Deep Dive

Hermes Agent Guide: Der Open-Source-KI-Agent, der mit dir wächst

Hermes Agent ist der Versuch von Nous Research, einen beständigen persönlichen Agenten zu entwickeln, anstatt eines weiteren Wegwerf-Chatfensters. Er kombiniert ein Terminal-UI, ein Messaging-Gateway, persistenten Speicher, Open-Standard-Skills, cron, MCP und mehrere Execution-Backends in einem Stack. Wir haben das Repo, die Dokumentationsseite, die Architektur-Notizen und den Issue-Tracker durchforstet, um zu sehen, was bereits funktioniert, was ihn unterscheidet und wo es noch Ecken und Kanten gibt.

Die offizielle Hermes-Website beschreibt das Produkt auf eine bewusst prägnante Weise: Es ist kein Coding-Copilot, der an eine IDE gebunden ist, und kein dünner Chatbot-Wrapper um einen einzelnen Anbieter. Das Konzept sieht einen persistenten Agenten vor, den man auf einem Rechner installiert, mit dem bevorzugten Model-Stack verbindet und über das CLI oder Messaging-Apps anspricht, während er über die Zeit hinweg in derselben Umgebung weiterarbeitet. Das ist eine ambitioniertere Produktdefinition, als die meisten Open-Source-Agent-Projekte anstreben.

🎬 Video-Übersicht ansehen

Lieber lesen? Der vollständige Artikel unten analysiert die Architektur, Skills, das Memory-Modell und die Trade-offs von Hermes Agent.

Get the latest on AI, LLMs & developer tools

New MCP servers, model updates, and guides like this one — delivered weekly.

1. Warum es wichtig ist

Hermes ist wichtig, weil es eine der größten Frustrationen bei Agent-Tooling angeht: Zustandslosigkeit. Die meisten KI-Coding-Tools sind gut für eine Session, einen Editor, einen Prompt, einen Provider und eine Maschine. Hermes basiert auf einer anderen Annahme: Ein nützlicher Agent ist einer, der bestehen bleibt, Arbeitswissen ansammelt und über mehr als eine Oberfläche erreichbar ist.

Deshalb fand das Launch-Framing so viel Anklang. Die öffentliche X-Ankündigung von Nous Research stellte Hermes als “den Open-Source-Agenten, der mit dir wächst” vor, und die offiziellen Dokumente wiederholen dieselbe These: persistenter Speicher, wiederverwendbare Skills, geplante Jobs, Remote-Ausführung und Messaging-Kontinuität sind das Kernversprechen und nicht bloß nachträglich hinzugefügte Features.

Warum dieses Repo so erfolgreich wurde

Hermes verbreitete sich nicht, weil es einen besseren Prompt versprach. Es verbreitete sich, weil es ein beständiges Agent-Modell bündelte: Memory, Skills, Gateways, Cron, MCP und sicherere Execution-Backends in einem einzigen Open-Source-Stack. Das ist ein weitaus größerer Anspruch als “KI-Coding-Assistent”, und deshalb begannen Entwickler, es mit einer vollständigen Agent-Infrastrukturschicht statt mit einem einzelnen Tool zu vergleichen.

2. Was Hermes eigentlich ist

Laut dem GitHub-Repo und der offiziellen Website, ist Hermes ein MIT-lizenziertes Agent-Framework von Nous Research, das lokal, auf einem VPS oder in containerisierten und Cloud-gestützten Ausführungsumgebungen laufen kann.

Die Quickstart-Dokumentation hebt einen weiteren wichtigen Punkt hervor: Hermes ist modellagnostisch. Die Liste der unterstützten Provider in der Dokumentation umfasst Nous Portal, OpenAI Codex, Anthropic, OpenRouter, DeepSeek, GitHub Copilot, Gemini via OAuth, benutzerdefinierte OpenAI-kompatible Endpunkte und mehr. Der Wechsel des Providers wird als Konfiguration behandelt, nicht als Fork des Produkts.

Es gibt zudem eine starke architektonische Ausrichtung auf Modelle mit großem Kontext. Der Quickstart warnt, dass Hermes ein Kontextfenster von mindestens 64K benötigt, da es für mehrstufige Tool-Calling-Workflows, persistenten Kontext und längere Aufgabenhorizonte konzipiert ist als ein einfacher Agent im Autocomplete-Stil.

LayerWas das in der Praxis bedeutet
CLI / TUIEin klassischer Terminal-Modus plus eine neuere TUI für lange interaktive Sitzungen.
GatewayEin einziger Prozess kann Hermes mit Telegram, Discord, Slack, WhatsApp, Signal, E-Mail und anderen Plattformen verbinden.
AusführungBefehle können lokal oder über Backends wie Docker, SSH, Modal, Daytona und im Singularity-Stil ausgeführt werden.
ErweiterungenMCP-Unterstützung, Plugins, gebündelte Skills, optionale Skills und Editor-Integration via ACP.

Dies ist der entscheidende Wechsel im mentalen Modell: Hermes ist nicht nur ein Chat-UI für Tools. Es ist eine zustandsbehaftete Runtime für Agenten, die Chat lediglich als Interface nutzt.

3. Funktionsweise

Die offiziellen Architektur-Dokumente sind hier ungewöhnlich transparent. Hermes leitet mehrere Einstiegspunkte in einen gemeinsamen AIAgent Core: CLI, Gateway, ACP, Batch-Runner und API-Server speisen alle denselben Orchestration-Loop. Dieser Loop koordiniert Prompt-Erstellung, Provider-Auflösung, Tool-Dispatching, Komprimierung und Persistenz.

Die Architektur-Seite zeigt auch, warum sich Hermes umfassender anfühlt als viele Wettbewerber. Das Zusammenstellen von Prompts ist nicht nur ein einfacher System-Prompt-String. Es schichtet Personality-Dateien, Memory-Dateien, Skills und Projekt-Kontext-Dateien wie AGENTS.md, modellspezifische Anweisungen und Anleitungen zur Tool-Nutzung. Sitzungsdaten werden in SQLite mit FTS5 gespeichert, während Gateway-Sessions und Agenten-Status über verschiedene Oberflächen hinweg verfolgt werden.

Ein Blick unter die Haube

Hermes dokumentiert einen Stack, der auf Folgendem aufbaut:

  • AIAgent als zentraler Konversations-Loop
  • prompt_builder.py für die Zusammenstellung des System-Prompts
  • runtime_provider.py für die Modell-/Provider-Auswahl
  • registry.py plus Tool-Dateien für Dispatching und Verfügbarkeit
  • SQLite + FTS5 für Session-Speicherung und Suche
  • Gateway-Adapter für Messaging-Oberflächen und Zustellung

Das Sicherheitsmodell ist gleichermaßen explizit. Die Dokumentation beschreibt einen siebenstufigen Defense-in-Depth-Ansatz, der die Genehmigung gefährlicher Befehle, Container-Isolierung, Credential-Filterung für MCP-Subprozesse, Context-File-Scanning auf Prompt-Injection und validierte Working-Directory-Parameter umfasst. Das macht Hermes nicht unfehlbar, bedeutet aber, dass sich das Projekt ernsthaft mit dem Betreiberrisiko auseinandergesetzt hat.

4. Das Skills-System ist das eigentliche Alleinstellungsmerkmal

Wenn Hermes ein Feature hat, das den Rest des Produkts sinnvoll macht, dann ist es das Skills-System. Die offizielle Dokumentation definiert Skills als On-Demand-Wissensdokumente, die über ein Progressive-Disclosure-Muster geladen werden, um den Token-Verbrauch zu minimieren. Das ist eine umschreibende Art zu sagen, dass Hermes versucht, nicht das gesamte prozedurale Wissen auf einmal in den Prompt zu packen.

Skills befinden sich in ~/.hermes/skills/, können gebündelt, über den Hub installiert oder von Agenten erstellt werden, und jeder installierte Skill wird als Slash-Befehl verfügbar. Die Dokumentation zeigt Beispiele wie /github-pr-workflow, /plan, sowie direkte Such- und Installationsbefehle über das CLI.

# Browse and install skills
hermes skills search kubernetes
hermes skills search react --source skills-sh
hermes skills install openai/skills/k8s

# Or use the slash command inside Hermes
/skills

Das Progressive-Disclosure-Modell macht dies elegant statt überladen. Hermes lädt zuerst nur leichtgewichtige Skill-Metadaten und öffnet dann die vollständigen SKILL.md wenn es den Skill tatsächlich benötigt, und lädt tiefergehende Referenzdateien nur dann, wenn die Aufgabe dies erfordert. Dies ist dasselbe Design-Pattern, das die besten Agent-Toolchains schnell wirken lässt, anstatt sie mit Prompts zu ersticken.

Hermes hebt Skills zudem über die einmalige Ausführung hinaus. Die cron-Dokumentation zeigt Jobs, die einen oder mehrere Skills anhängen können, bevor der Prompt ausgeführt wird. Das bedeutet, dass geplante Tasks strukturierte Workflows erben können, anstatt sich auf einen riesigen Inline-Instruction-Blob verlassen zu müssen.

# Conceptually, Hermes cron jobs can attach skills
hermes cron edit <job_id> --skill blogwatcher --skill find-nearby

# Or you can ask naturally:
"Every morning at 9am, check Hacker News for AI news and send me a summary on Telegram."

Das Memory-System von Hermes' ist disziplinierter, als das Marketing-Wort “Memory” üblicherweise suggeriert. Die Dokumentation beschreibt zwei begrenzte Dateien, MEMORY.md und USER.md, mit expliziten Zeichenlimits. Sie werden zu Beginn der Session als eingefrorener Snapshot in den Prompt injiziert, damit Hermes dauerhafte Fakten behalten kann, ohne ständig das eigene Präfix zu mutieren.

Dieses Design ist wichtig, da es Memory als kuratierten Statusbetrachtet und nicht als grenzenlose Müllhalde. Hermes merkt sich Projektdaten, Benutzerpräferenzen und nützliche gelernte Abläufe, verlässt sich aber für den tieferen historischen Abruf weiterhin auf separaten Session-Speicher und Session-Suche. Die Architektur-Dokumentation legt dar, dass die Session-Persistenz in SQLite mit FTS5 und Lineage-Tracking liegt.

Wichtige Nuance

Hermes-Memory ist kein magisches Langzeit-Reasoning. Es ist ein begrenztes System für dauerhafte Fakten und Präferenzen, plus eine durchsuchbare Session-Historie. Das ist eine gute Design-Entscheidung, bedeutet aber auch, dass man “remembers across sessions” nicht mit “never loses context again” verwechseln sollte.

6. Erste Schritte

Der offizielle Quickstart ist unkompliziert. Installieren Sie Hermes, wählen Sie einen Provider, starten Sie das TUI oder CLI und entscheiden Sie dann, ob Sie eine lokale Ausführung oder ein sichereres Remote-/Container-Backend wünschen. Für die meisten sollte der erste Durchlauf bewusst unspektakulär sein: Bringen Sie eine einzelne Session zum Laufen und ergänzen Sie danach Gateway, Skills, MCP und cron.

# Install Hermes Agent
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

# Configure provider and tools
hermes setup

# Start Hermes
hermes --tui

Wenn Sie Hermes für echte Arbeit statt nur zum Experimentieren nutzen möchten, sollte der nächste Schritt eine sicherere Terminal-Ausführung sein:

# Safer execution backends from the docs
hermes config set terminal.backend docker
hermes config set terminal.backend ssh

# Optional: connect messaging platforms
hermes gateway setup

Der Quickstart enthält auch ein minimales MCP-Beispiel – genau die Art von Feature, die Hermes nützlicher macht als eine geschlossene Tool-Insel:

mcp_servers:
  github:
    command: npx
    args: ["-y", "@modelcontextprotocol/server-github"]
    env:
      GITHUB_PERSONAL_ACCESS_TOKEN: "ghp_xxx"

Zwei Vorbehalte bei der Einrichtung sollten klar benannt werden. Erstens verweist die offizielle Dokumentation Windows-Nutzer weiterhin auf WSL2. Zweitens zeigt der Issue-Tracker, dass Installations- und Umgebungsmanagement-Bugs immer noch häufig auftreten; betrachten Sie den Installer also als sich schnell entwickelnde Infrastruktur und nicht als ausgereiftes Enterprise-Packaging.

7. Praxisbeispiele

Beispiel 1: Führen Sie riskante Aufgaben standardmäßig nicht auf dem lokalen Backend aus

Falsch: Hermes lokal installieren, das Terminal-Backend auf locallassen und zulassen, dass weitreichende Shell-Befehle auf der echten Workstation ausgeführt werden.

Richtig: Zuerst zu Docker oder SSH wechseln, die Bestätigung für gefährliche Befehle aktiviert lassen und das lokale Backend eher als Komfort-Option statt als Produktions-Option betrachten.

Beispiel 2: Kodieren Sie nicht jeden Workflow in einen einzigen riesigen Prompt

Falsch: Ständig neue Daueranweisungen anhängen, bis jede Aufgabe mit einer Wand aus Kontext beginnt.

Richtig: install or create skills for recurring workflows, then let Hermes load them on demand or attach them to cron jobs. This is exactly what the skills system was designed to solve.

Beispiel 3: Verwechseln Sie Memory nicht mit Wissensvollständigkeit

Falsch: Annehmen, dass Hermes-Memory bedeutet, dass der Agent nun permanent jedes Detail Ihres Systems versteht.

Richtig: Memory für beständige Fakten und Präferenzen nutzen, Session-Suche für den Verlauf und MCP oder externe Tools für den Abruf tiefergehender Source-of-Truth-Informationen. Dieses Schichtenmodell entspricht eher der tatsächlichen Architektur von Hermes.

Nutzen Sie Hermes, wenn Sie Folgendes möchten...Erwarten Sie nicht, dass Hermes Folgendes ist...
Ein langlebiger Agent, der zwischen Terminal und Messaging wechseln kannEin No-Ops, Zero-Admin Consumer-Produkt
Wiederverwendbare Skills, MCP und cron in einem StackEin spezialisierter IDE-Copilot mit optimierten Defaults an jeder Stelle
Remote- oder containerisierte Ausführung mit expliziten SicherheitskontrollenRisikofreie Autonomie, nur weil die Dokumentation Sicherheitsschichten erwähnt

8. Reaktionen der Community

Die allgemeine Reaktion auf Hermes ist interessant, da es sich nicht nur um Hype handelt. Es ist eine Mischung aus echter Begeisterung auf Betreiberseite, offensichtlicher Neugier auf selbstgehostete Agent-Stacks und gesunder Skepsis, ob das Produkt seine Versprechen unter realen Workloads halten kann.

Positiv zu vermerken ist, dass die öffentliche Launch-Botschaft von Nous Research stark auf das Narrativ “wächst mit dir” setzte, und dieselbe Beschreibung wurde in der Dokumentation und in Beiträgen von Drittanbietern aufgegriffen. Ein LinkedIn-Post von Tenten wiederholte das gleiche Framing bezüglich Speicher- und Maschinenzugriff fast wortwörtlich, was zeigt, wie reibungslos sich die Produktstory über GitHub-native Zielgruppen hinaus verbreitet hat.

Reddit fing die geteilte Reaktion ehrlicher ein. Im ersten LocalLLaMA-Thread zum Launch reagierte ein Kommentator auf die Idee, Hermes Messaging-Accounts anzuvertrauen, mit einem unverblümten:

“Installiere es auf einer Maschine, gib ihm deine Messaging-Accounts”... Ja, klar.

Diese Skepsis ist nicht irrational. Hermes verlangt Vertrauen in Automatisierung, Zugangsdaten, langlaufende Prozesse und die Ausführung von Tools. Aber der direkt darauffolgende Kommentar im selben Thread war eher praktisch als ablehnend:

“Ich plane, dies auf Render + Supabase zu nutzen.”

Das ist wahrscheinlich die treffendste Zusammenfassung des aktuellen Hermes-Moments: Einige hören den Pitch und machen sich sofort Sorgen um die Sicherheit; andere hören denselben Pitch und fangen an, Deployment-Ziele zu planen.

Der Issue-Tracker unterstreicht, dass dies ein aggressives, schnelllebiges Infrastrukturprojekt ist. Aktuelle Issues beinhalten einen Agenten, der sein eigenes Runtime-virtualenv zerstört,Stillstände im Installations-Flow, container/systemd gateway-install-Diskrepanzen. Nichts davon entwertet Hermes. Es bedeutet lediglich, dass das Repo gleichzeitig unter echtem Adoptionsdruck steht und reale Stolperfallen für Anwender bereithält.

Fazit der Community

Hermes wird als ernsthafte Infrastruktur behandelt, nicht als Spielzeug-Demo. Das ist gut für die Glaubwürdigkeit, bedeutet aber auch, dass die Messlatte höher liegt: Bei einem Hobby-Tool verzeiht man Ecken und Kanten, aber nicht bei etwas, das Gateway-Zugangsdaten und Shell-Zugriff verwaltet.

9. Das Fazit: Lohnt sich der Einsatz von Hermes Agent?

Unsere Einschätzung

Ja, wenn Sie eine echte Agent-Runtime anstelle einer weiteren Chat-Shell suchen.Hermes ist einer der kohärentesten Open-Source-Versuche, Skills, Memory, Messaging, Cron, MCP und sicherere Ausführung in einem einzigen Stack für Operatoren zu vereinen. Die Idee ist stark, die Dokumentation ungewöhnlich konkret und die Architektur deutlich seriöser als bei einem durchschnittlichen Agent-Repo.

Nutzen Sie es, wenn:

  • Sie einen Agenten suchen, der auf einem VPS, in einem Container oder auf einer Remote-Maschine laufen kann, anstatt nur in Ihrem Editor.
  • Ihnen langlebige Workflows wichtig sind, die auf Skills, MCP, Cron und einer durchsuchbaren Session-Historie basieren.
  • Sie sich in der Rolle eines Operators wohlfühlen: Backends, Zugangsdaten, Sicherheitsgrenzen und Fehlerszenarien.

Lassen Sie es bleiben, wenn:

  • Sie primär einen ausgereiften Coding-Copiloten mit minimalem Setup und weniger beweglichen Teilen suchen.
  • Sie sich nicht mit Gateways, Containern, Konfiguration oder der Auswahl des Backends beschäftigen möchten.
  • Sie eher ausgereiftes Packaging und reibungslose Produktionsstabilität benötigen als Funktionsbreite und Flexibilität.

10. Das Gesamtbild

Hermes ist über das eigene Repo hinaus von Bedeutung, da es auf ein anderes Modell von Agent-Software hindeutet. Der siegreiche Agent wird vielleicht nicht derjenige mit der schicksten Chat-UX sein. Es könnte derjenige sein, der sich eher wie Infrastruktur verhält: expliziter Status, wiederverwendbare Prozeduren, durchsuchbare Historie, mehrere Ausführungsumgebungen und Schnittstellen, die Kontextwechsel überstehen.

Deshalb passt Hermes auch so gut in die Diskussion über Open Skills, MCP-Server und Multi-Agent-Orchestrierung. Es behandelt all diese Elemente als kombinierbare Bausteine statt als isolierte Features. Wenn Sie unsere Berichterstattung über portable Skills,maßgeschneidertes MCP-Tooling, und Multi-Agent-Orchestrierung, wirkt Hermes weniger wie ein Ausreißer, sondern eher wie ein dichter Konvergenzpunkt.

Ob Hermes selbst zur dominierenden Open-Source-Agent-Runtime wird, ist noch eine offene Frage. Aber die Produktrichtung ist bereits klar: Der Agent, den die Nutzer tatsächlich behalten, ist derjenige, der sich genug merken kann, genug delegieren kann, sicher genug läuft und über alle Oberflächen hinweg erreichbar bleibt, auf denen echte Arbeit stattfindet.

11. Häufig gestellte Fragen (FAQ)

F: Was unterscheidet Hermes Agent von einem normalen Coding-Copilot?

Hermes ist als langlebiger Agent konzipiert, nicht nur als IDE-Assistent. Die offizielle Dokumentation positioniert ihn als ein System, das auf Ihrem Server laufen kann, über Messaging-Apps funktioniert, ein begrenztes Memory behält, Skills bei Bedarf lädt und wiederkehrende Aufgaben plant.

F: Kann Hermes auf einem VPS oder einem Remote-Rechner laufen?

Ja. Die offizielle Dokumentation beschreibt Hermes explizit als eine Lösung, die auf einem VPS, GPU-Cluster oder Remote-Server ausgeführt werden kann. Das Terminal-Backend-System unterstützt neben der lokalen Ausführung auch SSH, Docker, Modal, Daytona und Singularity.

F: Wie funktionieren Skills in Hermes?

Skills werden in `~/.hermes/skills/` gespeichert und schrittweise geladen. Hermes sieht zuerst leichtgewichtige Metadaten, öffnet die vollständige `SKILL.md` erst, wenn die Aufgabe passt, und kann bei Bedarf tiefergehende Referenzdateien laden.

F: Ist das Hermes-Memory dasselbe wie der Chat-Verlauf?

Nein. Die Memory-Dokumentation beschreibt einen begrenzten `MEMORY.md`- und `USER.md`-Speicher für dauerhafte Fakten und Präferenzen, während der Sitzungsverlauf separat in SQLite mit FTS5-Suche und Lineage-Tracking gespeichert wird.

F: Unterstützt Hermes MCP-Server?

Ja. Die Quickstart-Dokumentation zeigt die MCP-Serverkonfiguration direkt in der `config.yaml`, und die Dokumentation positioniert MCP als erstklassige Methode, um Hermes mit externen Tools zu erweitern.

F: Wie mache ich die Nutzung von Hermes sicherer?

Vermeiden Sie zunächst das lokale Terminal-Backend für riskante Aufgaben. Die Dokumentation empfiehlt Docker oder SSH zur Isolierung. Die Sicherheitsseite beschreibt Befehlsfreigaben, Container-Isolierung, Credential-Filterung und Prompt-Injection-Scanning als Teil des Defense-in-Depth-Modells von Hermes.

12. Alle Quellen & Links

Primärquellen

Dokumentation

Community

Referenzierte Issue-Threads

Web-Quellen

Interne Links

Related Guides

Sponsored AI assistant. Recommendations may be paid.