Die nützliche Einordnung ist nicht `vector database for agents`. Agentmemory ist eher ein lokaler Black-Box-Rekorder kombiniert mit einer Suchmaschine und einem Kontext-Injektor. Es zeichnet auf, was Agenten getan haben, wandelt dies in durchsuchbaren Speicher um und versucht zu verhindern, dass jede neue Sitzung dieselben Projektfakten neu entdecken muss.
Get the latest on AI, LLMs & developer tools
New MCP servers, model updates, and guides like this one — delivered weekly.
Redaktioneller Hinweis
Dieser Artikel verwendet die README, das npm-Paket, Release/Changelog, Benchmark-Dokumente, Quelldateien, aktuelle Issues/PRs, X-Posts und Reddit-Kritik, die am 2. Juni 2026 gesammelt wurden. Benchmark-Zahlen sind Retrieval-Benchmarks aus erster Hand, keine unabhängigen Full-Task-QA-Ergebnisse.
1. agentmemory in einem Satz
Agentmemory ist ein Apache 2.0 lokaler Speicherserver für KI-Coding-Agenten, der Beobachtungen erfasst, sie mit BM25/Vektor/Graph-Suche indiziert und Speicher über MCP, REST, Hooks und einen Web Viewer bereitstellt.
| Bereich | Detail | Warum es wichtig ist |
|---|---|---|
| Repository | rohitg00/agentmemory | https://github.com/rohitg00/agentmemory |
| Primäre Sprache | TypeScript | Primäre GitHub-Sprache zum Recherchezeitpunkt. |
| Lizenz | Apache-2.0 | Gebündelte oder binäre Lizenzen gegebenenfalls separat prüfen. |
| Erstellt | 25. Februar 2026 | Letztes Release geprüft: v0.9.24, veröffentlicht am 29. Mai 2026. |
2. Warum es wichtig ist
KI-Coding-Agenten vergessen standardmäßig den Sitzungskontext. Sie lernen Architektur, Fehlerhistorie, Benutzerpräferenzen, Tool-Verhalten und frühere Entscheidungen jedes Mal neu, wenn das Kontextfenster zurückgesetzt wird.
Statische Dateien wie `CLAUDE.md`, `AGENTS.md` und `.cursorrules` helfen zwar, sind aber manuell, begrenzt und veralten leicht. Agentmemory versucht, Speicher automatisch zu machen: Beobachte die Sitzung, komprimiere die wichtigen Teile und rufe später nur relevanten Kontext ab.
Das schwierige Problem ist nicht die Speicherung. Es ist der Lebenszyklus: veraltete Erinnerungen, widersprüchliche Fakten, Retrieval-Präzision, Token-Budget, Projektidentität, Datenschutz und die Frage, ob der Agent die injizierten Beweise tatsächlich verwendet.
3. Architektur und Denkmodell
Agentmemory läuft als lokaler iii-Engine-Worker mit REST, MCP, Status, Warteschlangen, Streams, Viewer und Observability. Agenten schreiben Beobachtungen; der Worker speichert rohe und komprimierte Beobachtungen, indiziert die Suche, baut Kontext auf und stellt den Speicher wieder bereit.
| Bereich | Detail | Warum es wichtig ist |
|---|---|---|
| Runtime | iii engine | Bietet HTTP-Trigger, Status, Warteschlangen, Streams, Cron und Observability. |
| Erfassung | Hooks, MCP, REST | Zeichnet Tool-Nutzung, Prompts, Dateiänderungen, Sitzungen und explizite Erinnerungen auf. |
| Speicher | KV-Scopes und lokaler Status | Speichert Sitzungen, Beobachtungen, Erinnerungen, Zusammenfassungen, Graph-Knoten und Indizes. |
| Suche | BM25, Vektor, Graph, RRF | Führt lexikalische, semantische und Graph-Signale zusammen. |
| Kontext | `/agentmemory/context` und MCP-Tools | Gibt begrenzte Kontextblöcke an Agenten zurück. |
| Viewer | localhost Web UI | Zeigt Sitzungen, Erinnerungen, Graphen, Replays und Live-Ereignisse an. |
4. Kleinster End-to-End-Setup
Die folgenden Befehle stammen aus der Repository-Dokumentation und wurden mit dem aktuellen Recherche-Snapshot abgeglichen. Behandle sie als Startpunkt und lies anschließend die verlinkte README, bevor du in einer Produktionsumgebung installierst.
npm install -g @agentmemory/agentmemory
agentmemory
agentmemory demo
agentmemory connect claude-code
npx skills add rohitg00/agentmemory -y
# No-install path
npx -y @agentmemory/agentmemory@latestEine kleine erste Aufgabe sollte die Integration beweisen, bevor du sie mit kritischen Daten oder großen Workspaces verbindest.
# Terminal 1: start local memory server
npx -y @agentmemory/agentmemory@latest
# Terminal 2: seed sample sessions and prove recall
npx -y @agentmemory/agentmemory@latest demo
# Browser viewer
open http://localhost:31135. Technischer Deep Dive
5.1 Beobachtungen sind das Rohmaterial
Agentmemory erfasst Sitzungsereignisse: Prompts, Tool-Aufrufe, Tool-Ergebnisse, Dateien, Projektpfade, Fehler und Antworten. Der `observe`-Pfad bereinigt, dedupliziert, speichert Rohbeobachtungen und streamt Live-Updates an den Viewer.
Dies ist die Black-Box-Recorder-Schicht. Selbst wenn die übergeordnete Zusammenfassung deaktiviert ist, kann der lokale Server weiterhin strukturierte Nachweise über die Vorgänge aufzeichnen.
5.2 Kompression kann synthetisch oder LLM-gestützt sein
Die aktuelle README/Quelle besagt, dass der Standard-LLM-Anbieter no-op ist, es sei denn, ein Anbieter-Schlüssel ist konfiguriert oder der Claude-Abonnement-Fallback ist explizit aktiviert. Das bedeutet, dass die grundlegende Erfassung ohne API-Schlüssel funktionieren kann, aber reichhaltigere LLM-gestützte Kompression und Zusammenfassung eine Konfiguration erfordern.
Diese Unterscheidung ist wichtig, da in Community-Threads Verwirrung bei der Einrichtung auftritt. Benutzer sollten nicht davon ausgehen, dass jede Funktion kostenlos ist, nur weil der Server lokal startet.
5.3 Hybride Suche führt verschiedene Abrufsignale zusammen
Die Suchschicht kombiniert BM25-Keyword-Matching, Vektorähnlichkeit und Graph-/Kontextsignale mit Reciprocal-Rank-Fusion. Das Ziel ist es, die wichtigen Erinnerungen innerhalb eines Token-Budgets abzurufen, anstatt alles in jeden Prompt zu werfen.
BM25 erfasst exakte Namen und Fehlermeldungen. Die Vektorsuche erfasst semantische Ähnlichkeit. Die Graphsuche kann Projektentitäten verbinden. RRF verhindert, dass ein Abrufmodus jede Abfrage dominiert.
Query: "database performance optimization"
-> BM25 finds N+1 and query terms
-> vector search finds semantic session summaries
-> graph search adds linked files/concepts
-> RRF merges ranked lists
-> context builder trims to budget5.4 Kontext-Injektion ist konzeptbedingt begrenzt
Die Kontextfunktion erstellt begrenzte `<agentmemory-context>`-Blöcke aus Slots, Projektprofil, Lektionen, Zusammenfassungen und wichtigen Beobachtungen. Dies ist ein kritischer Designpunkt: Persistenter Speicher ist nur dann nützlich, wenn er nicht den gesamten Prompt verbraucht.
Die offene Forschungsfrage ist das Leserverhalten. Selbst wenn der Abruf die richtigen Beweise findet, kann der Agent sie ignorieren, vergraben oder auf Basis veralteter Annahmen antworten. Einige aktuelle Issues schlagen Metriken genau für diesen Fehlermodus vor.
5.5 Der Viewer ist teils Debugger, teils Produkt.
Der Web-Viewer zeigt Sitzungen, Replays, Memory-Graphen, Live-Ereignisse und den Status an. Für ein Memory-System ist dies kein dekoratives Element. Wenn Benutzer nicht überprüfen können, was der Agent gespeichert hat, können sie der Memory-Ebene nicht vertrauen.
Aktuelle Probleme mit großen Graphen zeigen, warum die Skalierbarkeit des Viewers wichtig ist. Ein Graph-Tab, der bei Demos funktioniert, aber bei einem großen Korpus versagt, kann Benutzer glauben lassen, dass der Speicher defekt ist, selbst wenn Daten vorhanden sind.
6. Praxis: Falsch vs. richtig
| Falsch | Richtig | Grund |
|---|---|---|
| Gehen Sie davon aus, dass für nicht jede Funktion ein API-Key erforderlich ist. | Trennen Sie die lokale Erfassung von der LLM-gestützten Zusammenfassung und Konsolidierung. | Der No-op-Provider ist der Standard, sofern nicht anders konfiguriert. |
| Betrachten Sie den Speicher als eine permanente Datenbank der Wahrheit. | Planen Sie für Verfall, den Umgang mit Widersprüchen, Löschvorgänge und die Überprüfung von Quellen. | Alte prozedurale Erinnerungen können falsch werden. |
| Führen Sie viele lokale Instanzen auf Standard-Ports aus. | Überschreiben Sie Ports oder teilen Sie sich bewusst einen Server. | Die Standard-Ports 3111/3113 können kollidieren. |
| Vertrauen Sie dem Benchmark-Recall als Maß für die Genauigkeit bei vollständigen Aufgaben. | Messen Sie, ob Ihr Agent abgerufene Informationen korrekt verwendet. | Retrieval- und Reader-Verhalten sind unterschiedliche Fehlerquellen. |
7. Häufige Fehler und aktuelle Probleme
Der Issue Tracker ist wichtig, weil diese Repos jung sind und sich schnell bewegen. Der Artikel nutzt Issues als Risikosignale, nicht als Beweis dafür, dass ein Projekt unbrauchbar ist.
| Bereich | Detail | Warum es wichtig ist |
|---|---|---|
| Agent SDK Fallback | Issue #781 berichtet von einem Race-Condition-Problem beim Rekursionsschutz mit gleichzeitigen Zusammenfassungs-Chunks. | Verwenden Sie echte Provider-Keys oder reduzieren Sie die Nebenläufigkeit, bis Korrekturen verfügbar sind. |
| Zusammenfassungs-Parsing | Issue #783 berichtet von XML-Parser-Fehlern bei Markdown-Fences und zusätzlichem Text. | Strukturierte LLM-Ausgaben erfordern robustes Parsing und Retry-Mechanismen. |
| Fallback-Provider | Issue #778 besagt, dass Fallback-Provider den Namen des primären Modells übernehmen. | Cross-Provider-Failover kann einen 404-Fehler verursachen, wenn sich Modell-Namespaces unterscheiden. |
| JSONL importieren | Issue #775/PRs verfolgen Probleme mit bestehenden Sitzungsschlüsseln. | Pfade für den Massenimport erfordern eine Validierung bei echten Transkript-Trees. |
| Großer Graph-Viewer | Issue #753 berichtet von einem leeren Graph-Tab bei großen Korpora. | Die Skalierung des Viewers bleibt ein aktuelles Anliegen. |
8. Performance-, Skalierungs- und Kostennotizen
First-Party-Benchmarks berichten von LongMemEval-S-Abrufergebnissen im Bereich hoher R@5/R@10-Werte mit lokalen Embeddings sowie einem kleinen Coding-Agent-Life-Korpus mit 100 % Top-5-Trefferrate und niedriger p50-Latenz. Dies sind Abruf-Benchmarks, keine Erfolgsraten für End-to-End-Programmieraufgaben.
Die Kostensituation hängt stark von der Konfiguration ab. Lokale Embeddings sind kostengünstig. Synthetische Komprimierung ist kostengünstig. LLM-gestützte Komprimierung, Zusammenfassung, Graphenextraktion und Konsolidierung erhöhen den Token-Verbrauch im Hintergrund.
Skalierungsdruck zeigt sich bei der Persistenz von Such-Snapshots, großen Graph-Endpunkten, dem Rendering des Viewers und dem Sitzungsimport. Für kleine und mittlere persönliche Projekte mag dies in Ordnung sein. Testen Sie bei monatelanger Multi-Agent-Historie mit Ihrem echten Korpus, bevor Sie sich darauf verlassen.
9. Für wen es geeignet ist
| Verwenden, wenn | Überspringen, wenn |
|---|---|
| Sie führen täglich Coding-Agents aus und wiederholen häufig Projekterklärungen. | Ihre Sitzungen sind kurz und temporär. |
| Sie möchten eine lokale Speicherebene, die zwischen Claude Code, Codex, Cursor, Gemini und MCP-Clients geteilt wird. | Sie verwenden nur ein einziges Tool mit ausreichendem integriertem Speicher. |
| Sie können den Speicher inspizieren und bereinigen, wenn er veraltet ist. | Sie benötigen einen wartungsfreien Wahrheits-Speicher. |
| Sie akzeptieren einen jungen, sich schnell entwickelnden TypeScript/iii-Stack. | Sie benötigen heute bewährte Zuverlässigkeit für große Korpora. |
10. Community-Signal
X/Twitter rahmt agentmemory meist als schnell wachsende, fehlende Speicherebene für Coding-Agents ein. Das ist ein nützliches Signal für die Akzeptanz, aber viele Beiträge sind eher kurze Verstärkungen als tiefgreifende Bewertungen.
Reddit-Kritik ist nützlicher: Benutzer fragen, wie das System mit Widersprüchen, veraltetem prozeduralem Gedächtnis, Speicherwachstum, Benchmark-Design, Token-Overhead und der Zuverlässigkeit des Speichers nach monatelangen Sitzungen umgeht.
Der aktuelle GitHub-Issue-Tracker ist aktiv und technisch. Mehrere Issues enthalten Analysen auf Root-Cause-Ebene und PRs, was ein gutes Signal für die Wartung ist, aber auch daran erinnert, dass das System noch reift.
11. Das Urteil: Lohnt sich die Nutzung?
Unsere Einschätzung
Verwenden Sie agentmemory, wenn Ihre Coding-Agents ständig dieselben Projektfakten neu entdecken und Sie eine lokale, inspizierbare, agentenübergreifende Speicherebene wünschen. Überspringen oder isolieren Sie es, wenn Sie heute bewährte Governance für Langzeitgedächtnis, Skalierung für große Graphen und konfigurationsfreie Zusammenfassung benötigen.
12. Das große Ganze
Agentmemory positioniert sich zwischen statischen Instruktionsdateien und vollständigen Agent-Runtimes. Es ersetzt nicht `AGENTS.md`; es ergänzt es, indem es sich daran erinnert, was nach dem Schreiben der Datei passiert ist.
Die größere Bewegung geht in Richtung externalisierter Agenten-Zustände. Agents benötigen Tools, Speicher, Projektgraphen, Eval-Traces und wiederholbare Historien, die ein einzelnes Kontextfenster überdauern. Die nächste schwierige Aufgabe ist nicht, sich an alles zu erinnern. Es geht darum, sich an das Richtige zu erinnern, Veraltetes zu vergessen und zu belegen, warum eine Erinnerung injiziert wurde.
13. Häufig gestellte Fragen
F: Funktioniert agentmemory ohne API-Key?
Grundlegende lokale Erfassung und synthetisches Speicherverhalten funktionieren ohne Provider-Key. LLM-gestützte Zusammenfassungen, Komprimierung und Konsolidierung erfordern einen expliziten Provider oder ein aktiviertes agent-sdk-Fallback.
F: Wo werden die Daten gespeichert?
Es läuft lokal und speichert Sitzungen, Beobachtungen, Erinnerungen, Zusammenfassungen und Indizes über iii-engine-Status/KV-Scopes innerhalb der lokalen Laufzeit.
F: Wie unterscheidet es sich von `CLAUDE.md`?
`CLAUDE.md` ist eine statische Instruktionsdatei. Agentmemory zeichnet Sitzungsereignisse auf und ruft relevanten früheren Kontext dynamisch ab.
F: Was tragen BM25, Vektorsuche und Graphsuche jeweils bei?
BM25 erfasst exakte Begriffe, die Vektorsuche erfasst semantische Ähnlichkeit und die Graphsuche fügt Beziehungskontext hinzu. RRF führt die gerankten Ergebnisse zusammen.
F: Welche Agents werden unterstützt?
Die README listet Claude Code, Codex CLI, Cursor, Gemini CLI, GitHub Copilot CLI, Hermes, OpenClaw, OpenCode und generische MCP-Clients auf.
F: Was funktioniert bei großem Umfang nicht mehr?
Offene Issues erwähnen große Graph-Endpunkte, Index-Persistenz, Viewer-Verhalten und Import-Pfade. Testen Sie es mit Ihrer tatsächlichen Historie, bevor Sie von einer Einsatzbereitschaft für große Datenmengen ausgehen.
F: Wie reduziere ich die Token-Kosten?
Verwenden Sie lokale Embeddings, lassen Sie LLM-gestützte Komprimierung deaktiviert, sofern nicht benötigt, wählen Sie günstigere Modelle für Zusammenfassungen und halten Sie den injizierten Kontext begrenzt.
14. Glossar
| Bereich | Detail | Warum es wichtig ist |
|---|---|---|
| MCP | Model Context Protocol | Wie viele Agents externe Tools aufrufen. |
| BM25 | Lexikalisches Keyword-Ranking. | Gut für exakte Bezeichner und Fehler. |
| Vektorsuche | Semantische Ähnlichkeit über Embeddings. | Gut für bedeutungsbasierte Suche. |
| RRF | Reciprocal-rank fusion. | Kombiniert mehrere gerankte Listen. |
| Beobachtung | Erfasstes Agent-Ereignis. | Rohmaterial für das Gedächtnis. |
| Kompression | Umwandlung von Rohereignissen in strukturiertes Gedächtnis. | Kann synthetisch oder LLM-gestützt sein. |
| Konsolidierung | Umwandlung von Sitzungen in ein Gedächtnis höherer Ebene. | Erfordert genügend Daten und oft ein LLM. |
15. Alle Quellen und Links
Primärquellen
Issues und PRs
Community und Web
Interne Links
16. Tabelle zur Quellenzuordnung
| Bereich | Detail | Warum es wichtig ist |
|---|---|---|
| README und npm | Installation, unterstützte Agents, Ports, Benchmark-Behauptungen, Konfigurationsstruktur. | Primärquelle. |
| Quelldateien | Beobachten, Suchen, Kontext, Zusammenfassen, MCP, API-Architektur. | Primärquelle. |
| Benchmarks | Retrieval R@5/R@10 und Behauptungen zur Lebensdauer von coding-agent. | Benchmark-Quelle des Herstellers. |
| Issues/PRs | Parser, Nebenläufigkeit, Fallback, Import, Einschränkungen bei der Graph-Skalierung. | Kritisches Signal. |
| Community-Diskussion | Adoptions-Hype sowie Fragen zu veraltetem Speicher und Governance. | Sekundäres Signal. |
Get the Ultimate Antigravity Cheat Sheet
Join 5,000+ developers and get our exclusive PDF guide to mastering Gemini 3 shortcuts and agent workflows.
Related Guides
Humanizer Skill Guide
blader/humanizer: 29 AI-writing patterns, voice calibration, and a two-pass audit, all in one Claude Code skill.
Guides & FeaturesMastering Agent Skills
The open standard for portable AI agent expertise.
Guides & FeaturesAntigravity Workflows Guide
Create automation recipes with Turbo Mode and AgentKit 2.0.
Guides & FeaturesHow to Change Antigravity Themes
Customize themes, dark mode, icons, and color schemes.
Guides & FeaturesHow to Change Language
Switch Antigravity to Spanish, German, Japanese, and more.
Guides & FeaturesAntigravity Security Guide
Known vulnerabilities, safe settings, and hardening steps.
