
Каждый разработчик, использующий ИИ-агентов, сталкивался с этим: вы тратите час на объяснение архитектуры проекта, предпочтений и соглашений для Claude Code. Сессия заканчивается. Вы начинаете новую. И это снова чистый лист. Claude-Mem — это open-source плагин, который решает эту проблему, и он стал одним из самых популярных инструментов в экосистеме ИИ-кодинга. Мы изучили его на GitHub, Reddit, Twitter/X и в самом исходном коде — и вот наше исчерпывающее руководство.
Get the latest on AI, LLMs & developer tools
New MCP servers, model updates, and guides like this one — delivered weekly.
1. Почему это важно
Claude-Mem — один из плагинов с наибольшим количеством звезд в экосистеме Claude Code, с десятками тысяч звезд на GitHub, сотнями релизов и тысячами форков. Для плагина, который по сути добавляет память AI-агенту для написания кода, это невероятная популярность. Это не фреймворк и не библиотека — это поведенческая аугментация для Claude Code.
Почему это важно
AI-агенты по своей природе stateless — каждая сессия начинается с чистого листа. Но реальные проекты разработки длятся недели и месяцы. Каждое повторное объяснение тратит токены, время и создает риск того, что агент неправильно поймет то, что вы уже прояснили. Claude-Mem автоматически устраняет этот разрыв.
Проект построен преимущественно на TypeScript, с использованием JavaScript, Shell-скриптов, и HTML для своего веб-интерфейса. Он лицензирован под AGPL-3.0, что означает, что вы можете свободно использовать и изменять его, но производные работы, развернутые в сети, также должны иметь открытый исходный код.
2. История создания
Claude-Mem был создан Alex Newman, известный в сети как @thedotmack. Опыт Ньюмана охватывает AI Product Management, Solutions Architecture и Forward Deployed Engineering — сочетание, которое объясняет, почему claude-mem ощущается не как хобби-проект, а как полноценная production-инфраструктура.
Проект вырос из простого наблюдения: Claude Code невероятно мощный, но он воспринимает каждую сессию так, будто видит вас впервые. Ньюман создал claude-mem, чтобы решить собственную проблему — и сообщество разработчиков массово это поддержало.
Ключевой инсайт
Ньюман понял, что проблема была не в хранении воспоминаний — а в сжатии и извлечении их эффективном использовании. Сырые логи диалогов слишком объемны и расфокусированы. Claude-Mem использует сам AI для генерации семантических резюме того, что происходило в каждой сессии, а затем извлекает только релевантный контекст для следующей.
У проекта есть официальный аккаунт в X/Twitter (@Claude_Memory), сообщество в Discord, и даже официальный сайт claude-mem.ai с подробной документацией.
3. Проблема, которую он решает
Если вы пользовались Claude Code, Cursor или любым другим AI-агентом для написания кода дольше одного дня, вы знакомы с этой болью:
Проблема 1: Амнезия контекста
Вы объясняете архитектуру проекта, схему базы данных и соглашения по коду. Сессия завершается. Следующая сессия: “Что это за проект?” Каждый. Раз.
Проблема 2: Повторяющиеся решения
Вы решаете использовать определенный паттерн (например, “всегда использовать server actions, никогда — API routes”). В следующей сессии агент генерирует API routes, потому что не помнит ваши предпочтения.
Проблема 3: Потеря контекста багов
Вы потратили 30 минут на отладку сложного race condition. Исправление требовало понимания работы трех взаимодействующих сервисов. В следующей сессии агент предлагает именно тот подход, который вы уже пробовали и отвергли.
Проблема 4: Растрата токенов
Каждое повторное объяснение сжигает токены. Если вы используете тариф с оплатой по факту, стоимость восстановления контекста быстро накапливается за десятки ежедневных сессий.
Claude-Mem решает все четыре проблемы. Он работает незаметно в фоновом режиме, фиксируя то, что Claude делает (а не только то, что вы говорите), сжимая эти наблюдения в семантические резюме и внедряя релевантные данные в начало каждой новой сессии.
4. Как это работает
Claude-Mem работает через 6 основных компонентов, которые вместе создают бесшовный слой памяти:
| Компонент | Что он делает |
|---|---|
| 5 Lifecycle Hooks | SessionStart, UserPromptSubmit, PostToolUse, Stop, SessionEnd — фиксируют события на каждом этапе |
| Умная установка | Кэшируемая проверка зависимостей, запускаемая перед хуками (гарантирует готовность Bun, uv и зависимостей) |
| Воркер-сервис | HTTP API на порту 37777 с веб-интерфейсом и 10 эндпоинтами поиска под управлением Bun |
| База данных SQLite | Локально хранит сессии, наблюдения и сводки с поддержкой полнотекстового поиска FTS5 |
| Навык mem-search | Запросы на естественном языке с постепенным раскрытием информации для поиска по истории проекта |
| Векторная БД Chroma | Гибридный семантический поиск и поиск по ключевым словам для интеллектуального извлечения контекста |
Жизненный цикл
Вот что происходит во время типичной сессии:
1. Хук SessionStart
→ Запускается воркер-сервис (если он еще не запущен)
→ Извлекает релевантные прошлые наблюдения
→ Добавляет сжатый контекст в сессию
2. Хук UserPromptSubmit
→ Записывает запрос пользователя
3. Хук PostToolUse (запускается после КАЖДОГО вызова инструмента)
→ Фиксирует название инструмента + входные данные + результат
→ Сжимает наблюдения с помощью AI
→ Сохраняет в SQLite + векторную БД
4. Stop Hook
→ Фиксирует события приостановки сессии
5. SessionEnd Hook
→ Генерирует summary сессии
→ Сохраняет финальный snapshot контекста
Ключевая идея здесь заключается в том, что PostToolUse. Claude-Mem не просто записывает ваши сообщения — он фиксирует то, что агент делает: прочитанные файлы, написанный код, запущенные тесты, возникшие ошибки. Это дает гораздо более полное понимание состояния проекта, чем одни лишь логи диалогов.
5. Прогрессивное раскрытие
Это самый инновационный паттерн проектирования в claude-mem. Вместо того чтобы выгружать всю память в окно контекста (что привело бы к резкому росту расхода токенов), он использует 3-уровневую систему извлечения данных:
Уровень 1: Session Priming (<500 токенов)
→ Краткое резюме проекта
→ Ключевые решения последних сессий
→ Автоматически внедряется при SessionStart
Уровень 2: Поисковый индекс (~50-100 токенов на результат)
→ Компактные ID наблюдений + заголовки
→ Агент выполняет поиск, когда ему требуется больше контекста
→ Ровно столько, чтобы решить “релевантно ли это?”
Уровень 3: Полные сведения (~500-1000 токенов на результат)
→ Полное содержание наблюдения
→ Загружается ТОЛЬКО для релевантных ID
→ Агент явно запрашивает то, что ему нужно
Результат: экономия токенов ~10x по сравнению с подходом «выгружаем всё»
Именно эта архитектура делает claude-mem практичным при масштабировании. Без прогрессивного раскрытия системы памяти либо потребляют слишком много токенов (дорого, размывает фокус), либо извлекают слишком мало (теряется важный контекст). Трехуровневая система claude-mem позволяет агенту самому определять релевантность данных.
6. Инструменты поиска MCP
Claude-Mem предоставляет 4 инструмента MCP которые Claude может использовать для запросов к собственной памяти:
| Инструмент | Назначение | Стоимость в токенах |
|---|---|---|
search | Полнотекстовый поиск с фильтрами (type, date, project) | ~50-100 за результат |
timeline | Хронологический контекст вокруг конкретных наблюдений | ~100-200 за результат |
get_observations | Получение полных данных по ID наблюдений (пакетно) | ~500-1000 за результат |
Пример: Поиск по вашей памяти
search(query="ошибка аутентификации",
type="bugfix", limit=10)
// Step 2: Review index, identify relevant IDs
// e.g., observations #123, #456 look relevant
// Step 3: Fetch full details ONLY for those
get_observations(ids=[123, 456])
Этот рабочий процесс означает, что Claude расходует токены только на те наблюдения, которые ему действительно необходимы, а не на всё содержимое базы данных. Поисковый слой выступает в роли фильтра, а слой извлечения обеспечивает глубину.
7. Как установить
Claude-Mem предлагает три способа установки:
Вариант А: npx (рекомендуется)
Самый быстрый способ — одна команда:
npx claude-mem install
# Установка для Gemini CLI
npx claude-mem install --ide gemini-cli
Вариант Б: Магазин плагинов (внутри Claude Code)
/plugin marketplace add thedotmack/claude-mem
# Установить плагин
/plugin install claude-mem
Вариант C: OpenClaw Gateway
⚠️ Важное примечание
npm install -g claude-mem устанавливает только SDK/библиотеку — он не регистрирует хуки плагина и не настраивает сервис воркера. Всегда используйте npx claude-mem install или /plugin команды.
Системные требования
| Требование | Детали |
|---|---|
| Node.js | 18.0.0 или выше |
| Claude Code | Последняя версия с поддержкой плагинов |
| Bun | Среда выполнения JavaScript (устанавливается автоматически, если отсутствует) |
| uv | Менеджер пакетов Python для векторного поиска (устанавливается автоматически) |
| SQLite 3 | Для постоянного хранения данных (в комплекте) |
После установки перезапустите Claude Code или Gemini CLI. Контекст предыдущих сессий автоматически появится в новых — ручное вмешательство не требуется.
8. Подробный обзор ключевых функций
🧠 Постоянная память
Основная возможность: контекст сохраняется между сессиями. Когда вы начинаете новую сессию, Claude уже знает, над какими файлами вы работали, какие баги исправили, какие архитектурные решения приняли и какие паттерны предпочитаете.
🖥️ Интерфейс Web Viewer
Перейдите по адресу http://localhost:37777 в вашем браузере, чтобы увидеть поток памяти в реальном времени. Вы можете просматривать наблюдения, искать по истории и отслеживать, что фиксирует claude-mem. Viewer также предоставляет доступ к бета-функциям и переключению версий.
🔒 Контроль конфиденциальности
Оберните любой контент в <private> теги, чтобы исключить его из хранилища. API-ключи, учетные данные, личная информация — всё, что находится внутри этих тегов, никогда не сохраняется. Данные остаются полностью на вашем устройстве в SQLite.
🔗 Цитаты
Каждое наблюдение получает уникальный ID. Вы можете ссылаться на прошлые наблюдения по их ID и получать к ним доступ через http://localhost:37777/api/observation/{id}. точно почему Claude принял конкретное решение.
🧪 Бета-канал: Endless Mode
Экспериментальный “Endless Mode” реализует биомиметическую архитектуру памяти разработанную для длительных сессий, длящихся часами. Он использует иную стратегию сжатия, которая предотвращает переполнение контекстного окна во время марафонских сессий кодинга. Переключайтесь между стабильной и бета-версией в интерфейсе веб-вьювера.
⚙️ Конфигурация контекста
Настройки управляются в ~/.claude-mem/settings.json. Вы можете настроить модель ИИ для сжатия, порт воркера, директорию данных, уровень логирования, а также получить тонкий контроль над тем, какой контекст и когда внедряется.
9. Обзор архитектуры
Архитектура Claude-Mem's значительно эволюционировала на протяжении нескольких мажорных версий. Вот как взаимодействуют её компоненты:
┌─────────────────────────────────────┐
│ Сессия Claude Code │
│ │
│ SessionStart → PostToolUse → End │
└────────────────┬────────────────────┘
│ Хуки
▼
┌─────────────────────────────────────┐
│ Сервис воркера (Bun, порт 37777) │
│ │
│ ┌──────────┐ ┌──────────────────┐ │
│ │ Web UI │ │ 10 эндпоинтов API │ │
│ └──────────┘ └──────────────────┘ │
└────────────────┬────────────────────┘
│
▼
┌─────────────────────────────────────┐
│ Слой хранения │
│ │
│ ┌──────────────┐ ┌──────────────┐│
│ │ SQLite + FTS5 │ │ Chroma VecDB ││
│ │ (структурные) │ │ (семантика) ││
│ └──────────────┘ └──────────────┘│
└─────────────────────────────────────┘
Стратегия двух баз данных
Claude-Mem использует две базы данных совместно:
- SQLite с FTS5 — Для структурированных запросов, поиска по точному совпадению и фильтрации по времени. Быстрая, локальная, zero-config.
- Векторная база данных Chroma — Для семантического поиска по сходству. Когда Claude спрашивает: “что мы решили по поводу системы аутентификации?”, Chroma находит концептуально связанные наблюдения, даже если точные слова не совпадают.
Вместе они обеспечивают гибридный поиск: точные совпадения из SQLite и нечеткие/семантические совпадения из Chroma. Это тот же паттерн архитектуры поиска, который используется в продакшн-системах RAG, только миниатюризированный для локального использования.
10. Реакция сообщества
Мы изучили обсуждения в Reddit (r/ClaudeAI, r/ClaudeCode), Twitter/X и технических статьях. Вот консенсус сообщества:
Убийца “чистого листа”
Подавляющее большинство мнений на Reddit: claude-mem — лучшее решение проблемы “чистого листа”. Пользователи отмечают, что он значительно снижает трение при повторном объяснении архитектуры проекта, экономя время, токены и нервы. Множество веток на r/ClaudeCode описывают его как “must-have” плагин.
Дебаты об экономике токенов
Некоторые пользователи поначалу беспокоились о стоимости токенов — система активной памяти, которая сжимает наблюдения с помощью вызовов ИИ, сама по себе может потреблять токены. Консенсус сообщества: архитектура прогрессивного раскрытия (progressive disclosure) делает её выгодной в конечном итоге. Токены, сэкономленные на отсутствии необходимости повторно объяснять контекст, значительно превышают затраты на сжатие памяти.
Разделение на “Heavy” и “Lite”
Поскольку claude-mem — это полнофункциональная система (требующая Bun, Python для векторного поиска и фонового воркера), некоторые разработчики создали более легкие альтернативы, такие как claude-mem-lite и memsearch. Они используют более простые текстовые хранилища и минимизируют вызовы LLM. Сообщество рассматривает их как дополняющие друг друга: claude-mem для серьезных многонедельных проектов, а более легкие инструменты — для быстрых экспериментов.
Слой интеграции рабочих процессов
Продвинутые пользователи на Reddit описывают claude-mem как фундаментальный слой для кастомных рабочих процессов. Они создают специализированные “навыки” поверх него — объединяя постоянную память с пользовательскими правилами и специфическими знаниями предметной области для создания AI-агентов, которые глубоко понимают их конкретные проекты.
Вердикт сообщества
Claude-Mem широко считается лучшим в своем классе решением для постоянной памяти AI-агентов. Основная критика заключается в том, что система “тяжелая” — сложная структура с множеством зависимостей. Контраргумент: память — это сложная задача, а простые решения дают простые результаты.
11. Вердикт: стоит ли использовать Claude-Mem?
Наше мнение
Да, если вы используете Claude Code для многосессионных проектов. Claude-Mem — это лучшее в своем классе решение для постоянной памяти AI-агентов для кодинга. Архитектура прогрессивного раскрытия делает его эффективным по токенам, двойной поиск через SQLite + Chroma обеспечивает как точное, так и семантическое извлечение данных, а полностью автоматическая работа означает отсутствие ручных затрат.
Используйте его, если:
- Вы работаете над проектами, которые длятся несколько сессий (дни, недели, месяцы)
- Вы устали объяснять архитектуру проекта заново на каждой сессии
- Вы хотите, чтобы Claude помнил прошлые решения, исправления багов и отклоненные подходы
- Вас устраивает объем зависимостей (Node.js, Bun, Python для векторного поиска)
Пропустите его, если:
- Вы используете Claude Code только для быстрых разовых задач
- Вы предпочитаете минимум инструментов и отсутствие фоновых сервисов
- Вы используете Cursor или Windsurf (claude-mem работает только с Claude Code, Gemini CLI и OpenClaw)
- Хорошо поддерживаемого
CLAUDE.mdфайла достаточно для вашего рабочего процесса
12. Альтернативы и сравнение
Как claude-mem соотносится с другими подходами к реализации памяти для AI-агентов?
| Подход | Плюсы | Минусы |
|---|---|---|
| CLAUDE.md (вручную) | Простота, отсутствие зависимостей, полный контроль | Ручное обновление, отсутствие автоматического сбора данных, статичность |
| Claude-Mem | Автоматизация, семантический поиск, прогрессивное раскрытие, информативность | Сложная настройка, требует Bun + Python, фоновый сервис |
| claude-mem-lite | Легковесность, текстовый формат, меньше зависимостей | Отсутствие семантического поиска, более простое сжатие |
| Пользовательские скрипты | Полная кастомизация, отсутствие внешних зависимостей | Всё нужно делать самому, нет поддержки экосистемы |
| Встроенная Claude Memory | Нулевая настройка, нативная интеграция | Ограниченная область применения, отсутствие persistence для конкретного проекта |
Для большинства разработчиков, работающих над серьезными многосессионными проектами, claude-mem предлагает самый богатый набор функций. Для быстрых экспериментов или разработчиков, предпочитающих минимум инструментов, хорошо поддерживаемый файл CLAUDE.md в сочетании с файлом навыков (таким как Karpathy's skills) может быть достаточно.
13. Общая картина
От Stateless к Stateful агентам
Claude-Mem представляет собой сдвиг в том, как мы воспринимаем ИИ-агентов для написания кода. Первое поколение ИИ-помощников было stateless — каждое взаимодействие начиналось с чистого листа. Текущее поколение, с такими инструментами, как claude-mem, становится stateful — агентами, которые со временем накапливают знания о вашем проекте.
Это имеет глубокие последствия. Агент с состоянием не просто пишет код — он понимает вашу кодовую базу. Он знает, какие паттерны сработали, какие были отклонены и почему. Он помнит, что система аутентификации использует специфический формат токенов из-за ограничений прошлой миграции. Он помнит, что запросу к базе данных нужен определенный индекс, потому что две недели назад вы отлаживали проблему с производительностью.
Экосистема контекстной инженерии
Claude-Mem является частью более широкой “контекстной инженерии” экосистемы, которая стремительно развивается:
- CLAUDE.md / Rules files — Статический контекст (соглашения проекта, стандарты кодирования)
- Skills/Plugins — Поведенческие рекомендации (такие как файл навыков Карпати)
- Плагины памяти — Динамический контекст (claude-mem, история сессий)
- MCP серверы — Внешние знания (базы данных, API, документация)
Вместе эти уровни создают агентов, которые глубоко кастомизированы под конкретные проекты и разработчиков. Эра “vibe coding” с ее свободным, неструктурированным взаимодействием с ИИ эволюционирует в “agentic engineering” — дисциплинированную практику, где управление контекстом так же важно, как и сами промпты.
Что дальше
С выходом v12 claude-mem уже поддерживает Claude Code, Gemini CLI и шлюзы OpenClaw. Вектор развития указывает на универсальную память агентов — персистентный слой знаний, работающий в любых AI-инструментах для кодинга, редакторах или платформах. Токен $CMEM (токен на базе Solana, созданный сообществом и официально поддержанный автором) намекает на еще более амбициозные планы по обмену данными между агентами в реальном времени и совместной работе разработчиков.
14. Часто задаваемые вопросы
В: Работает ли claude-mem с Gemini CLI или только с Claude Code?
Claude-Mem поддерживает и Claude Code, и Gemini CLI. Для установки под Gemini CLI используйте команду 'npx claude-mem install --ide gemini-cli'. Также он работает со шлюзами OpenClaw.
В: Отправляет ли claude-mem мой код или данные в облако?
Нет. Все данные хранятся локально в базе данных SQLite по адресу ~/.claude-mem/claude-mem.db. Ничего не покидает ваш компьютер. HTTP API на порту 37777 также работает локально и не требует аутентификации.
В: Расходует ли claude-mem дополнительные токены?
Он использует токены для сжатия наблюдений, но архитектура прогрессивного раскрытия (progressive disclosure) обеспечивает чистую экономию. Токены, сэкономленные на том, что не нужно заново объяснять контекст в разных сессиях, значительно превышают затраты на сжатие.
В: Почему воркер не запускается или порт 37777 занят?
Проверьте, что использует порт, с помощью команды 'lsof -i :37777' и завершите процесс через 'kill -9 $(lsof -t -i:37777)'. Вы также можете изменить порт в файле ~/.claude-mem/settings.json.
В: В чем разница между claude-mem и CLAUDE.md?
CLAUDE.md — это статический файл, который вы ведете вручную для описания конвенций проекта. Claude-Mem работает автоматически: он захватывает, сжимает и извлекает контекст динамически. Они дополняют друг друга: используйте CLAUDE.md для правил, а claude-mem — для памяти.
В: Можно ли использовать claude-mem с Cursor или Windsurf?
Нет. Claude-Mem создан специально для системы плагинов и хуков Claude Code. Он также поддерживает Gemini CLI и шлюзы OpenClaw, но не поддерживает Cursor, Windsurf или другие IDE.
В: Что такое Endless Mode в claude-mem?
Endless Mode — это бета-функция, реализующая биомиметическую архитектуру памяти для многочасовых марафонских сессий кодинга. Она использует иную стратегию сжатия, чтобы предотвратить переполнение контекстного окна. Переключитесь на неё в интерфейсе Web Viewer UI.
15. Все источники & ссылки
При подготовке этой статьи использовалось исследование множества источников на GitHub, Reddit, Twitter/X, в веб-статьях и самом исходном коде. Вот все основные источники:
Основные источники
- GitHub: thedotmack/claude-mem — Репозиторий
- claude-mem.ai — Официальный сайт и документация
- Обзор архитектуры — Компоненты системы и потоки данных
- Документация по Progressive Disclosure — Философия прайминга контекста
- Руководство по Context Engineering — Принципы оптимизации AI-агентов
Сообщество и соцсети
- @Claude_Memory — Официальный аккаунт в X/Twitter
- Сообщество в Discord — Официальный сервер Discord
- Reddit r/ClaudeAI — Обсуждения сообщества по решениям для памяти ИИ
- Reddit r/ClaudeCode — Технические обсуждения архитектуры плагинов и управления токенами
Техническая документация
- Эволюция архитектуры — Путь развития от v3 до v5+
- Архитектура хуков — Как claude-mem использует хуки жизненного цикла
- Архитектура поиска — Гибридный поиск с использованием Chroma
- Руководство по инструментам поиска — Примеры использования инструментов MCP
Автор
- Алекс Ньюман (@thedotmack) — Создатель claude-mem
Похожие статьи на этом сайте
- Karpathy's CLAUDE.md Skills File: Полное руководство
- Karpathy's LLM Wiki: Полное руководство по его файлу идей
- Как настроить навыки в вашей AI IDE
- Полное руководство по системным промптам для AI-агентов
- Освоение навыков агентов
Get the Ultimate Antigravity Cheat Sheet
Join 5,000+ developers and get our exclusive PDF guide to mastering Gemini 3 shortcuts and agent workflows.