Вместе с инженером Беном Сигманом они выкатили в опенсорс проект MemPalace, который выбил 100% на бенчмарке LongMemEval. Для сравнения: популярные коммерческие тулзы вроде Mem0 там нервно курят в стороне с их 30-45%.
Как пишет сама Милла в Instagram*, плоский векторный поиск по тысячам кусков текста превращает векторную БД в "склад, забитый хламом", где найти нужную деталь становится невозможно.
🏰 MemPalace использует принцип "Дворца памяти" (мнемотехника древних греков).
Вместо того чтобы заставлять нейронку сжимать текст и галлюцинировать, система сохраняет весь verbatim-текст (прямую речь), но жестко структурирует его на уровне метаданных в ChromaDB:
1️⃣
Wing (Крыло) — сущность (конкретный проект или человек).2️⃣
Hall (Зал) — тип памяти (факты, события, предпочтения).3️⃣
Room (Комната) — конкретный топик (например, auth-migration).4️⃣
Drawer (Ящик) — исходный чанк текста.Когда агент ищет инфу, система не делает слепой similarity search по всей базе. Она фильтрует: Крыло -> Зал -> Комната. За счет одной только этой иерархии метрика recall вырастает на 34%.
Что там под капотом:
▫️ Базовая версия выдает 96.6% recall на LongMemEval вообще без обращений к LLM API (чистый Python + ChromaDB + локальные эмбеддинги). Ноль затрат.
▫️ Гибридный режим (векторный поиск + LLM-реранкер на дешевом Claude Haiku) добивает метрику до 100%.
▫️ Никаких тяжелых графовых баз. Temporal Knowledge Graph реализован на обычном локальном SQLite.
▫️ Встроенный сжатый диалект
AAAK. Это символьный язык для агентов, который жмет контекст в 30 раз без потери смысла, чтобы не выжирать окно токенов при загрузке агента.Бен Сигман в своём X* справедливо гордится результатами и приглашает форкать репозиторий.
🔗 Код лежит тут: MemPalace
Дежурная справка для товарища майора:
Instagram принадлежит компании Meta, которая признана экстремистской организацией и запрещена в РФ.
Социальная сеть X заблокирована на территории РФ.
#годный_опенсорс
Комментарии
0Комментариев пока нет.
Войдите, чтобы участвовать в обсуждении.