Files
2026-06-04 00:04:22 +00:00

2.4 KiB

Hermes Memory Next Level — 60-Sekunden Pitch

Der Hook (5 Sekunden)

„Stellen Sie sich vor, Ihr KI-Assistent vergisst nie wieder, was Sie ihm vor drei Wochen beigebracht haben. Nicht weil das Kontextfenster größer wurde — sondern weil er ein Gehirn bekommen hat.“

Das Problem (15 Sekunden)

Jeder, der mit KI-Agenten arbeitet, kennt es: Nach 20 Minuten Conversation oder einem Session-Wechsel ist der Kontext weg. Tool-Konfigurationen, Projekt-Details, persönliche Präferenzen — alles vergessen. Der Nutzer muss dieselben Dinge immer wieder erklären. Das ist nicht nur frustrierend, es kostet Zeit und Geld.

Technisch passiert das, weil LLMs bei Token-Limits verlustbehaftete Zusammenfassungen machen. „Wir haben gerade Docker auf Port 8080 konfiguriert“ wird zu „Docker wurde erwähnt“. Der Zustand geht verloren.

Die Lösung (20 Sekunden)

Hermes Memory Next Level ist ein hierarchisches Memory-System für KI-Agenten. Statt flacher Key-Value-Speicherung nutzen wir vier Ebenen:

  1. Working Memory — Aktiver Kontext im Prompt, sofort verfügbar
  2. Short-Term Memory — Letzte Sessions in SQLite, schnell abrufbar
  3. Long-Term Memory — Vektor-Speicher mit semantischer Suche + Knowledge Graph für Beziehungen
  4. Archive — Vollständige Historie, komprimiert

Der Clou: Automatische Extraktion. Nach jeder Session analysiert ein Hintergrund-Prozess die Conversation, zieht Fakten heraus, klassifiziert sie (Präferenz? Projekt-State? Gelerntes Pattern?), verknüpft sie mit Entitäten und speichert sie strukturiert. Beim nächsten Start werden relevante Memories automatisch in den Prompt injiziert.

Der Unterschied (15 Sekunden)

Andere Lösungen? MemGPT und Mem0 sind großartig, aber sie sind separate Frameworks. Wir integrieren direkt in Hermes Agent als Plugin — ohne Core zu forken, ohne Cloud-Abhängigkeiten, alles lokal hostbar. SQLite für Kurzzeit, Qdrant/Chroma für Vektor-Suche, NetworkX für den Graph. Keine API-Kosten, keine Datenweitergabe.

Der Call-to-Action (5 Sekunden)

„Das ist kein Science-Fiction. Der Prototyp läuft. Wir reden hier von 32 Stunden Implementierung für einen Agenten, der sich Dinge merkt — statt sie zu vergessen.“


Technologie-Stack: Python, SQLite, Qdrant/Chroma, NetworkX, sentence-transformers Integration: Hermes Agent Memory Provider Plugin Lizenz: Open Source