# Hermes Memory Next Level — 60-Sekunden Pitch ## Der Hook (5 Sekunden) > „Stellen Sie sich vor, Ihr KI-Assistent vergisst nie wieder, was Sie ihm vor drei Wochen beigebracht haben. Nicht weil das Kontextfenster größer wurde — sondern weil er ein Gehirn bekommen hat.“ ## Das Problem (15 Sekunden) Jeder, der mit KI-Agenten arbeitet, kennt es: Nach 20 Minuten Conversation oder einem Session-Wechsel ist der Kontext weg. Tool-Konfigurationen, Projekt-Details, persönliche Präferenzen — alles vergessen. Der Nutzer muss dieselben Dinge immer wieder erklären. Das ist nicht nur frustrierend, es kostet Zeit und Geld. Technisch passiert das, weil LLMs bei Token-Limits verlustbehaftete Zusammenfassungen machen. „Wir haben gerade Docker auf Port 8080 konfiguriert“ wird zu „Docker wurde erwähnt“. Der Zustand geht verloren. ## Die Lösung (20 Sekunden) Hermes Memory Next Level ist ein hierarchisches Memory-System für KI-Agenten. Statt flacher Key-Value-Speicherung nutzen wir vier Ebenen: 1. **Working Memory** — Aktiver Kontext im Prompt, sofort verfügbar 2. **Short-Term Memory** — Letzte Sessions in SQLite, schnell abrufbar 3. **Long-Term Memory** — Vektor-Speicher mit semantischer Suche + Knowledge Graph für Beziehungen 4. **Archive** — Vollständige Historie, komprimiert Der Clou: **Automatische Extraktion**. Nach jeder Session analysiert ein Hintergrund-Prozess die Conversation, zieht Fakten heraus, klassifiziert sie (Präferenz? Projekt-State? Gelerntes Pattern?), verknüpft sie mit Entitäten und speichert sie strukturiert. Beim nächsten Start werden relevante Memories automatisch in den Prompt injiziert. ## Der Unterschied (15 Sekunden) Andere Lösungen? MemGPT und Mem0 sind großartig, aber sie sind separate Frameworks. Wir integrieren direkt in Hermes Agent als Plugin — ohne Core zu forken, ohne Cloud-Abhängigkeiten, alles lokal hostbar. SQLite für Kurzzeit, Qdrant/Chroma für Vektor-Suche, NetworkX für den Graph. Keine API-Kosten, keine Datenweitergabe. ## Der Call-to-Action (5 Sekunden) > „Das ist kein Science-Fiction. Der Prototyp läuft. Wir reden hier von 32 Stunden Implementierung für einen Agenten, der sich Dinge merkt — statt sie zu vergessen.“ --- *Technologie-Stack: Python, SQLite, Qdrant/Chroma, NetworkX, sentence-transformers* *Integration: Hermes Agent Memory Provider Plugin* *Lizenz: Open Source*