# Hermes Memory Next Level — 60-Sekunden Pitch

## Der Hook (5 Sekunden)

> „Stellen Sie sich vor, Ihr KI-Assistent vergisst nie wieder, was Sie ihm vor drei Wochen beigebracht haben. Nicht weil das Kontextfenster größer wurde — sondern weil er ein Gehirn bekommen hat.“

## Das Problem (15 Sekunden)

Jeder, der mit KI-Agenten arbeitet, kennt es: Nach 20 Minuten Conversation oder einem Session-Wechsel ist der Kontext weg. Tool-Konfigurationen, Projekt-Details, persönliche Präferenzen — alles vergessen. Der Nutzer muss dieselben Dinge immer wieder erklären. Das ist nicht nur frustrierend, es kostet Zeit und Geld.

Technisch passiert das, weil LLMs bei Token-Limits verlustbehaftete Zusammenfassungen machen. „Wir haben gerade Docker auf Port 8080 konfiguriert“ wird zu „Docker wurde erwähnt“. Der Zustand geht verloren.

## Die Lösung (20 Sekunden)

Hermes Memory Next Level ist ein hierarchisches Memory-System für KI-Agenten. Statt flacher Key-Value-Speicherung nutzen wir vier Ebenen:

1. **Working Memory** — Aktiver Kontext im Prompt, sofort verfügbar
2. **Short-Term Memory** — Letzte Sessions in SQLite, schnell abrufbar
3. **Long-Term Memory** — Vektor-Speicher mit semantischer Suche + Knowledge Graph für Beziehungen
4. **Archive** — Vollständige Historie, komprimiert

Der Clou: **Automatische Extraktion**. Nach jeder Session analysiert ein Hintergrund-Prozess die Conversation, zieht Fakten heraus, klassifiziert sie (Präferenz? Projekt-State? Gelerntes Pattern?), verknüpft sie mit Entitäten und speichert sie strukturiert. Beim nächsten Start werden relevante Memories automatisch in den Prompt injiziert.

## Der Unterschied (15 Sekunden)

Andere Lösungen? MemGPT und Mem0 sind großartig, aber sie sind separate Frameworks. Wir integrieren direkt in Hermes Agent als Plugin — ohne Core zu forken, ohne Cloud-Abhängigkeiten, alles lokal hostbar. SQLite für Kurzzeit, Qdrant/Chroma für Vektor-Suche, NetworkX für den Graph. Keine API-Kosten, keine Datenweitergabe.

## Der Call-to-Action (5 Sekunden)

> „Das ist kein Science-Fiction. Der Prototyp läuft. Wir reden hier von 32 Stunden Implementierung für einen Agenten, der sich Dinge merkt — statt sie zu vergessen.“

---

*Technologie-Stack: Python, SQLite, Qdrant/Chroma, NetworkX, sentence-transformers*
*Integration: Hermes Agent Memory Provider Plugin*
*Lizenz: Open Source*