diff --git a/docs/pitch-60sec.md b/docs/pitch-60sec.md new file mode 100644 index 0000000..2a2ca6b --- /dev/null +++ b/docs/pitch-60sec.md @@ -0,0 +1,36 @@ +# Hermes Memory Next Level — 60-Sekunden Pitch + +## Der Hook (5 Sekunden) + +> „Stellen Sie sich vor, Ihr KI-Assistent vergisst nie wieder, was Sie ihm vor drei Wochen beigebracht haben. Nicht weil das Kontextfenster größer wurde — sondern weil er ein Gehirn bekommen hat.“ + +## Das Problem (15 Sekunden) + +Jeder, der mit KI-Agenten arbeitet, kennt es: Nach 20 Minuten Conversation oder einem Session-Wechsel ist der Kontext weg. Tool-Konfigurationen, Projekt-Details, persönliche Präferenzen — alles vergessen. Der Nutzer muss dieselben Dinge immer wieder erklären. Das ist nicht nur frustrierend, es kostet Zeit und Geld. + +Technisch passiert das, weil LLMs bei Token-Limits verlustbehaftete Zusammenfassungen machen. „Wir haben gerade Docker auf Port 8080 konfiguriert“ wird zu „Docker wurde erwähnt“. Der Zustand geht verloren. + +## Die Lösung (20 Sekunden) + +Hermes Memory Next Level ist ein hierarchisches Memory-System für KI-Agenten. Statt flacher Key-Value-Speicherung nutzen wir vier Ebenen: + +1. **Working Memory** — Aktiver Kontext im Prompt, sofort verfügbar +2. **Short-Term Memory** — Letzte Sessions in SQLite, schnell abrufbar +3. **Long-Term Memory** — Vektor-Speicher mit semantischer Suche + Knowledge Graph für Beziehungen +4. **Archive** — Vollständige Historie, komprimiert + +Der Clou: **Automatische Extraktion**. Nach jeder Session analysiert ein Hintergrund-Prozess die Conversation, zieht Fakten heraus, klassifiziert sie (Präferenz? Projekt-State? Gelerntes Pattern?), verknüpft sie mit Entitäten und speichert sie strukturiert. Beim nächsten Start werden relevante Memories automatisch in den Prompt injiziert. + +## Der Unterschied (15 Sekunden) + +Andere Lösungen? MemGPT und Mem0 sind großartig, aber sie sind separate Frameworks. Wir integrieren direkt in Hermes Agent als Plugin — ohne Core zu forken, ohne Cloud-Abhängigkeiten, alles lokal hostbar. SQLite für Kurzzeit, Qdrant/Chroma für Vektor-Suche, NetworkX für den Graph. Keine API-Kosten, keine Datenweitergabe. + +## Der Call-to-Action (5 Sekunden) + +> „Das ist kein Science-Fiction. Der Prototyp läuft. Wir reden hier von 32 Stunden Implementierung für einen Agenten, der sich Dinge merkt — statt sie zu vergessen.“ + +--- + +*Technologie-Stack: Python, SQLite, Qdrant/Chroma, NetworkX, sentence-transformers* +*Integration: Hermes Agent Memory Provider Plugin* +*Lizenz: Open Source*