MemX: A Local-First Long-Term Memory System for AI Assistants

Das Paper stellt MemX vor, ein lokal-first Langzeitgedächtnissystem für KI-Assistenten, das in Rust implementiert ist und durch eine stabilitätsorientierte Abrufarchitektur mit hybrider Vektor- und Schlüsselwortsuche sowie einer Low-Confidence-Ablehnungsregel eine zuverlässige und erklärbare Speicherung ermöglicht.

Lizheng Sun

Veröffentlicht 2026-03-18
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

🧠 Das Problem: Der vergessliche Assistent

Stell dir vor, du hast einen sehr klugen, aber extrem vergesslichen persönlichen Assistenten. Er ist genial darin, Fragen sofort zu beantworten, aber sobald du das Gespräch beendest, vergisst er alles.

  • Du sagst ihm: „Ich trinke nur Bio-Kaffee."
  • Nächster Tag: „Was soll ich zum Kaffee trinken?"
  • Er: „Ich weiß es nicht mehr."

Das ist das Problem, das MemX lösen will. Es ist ein System, das diesem Assistenten ein echtes Langzeitgedächtnis gibt – und zwar so, dass die Daten lokal auf deinem eigenen Computer bleiben (keine Cloud, keine fremden Server), damit deine Privatsphäre geschützt ist.


🛠️ Wie funktioniert MemX? (Die drei Magier)

Stell dir MemX nicht als einen einzigen riesigen Bücherregal vor, sondern als ein Team aus drei Spezialisten, die zusammenarbeiten, um die richtige Antwort zu finden.

1. Der „Bedeutungs-Scanner" (Vektor-Suche)

Dieser Spezialist versteht die Idee hinter deiner Frage.

  • Analogie: Wenn du fragst: „Wie repariere ich das undichte Rohr?", sucht er nicht nach dem Wort „Rohr". Er sucht nach Konzepten wie „Wasser", „Leck", „Reparatur". Er versteht die Bedeutung, auch wenn du andere Wörter benutzt.
  • Technik: Er nutzt moderne KI-Modelle, um deine Frage in eine Art „Gedanken-Code" zu verwandeln und vergleicht ihn mit dem Gedächtnis.

2. Der „Wort-Schnüffler" (Keyword-Suche)

Dieser Spezialist ist pedantisch und sucht nach exakten Wörtern.

  • Analogie: Wenn du nach einem spezifischen Projektnamen suchst, wie „Projekt Alpha 2024", ist der Bedeutungs-Scanner vielleicht verwirrt. Der Wort-Schnüffler sucht aber genau nach diesen Buchstabenkombinationen.
  • Der Trick: MemX nutzt eine super-schnelle Datenbank (FTS5), die wie ein extrem schneller Index funktioniert. Ohne diesen Index würde die Suche bei 100.000 Notizen 3 Sekunden dauern – mit dem Index dauert es nur noch 0,003 Sekunden. Das ist wie der Unterschied zwischen einem Schneckentempo und einem Lichtstrahl.

3. Der „Schiedsrichter" (Die Fusion)

Jetzt haben wir zwei Listen mit potenziellen Antworten. Der Schiedsrichter (ein Algorithmus namens RRF) mischt diese Listen intelligent zusammen.

  • Er gibt nicht nur dem „Bedeutungs-Scanner" oder dem „Wort-Schnüffler" recht, sondern kombiniert die Stärken beider. So findet er die beste Antwort, egal ob sie durch Bedeutung oder durch exakte Wörter gefunden wurde.

🛡️ Der Sicherheitsgürtel: „Wenn ich es nicht weiß, sage ich es"

Das Coolste an MemX ist seine Vorsicht. Viele KI-Systeme halluzinieren (erfinden Dinge), wenn sie unsicher sind. MemX hat eine Low-Confidence-Rejection-Regel (eine Regel für geringes Vertrauen).

  • Die Analogie: Stell dir vor, du fragst deinen Assistenten: „Wie heißt der Präsident von Mars?"
  • Ein normaler Assistent würde vielleicht etwas Erfinden, um nicht dumm zu wirken.
  • MemX schaut in sein Gedächtnis. Wenn die beste Antwort nur eine schwache Ahnung ist (unter einem bestimmten Schwellenwert), sagt er: „Ich habe dazu nichts gespeichert. Ich weiß es nicht."
  • Das verhindert, dass der Assistent Lügen verbreitet. Er zieht es vor, leere Hände zu zeigen, als eine falsche Antwort zu geben.

📊 Was haben die Forscher herausgefunden? (Die Ergebnisse)

Die Forscher haben MemX an zwei Arten von Tests unterzogen:

  1. Der kleine Test (Alltagsszenario):

    • Hier war MemX extrem gut. Bei 91 % der Fragen fand es sofort die richtige Antwort.
    • Bei Fragen, auf die es keine Antwort gab, hat es sich fast immer zurückgehalten und nichts Falsches erfunden.
    • Ergebnis: Es ist stabil und zuverlässig für den täglichen Gebrauch.
  2. Der große Test (LongMemEval):

    • Hier wurde MemX mit riesigen Mengen an Daten (über 200.000 Notizen) getestet.
    • Wichtige Erkenntnis: Es kommt darauf an, wie man die Notizen speichert.
    • Wenn man ganze Gespräche als einen Block speichert, ist die Suche schlecht.
    • Wenn man die Gespräche in kleine, atomare Fakten zerlegt (z. B. „Ich mag Kaffee", „Ich mag Tee" statt „Ich mag Kaffee und Tee"), verdoppelt sich die Treffsicherheit!
    • Lektion: Je feiner die Granularität (je kleiner die Bausteine), desto besser findet das System die Nadel im Heuhaufen.

🚀 Warum ist das wichtig?

  • Datenschutz: Alles bleibt auf deinem Laptop. Keine Daten gehen an Google oder OpenAI.
  • Geschwindigkeit: Dank der cleveren Datenbank-Technik ist die Suche blitzschnell, selbst bei riesigen Mengen an Daten.
  • Ehrlichkeit: Der Assistent lügt nicht, wenn er nichts weiß.

Zusammenfassend: MemX ist wie ein sehr ordentlicher, diskreter und extrem schneller Bibliothekar, der in deinem Keller wohnt. Er weiß genau, wo jedes Buch steht, versteht, wonach du suchst, und gibt dir nur dann ein Buch, wenn er zu 100 % sicher ist, dass es das richtige ist. Wenn er unsicher ist, sagt er einfach: „Ich habe das Buch nicht."

Ertrinken Sie in Arbeiten in Ihrem Fachgebiet?

Erhalten Sie tägliche Digests der neuesten Arbeiten passend zu Ihren Forschungsbegriffen — mit technischen Zusammenfassungen, in Ihrer Sprache.

Digest testen →