Automatisierung

MemPalace, Milla Jovovich und was 'gebaut von' im Jahr 2026 bedeutet

10. April 2026

Am 6. April 2026 pushte Milla Jovovich — ja, die Milla Jovovich — unter eigenem Account ein KI-Memory-System auf GitHub. Innerhalb von 48 Stunden: 7.000+ Stars, eine behauptete 100-%-Bewertung auf LongMemEval, ein X-Thread mit 660.000 Aufrufen, der sie als Grifterin bezeichnet, und Ben Sigman (ihr Mitgründer, CEO von Bitcoin Libre), der öffentlich zugab: "Die Dev-Community hat es in der Luft zerrissen."

Ich shippe täglich mit Claude Code. Ich habe eine Meinung. Und zwar nicht die, die Sie schon zehnmal gelesen haben.

Was MemPalace eigentlich ist

Zieht man den Celebrity-Layer ab, bleibt ein reales Ding übrig. MemPalace ist ein MIT-lizenziertes, offline-fähiges KI-Memory-System. ChromaDB für Vektoren, SQLite für den Graphen, optionales lokales Llama. Ein 19-Tool MCP-Server, der sich in Claude Code, ChatGPT, Gemini und alles andere, das MCP spricht, einstecken lässt. Die Kernidee ist fast schon langweilig in ihrer Korrektheit: statt ein LLM zu fragen, was "es wert ist, erinnert zu werden" (wie Mem0, Zep, Letta), werden Gespräche verbatim gespeichert und die Arbeit dem Vektorsearch überlassen. Keine Extraktionsgebühr. Keine halluzinierten Zusammenfassungen. Eine "Palace"-Architektur mit Räumen, Flügeln und Abstellkammern bildet die Methode der Loci auf das Retrieval ab — laut README verbessert diese Struktur allein die Recall-Rate um 34 % gegenüber flacher Speicherung.

Dann gibt es noch AAAK — "AI-Authored Abbreviation Kit" — einen verlustbehafteten Kompressions-Dialekt, der auf 30-fache Token-Reduktion ausgelegt ist und von jedem Text-LLM ohne Decoder gelesen werden kann. Zwei Claude Code-Hooks sichern automatisch alle 15 Nachrichten und feuern einen Notfall-Dump kurz vor der Kontext-Komprimierung. pip install mempalace, fertig.

Wer mit Claude Code baut, erkennt jeden dieser Designentscheide sofort. Der Save-on-PreCompact-Hook allein ist genau das, was man entwickelt, nachdem man zum dritten Mal eine Session verloren hat, die man gebraucht hätte.

Die Benchmark-Tabelle

System	LongMemEval	Kosten	Hinweise
MemPalace (raw)	96,6 %	0 $	Kein API, nur lokal
MemPalace (hybrid + Haiku rerank)	100 % → 98,4 %	~Cents	Nach öffentlicher Prüfung korrigiert
MemPalace (AAAK-Modus)	84,2 %	0 $	Schlechter als raw — README gibt das inzwischen zu
Mem0	~85 %	Kostenpflichtig	LLM-extrahierte Memories
Zep	~85 %	Kostenpflichtig	Graphiti-Style KG auf Neo4j
Letta	N/A	20–200 $/Monat	Agent-managed

Die 96,6-%-raw-Zahl ist real und im Repo reproduzierbar. Die 100 % waren es nicht. Eine Community-Note auf Sigmans X-Post — inzwischen überall angepinnt — stellt klar, dass die 100 % mit "gezielten Fixes für die 3 fehlschlagenden Fragen" plus LLM-Reranking erzielt wurden, mit einem Held-out-Score von 98,4 %. Die LoCoMo-100-%-Angabe nutzte top-k=50, was die Anzahl der Sessions überschritt; der ehrliche Wert ohne Reranking lag bei 88,9 %.

Dem Team sei zugutegehalten: Das README sagt das inzwischen offen. "Wir möchten lieber recht haben als beeindrucken" ist die aktuelle Energie der Commit-Messages — und die Kritiker wurden namentlich in den Acknowledgments erwähnt. Das zählt.

Die Kontrovers-Chronologie

5.–6. April: Repo geht live. Sigman twittert. Jovovich postet ein Instagram-Reel ("why not create a virtual Memory Palace?"). Behauptung: erstmals 100 % auf LongMemEval.
7. April: HN-Titelseite. r/ContextEngineering springt an. 7.000 Stars in 48 Stunden, laut Cybernews am Ende 23.000+.
7. April: Der 660.000-Aufrufe-X-Thread erscheint. Ein KI-Kommentator durchforstet die Git-History, findet 7 Commits von Jovovich über 2 Tage, mutmaßt einen Ghost-Dev namens "Lu" und bezeichnet das Ganze als bezahlte Promotion. "Ich erkenne einen Grifter auf Kilometerdistanz."
7. April: Brian Roemmele deployt MemPalace in sein 79-Mitarbeiter-"Zero-Human Company". Der Meme-Loop ist geschlossen.
8. April: Sigman räumt öffentlich ein: "Die Dev-Community hat es in der Luft zerrissen." Die 100-%-Behauptung wird auf 96,6 % raw korrigiert. Cybernews bringt den Artikel "devs aren't buying it". Community-Notes häufen sich auf Sigmans Posts und bezeichnen Jovovichs Beteiligung als "konzeptionell oder promotionaler Natur."
8.–10. April: README-Überarbeitungen. Ehrliche Benchmark-Einschränkungen. Namentliche Danksagungen an die Kritiker. Offene Issues für ChromaDB-Pinning, eine Shell-Injection in den Hooks, einen macOS-ARM64-Segfault.

Hier sind zwei verschiedene Dinge passiert, und die meisten Kommentare werfen sie in einen Topf. Die Benchmark-Kritik war berechtigt — und das Team hat sie korrigiert. Die Kritik "Milla hat das gar nicht wirklich gebaut" ist der interessante Teil, und hier widerspreche ich so ziemlich jedem.

Der Teil, in dem ich selbst Haut im Spiel habe

Ich bin Solo-Founder. Mein Mitgründer schreibt Code, den ich nicht schreiben kann. Ich führe eine SEO/AEO-Agentur und shippe produktive Systeme — Telegram-CRMs auf n8n, Content-Pipelines in LangGraph, Cold-Outreach-Enrichment in Python — und ein großer Teil der tatsächlichen Tastatureingaben kommt von Claude Code. An meinen besten Tagen bin ich Architekt, Reviewer und Geschmacksfunktion. An meinen schlechten Tagen bin ich der Typ, der Stack Traces in ein Chatfenster einfügt. Beide Tage shippen.

Wenn ich lese "Jovovich hat nur 7 Commits, also hat sie es nicht gebaut", erkenne ich die Argumentationsstruktur sofort — denn dasselbe Argument benutzen Leute, um mir zu erklären, dass ich kein richtiger Entwickler bin.

Hier ist die Sache. Im Jahr 2026 ist "gebaut von" ein Spektrum, und die git-blame-Sicht auf Autorenschaft ist ein Artefakt aus 2015. Wenn der Maßstab lautet "wer die Tasten gedrückt hat, dem gehört die Arbeit", dann ist die Hälfte der heute in Produktion laufenden Software von Anthropics Inference-Servern geschrieben — und wir sollten alle unsere LinkedIn-Profile aktualisieren. Das ist offensichtlich absurd. Der Wert liegt nicht mehr bei den Tasten. Der Wert liegt darin, zu wissen, was man baut, warum, für wen, und wann man aufhört.

Hat Milla Jovovich den AAAK-Tokenizer persönlich geschrieben? Mit an Sicherheit grenzender Wahrscheinlichkeit nicht. Hatte sie den gelebten Frust einer Power-Userin, die monatelang Dateien organisiert und zugesehen hat, wie KI sie nicht abrufen konnte, dann über die Methode der Loci gelesen und die Verbindung zu Vektorsearch hergestellt? Nach allem, was bekannt ist — ihrer eigenen Aussage, Sigmans, dem Instagram-Reel, dem RT-Interview, in dem sie sich "the architect" nennt — ja. Das ist ein echter Beitrag. In der Vibe-Coding-Ära ist er möglicherweise der Beitrag. Sigman hat engineered. Claude Code hat implementiert. Jovovich hat spezifiziert und den Geschmackstest gemacht. Ein "Lu" mag mitgeholfen haben oder nicht — die Behauptung des X-Threads ist unbelegt und das Team hat sie nicht bestätigt. Und ehrlich gesagt: Wenn es einen vierten Contributor gäbe, der im README fehlt, wäre das ein Credit-Problem, kein Legitimitätsproblem.

Was mich tatsächlich stört, ist das Marketing. "Erstmals 100 % auf LongMemEval" mit Fußnoten, die man nur erfährt, nachdem die Dev-Community sie herausgeprügelt hat — das ist die Grift-Form, und das liegt bei Sigman. Nicht in der Git-History. Im Overclaim.

Was MemPalace uns über Vibe-Coding im Jahr 2026 sagt

Drei Dinge — und die sind relevant, wenn Sie gerade irgendetwas bauen.

1. Der Boden hat sich verschoben, und der neue Boden liegt immer noch über der Decke der meisten Menschen. Eine arbeitende Schauspielerin mit einem Nebeninteresse hat zusammen mit einem Engineer und einer KI ein Memory-System gebaut, das Mem0 und Zep im Headline-Benchmark schlägt. Nicht knapp. Um zehn Punkte. Der ChromaDB + SQLite + lokaler Llama-Stack ist nicht exotisch — er hätte von einem kompetenten Solo-Builder 2024 zusammengesetzt werden können. Niemand hat es getan. Die Kombination aus Claude Code und einer klaren Produktvision eines Nicht-Ingenieurs leistet etwas, das der rein-Engineering-getriebene Markt nicht geleistet hat — und die 23.000 Stars sind das Markt-Signal dafür.

2. Benchmarks sind heute Marketing. Behandeln Sie sie entsprechend. Das ist der unbequeme Teil. LongMemEval ist ein 500-Fragen-Eval mit bekannten Schwächen — dass "gezielte Fixes für 3 fehlschlagenden Fragen" Sie von 98,4 % auf 100 % bringen, zeigt Ihnen, dass der Test gesättigt ist und das Delta an der Spitze Rauschen ist. Jeder Anbieter in diesem Bereich — Mem0, Zep, Letta, MemPalace — wird einen Benchmark-Graphen veröffentlichen, bei dem er oben steht. Ihre Aufgabe als Builder ist es, Ihre eigenen Daten durch das Tool zu laufen und zu sehen, ob es sich erinnert, was Ihre tatsächlichen Nutzer tatsächlich gesagt haben. Ich werde das mit MemPalace wahrscheinlich nächste Woche für ein Client-Projekt machen und darüber schreiben.

3. "Gebaut von" wird weiterhin die Köpfe von Menschen zum Platzen bringen — und wer sich zuerst anpasst, wird gewinnen. Wenn Ihre Identität als Builder davon abhängt, derjenige zu sein, der den Code tippt, wird 2026 ein langes Jahr. Wenn Ihre Identität lautet ich finde lösungswürdige Probleme und shippe sie, dann sind die Tools so gut wie nie zuvor. Milla Jovovich hat — ausgerechnet sie — gerade die Obergrenze dieser zweiten Kategorie auf Hollywood-Celebrity-Niveau demonstriert. Die Lektion für B2B-Founder in DACH und EU ist nicht "stellen Sie eine Schauspielerin ein." Sie lautet: "Der Engpass war nie der Code."

Was ich damit tatsächlich machen würde

Konkret: Wenn ich MemPalace diese Woche in ein Projekt integrieren würde — und ich erwäge es für das Sales-KI-System von curtain.lt — würde ich folgendes tun:

AAAK vorerst weglassen. Das README selbst sagt, dass es schlechter abschneidet. Raw Mode ist das eigentliche Produkt.
Im MCP-Modus gegen ein Testkorpus echter Kundengespräche laufen lassen (Slack- und n8n-Logs habe ich genug) und das Retrieval anhand von Fragen messen, die mein Team tatsächlich stellt — nicht LongMemEval-Fragen. Echte.
Den PreCompact-Hook nutzen. Allein dafür lohnt sich die Installation, wenn man in Claude Code lebt.
Open Issue #110 (die Shell-Injection in den Hooks) im Auge behalten, bevor das System in die Nähe von Produktionsdaten kommt. MIT-Lizenz plus "erste Woche öffentlicher Nutzung" ergibt: Code lesen, bevor Sie ihm vertrauen.
Keinen Client-Deliverable darauf aufbauen, bis v3.1 mit der ehrlichen Benchmark-Tabelle und geschlossenen kritischen Issues erschienen ist.

Das Fazit

MemPalace ist ein echtes Tool mit einem echten Beitrag, das mit übertriebenen Benchmarks gestartet wurde — Benchmarks, die das Team unter Druck korrigiert hat. Die Kritiker, die die Korrektur erzwungen haben, haben Open Source einen Dienst erwiesen. Die Kritiker, die entschieden haben, dass ein nicht-ingenieurmäßiger "Architekt" automatisch ein Betrüger ist, kämpfen den letzten Krieg.

Im Jahr 2026 werden die interessanten Builder diejenigen sein, die zwei Ideen gleichzeitig im Kopf halten können: dieses Tool ist wirklich nützlich, und das Marketing darum war unehrlich. Beides. Gleichzeitig. Ohne in Hype oder Ablehnung zu kollabieren.

Das ist der Muskel, den es zu trainieren gilt. Der Code baut sich zunehmend selbst.

Wenn Sie Founder, CTO oder Operator sind und herausfinden möchten, was Vibe-Coding für Ihr Unternehmen bedeutet — nicht als Slogan, sondern als Betriebsmodell — dann ist das das Gespräch, das wir bei areza.digital jede Woche führen. Wir helfen europäischen Unternehmen dabei, produktive KI-Systeme zu shippen, bei denen der Code zunehmend der billige Teil ist. 30-minütigen Discovery Call buchen →

Quellen:

MemPalace-Repo: github.com/milla-jovovich/mempalace
Cybernews: "Milla Jovovich creates MemPalace AI memory tool with 'perfect score' on benchmark, but devs aren't buying it"
Bitcoin News: "Resident Evil Star Milla Jovovich Builds AI Memory Tool With Engineer Ben Sigman"
mempalace.tech — Origin Story und Benchmark-Hinweise
RT: Jovovich-Interview zum Architekt-Framing
Community-Notes auf Sigmans X-Launch-Thread (Held-out 98,4 %, LoCoMo 88,9 %)

Verfasst von Nikita Janochkin, Gründer von areza.digital — ein Mensch mit einer starken Meinung, entworfen mit Claude Code, wie alles hier. Zuletzt aktualisiert am 10. April 2026.

Hören Sie auf, Leads durch eine langsame Website zu verlieren

Buchen Sie ein kostenloses Reibungsaudit und sehen Sie genau, wo Ihre Website Geld verliert.

Gespräch buchen →