Automatisation

MemPalace, Milla Jovovich, et ce que 'créé par' signifie en 2026

10 avril 2026

Le 6 avril 2026, Milla Jovovich — oui, cette Milla Jovovich — a poussé un système de mémoire IA sur GitHub sous son propre compte. En 48 heures, le repo cumulait 7 000+ étoiles, un score de 100% revendiqué sur LongMemEval, un thread X à 660k vues la traitant de grifter, et Ben Sigman (son co-fondateur, CEO de Bitcoin Libre) qui admettait publiquement que "la communauté dev l'a mis en pièces."

Je ship avec Claude Code tous les jours. J'ai un avis. Ce n'est pas celui que vous avez déjà lu dix fois.

Ce qu'est vraiment MemPalace

Retirez la couche célébrité et le repo est une vraie chose. MemPalace est un système de mémoire IA hors ligne sous licence MIT. ChromaDB pour les vecteurs, SQLite pour le graphe, Llama local en option. Un serveur MCP à 19 outils qui se branche sur Claude Code, ChatGPT, Gemini, tout ce qui parle MCP. L'idée centrale est presque banale dans sa justesse : au lieu de demander à un LLM de résumer ce qui "vaut la peine d'être mémorisé" (Mem0, Zep, Letta), stocker les conversations verbatim et laisser la recherche vectorielle faire le travail. Pas de taxe d'extraction. Pas de résumés hallucinés. Une architecture "Palace" avec des salles, des ailes et des placards calque la méthode des loci sur la récupération, et le README revendique que cette structure seule améliore le rappel de 34% par rapport au stockage à plat.

Il y a aussi AAAK — "AI-Authored Abbreviation Kit" — un dialecte de compression avec perte présenté comme réduisant les tokens d'un facteur 30, lisible par n'importe quel LLM textuel sans décodeur. Deux hooks Claude Code sauvegardent automatiquement toutes les 15 messages et déclenchent un dump d'urgence avant la compaction de contexte. pip install mempalace, c'est fait.

Si vous construisez avec Claude Code, chacun de ces choix de conception fait mouche. Le hook save-on-precompact à lui seul, c'est le genre de chose qu'on construit après la troisième fois où l'on perd une session dont on avait besoin.

Le tableau de benchmark

Système	LongMemEval	Coût	Notes
MemPalace (raw)	96,6%	0$	Zéro API, local uniquement
MemPalace (hybrid + Haiku rerank)	100% → 98,4%	~centimes	Révisé après examen
MemPalace (mode AAAK)	84,2%	0$	Régresse par rapport au raw — le README l'admet désormais
Mem0	~85%	Payant	Mémoires extraites par LLM
Zep	~85%	Payant	KG style Graphiti sur Neo4j
Letta	N/A	20–200$/mois	Géré par agent

Le chiffre raw de 96,6% est réel et reproductible depuis le repo. Le 100% ne l'était pas. Une note communautaire sur le post X de Sigman — désormais épinglée partout — indique que le 100% utilisait "des correctifs ciblés pour les 3 questions échouées" plus un reranking par LLM, avec un score holdout de 98,4%. Le 100% sur LoCoMo utilisait similairement un top-k=50 dépassant le nombre de sessions ; le vrai chiffre sans reranking était 88,9%.

À leur crédit, le README le dit désormais clairement. L'énergie du dernier commit est "nous préférons avoir raison qu'être impressionnants", et ils ont remercié les critiques par leur nom dans les remerciements. Ce n'est pas rien.

La chronologie de la controverse

5–6 avril : Le repo est mis en ligne. Sigman tweete. Jovovich poste un reel Instagram ("pourquoi ne pas créer un Memory Palace virtuel ?"). Affirmation : premier 100% sur LongMemEval.
7 avril : Page frontale de HN. r/ContextEngineering s'en empare. 7k étoiles en 48 heures, finalement 23k+ selon Cybernews.
7 avril : Le thread X à 660k vues arrive. Un commentateur IA fouille l'historique git, constate que Jovovich a 7 commits sur 2 jours, allègue un dev fantôme nommé "Lu", qualifie tout ça d'opération rémunérée. "Je repère un grifter à des kilomètres."
7 avril : Brian Roemmele déploie MemPalace dans sa "Zero-Human Company" de 79 employés. La boucle du mème se referme.
8 avril : Sigman concède publiquement : "La communauté dev l'a mis en pièces." La revendication des 100% est révisée à 96,6% raw. Cybernews publie l'article "les devs n'y croient pas". Les notes communautaires s'accumulent sur les posts de Sigman, décrivant l'implication de Jovovich comme "conceptuelle ou promotionnelle".
8–10 avril : Réécritures du README. Avertissements honnêtes sur les benchmarks. Remerciements nommés aux critiques. Issues ouvertes pour le pinning ChromaDB, une injection shell dans les hooks, un segfault macOS ARM64.

Deux choses différentes se sont produites ici, et la plupart des commentaires les confondent en une seule. La critique des benchmarks était juste et l'équipe l'a corrigée. La critique "Milla n'a pas vraiment construit ça" est là où ça devient intéressant, et là où je suis en désaccord avec à peu près tout le monde.

La partie où j'ai quelque chose à perdre

Je suis un fondateur solo. Mon co-fondateur écrit du code que je ne saurais pas écrire. Je dirige une agence SEO/AEO et je ship des systèmes de production — des CRM Telegram sur n8n, des pipelines de contenu en LangGraph, de l'enrichissement cold outreach en Python — et un pourcentage énorme des vraies frappes au clavier vient de Claude Code. Mes bons jours, je suis architecte, reviewer, et fonction de goût. Mes mauvais jours, je suis un mec qui colle des stack traces dans une fenêtre de chat. Les deux jours livrent.

Alors quand je lis "Jovovich n'a que 7 commits, donc elle n'a pas construit ça", je reconnais la forme de l'argument immédiatement, parce que c'est le même argument qu'on utilise pour me dire que je ne suis pas vraiment développeur.

Voilà la réalité. En 2026, "construit par" est un spectre, et la vue git-blame de l'authorship est un artefact de 2015. Si le critère est "celui qui a tapé les touches est propriétaire du travail," alors la moitié des logiciels de production qui sortent en ce moment sont écrits par des fantômes, c'est-à-dire les serveurs d'inférence d'Anthropic, et on devrait tous mettre à jour nos LinkedIn. C'est évidemment absurde. Les touches ne sont plus là où se trouve la valeur. La valeur est dans savoir quoi construire, pourquoi, pour qui, et quand s'arrêter.

Milla Jovovich a-t-elle personnellement écrit le tokenizer AAAK ? Presque certainement pas. A-t-elle eu la frustration vécue d'une power user qui a organisé des fichiers pendant des mois et regardé l'IA échouer à les récupérer, puis a lu sur la méthode des loci et fait le lien avec la recherche vectorielle ? D'après tous les témoignages — le sien, celui de Sigman, le reel Instagram, l'interview RT où elle se qualifie d'"architecte" — oui. C'est une vraie contribution. À l'ère du vibe-coding, c'est peut-être la contribution. Sigman a ingénié. Claude Code a implémenté. Jovovich a spécifié et goûté. Un "Lu" a peut-être aidé ou non — l'allégation du thread X n'est pas sourcée et l'équipe ne l'a pas confirmée, et franchement, s'il y avait un quatrième contributeur qui devrait être dans le README, c'est un problème de crédits, pas un problème de légitimité.

Ce qui me dérange vraiment, c'est le marketing. "Premier 100% sur LongMemEval" avec des astérisques qu'on n'apprend qu'après que la communauté dev vous l'a arraché — voilà la forme du grift, et c'est la partie dont Sigman est responsable. Pas l'historique git. La surrevendication.

Ce que MemPalace nous dit sur le vibe-coding en 2026

Trois choses, et elles comptent si vous construisez quoi que ce soit en ce moment.

1. Le plancher a bougé, et le nouveau plancher est encore plus haut que le plafond de la plupart des gens. Une actrice en activité avec un intérêt secondaire a construit, en collaboration avec un ingénieur et une IA, un système de mémoire qui surpasse Mem0 et Zep sur le benchmark vedette. Pas de peu. De dix points. La stack ChromaDB + SQLite + Llama local n'est pas exotique — c'est le genre de chose qu'un builder solo compétent aurait pu assembler en 2024. Personne ne l'a fait. La combinaison de Claude Code et d'une vision produit claire venant d'une non-ingénieure fait quelque chose que le marché purement ingénieur ne faisait pas, et les 23k étoiles sont le marché qui vous le dit.

2. Les benchmarks sont du marketing désormais. Traitez-les comme tels. C'est la partie inconfortable. LongMemEval est un eval de 500 questions avec des modes d'échec connus — le fait que "des correctifs ciblés pour 3 questions échouées" vous fasse passer de 98,4% à 100% vous dit que le test est saturé et que le delta en haut est du bruit. Chaque vendor dans cet espace — Mem0, Zep, Letta, MemPalace — va publier un graphe de benchmark où il est en tête. Votre job en tant que builder est de faire passer vos propres données dans l'outil et de voir s'il se souvient de ce que vos vrais utilisateurs ont vraiment dit. Je ferai probablement ça avec MemPalace pour un projet client la semaine prochaine ; je le documenterai.

3. "Construit par" va continuer à faire exploser les cerveaux, et ceux qui s'adaptent en premier vont gagner. Si votre identité en tant que builder dépend d'être la personne qui tape le code, 2026 va être une longue année. Si votre identité est je trouve des problèmes qui valent la peine d'être résolus et je ship, les outils sont les meilleurs qu'ils aient jamais été. Milla Jovovich, de toutes les personnes, vient de démontrer la limite supérieure de cette deuxième catégorie à l'échelle d'une célébrité hollywoodienne. La leçon pour les fondateurs B2B en DACH et en UE n'est pas "recrutez une actrice." C'est "le goulot d'étranglement n'a jamais été le code."

Ce que j'utiliserais vraiment

Concrètement, si je devais intégrer MemPalace dans un projet cette semaine — et j'envisage de le faire pour l'IA commerciale de curtain.lt — voici ce que je ferais :

Sauter AAAK pour l'instant. Le README lui-même dit qu'il régresse. Le mode raw est le vrai produit.
Le faire tourner en mode MCP sur un corpus de test de vraies conversations clients (j'ai des logs Slack et n8n à foison) et mesurer la récupération sur des questions que mon équipe pose vraiment en pratique. Pas les questions LongMemEval. Les vraies.
Utiliser le hook PreCompact. Celui-ci vaut l'installation à lui seul si vous vivez dans Claude Code.
Garder un œil sur l'issue ouverte #110 (l'injection shell dans les hooks) avant de le mettre près de données de production. Licence MIT plus "première semaine d'exposition publique" égale "lisez le code avant de lui faire confiance."
Ne pas parier une livraison client dessus avant que la v3.1 soit sortie avec le tableau de benchmarks honnête intégré et les issues critiques fermées.

La conclusion

MemPalace est un vrai outil avec une vraie contribution, lancé avec des benchmarks surestimés par une équipe qui les a corrigés sous pression. Les critiques qui ont forcé la correction ont rendu service à l'open source. Les critiques qui ont décidé qu'un "architecte" non-ingénieur est automatiquement un fraudeur se battent contre la guerre d'avant.

En 2026, les builders intéressants seront ceux qui pourront tenir deux idées en tête en même temps : cet outil est genuinement utile, et le marketing autour de lui était malhonnête. Les deux. En même temps. Sans s'effondrer dans le hype ni dans le rejet.

C'est le muscle qui vaut la peine d'être développé. Le code, de plus en plus, se construit lui-même.

Si vous êtes fondateur, CTO ou opérateur en train de comprendre ce que le vibe-coding signifie pour votre business — pas comme un slogan mais comme un modèle opérationnel — c'est la conversation qu'on a chez areza.digital chaque semaine. Nous aidons les entreprises européennes à ship des systèmes IA de production où le code est de plus en plus la partie bon marché. Réserver un appel découverte de 30 minutes →

Sources :

Repo MemPalace : github.com/milla-jovovich/mempalace
Cybernews : "Milla Jovovich creates MemPalace AI memory tool with 'perfect score' on benchmark, but devs aren't buying it"
Bitcoin News : "Resident Evil Star Milla Jovovich Builds AI Memory Tool With Engineer Ben Sigman"
mempalace.tech origin story and benchmark notes
RT : interview de Jovovich sur le cadrage de l'architecte
Notes communautaires sur le thread X de lancement de Sigman (holdout 98,4%, LoCoMo 88,9%)

Rédigé par Nikita Janochkin, fondateur d'areza.digital — un humain avec une opinion forte, écrit avec Claude Code, comme tout le reste ici. Dernière mise à jour le 10 avril 2026.

Arrêtez de perdre des prospects à cause d'un site lent

Réservez un audit de friction gratuit et voyez exactement où votre site perd de l'argent.

Réserver un appel →