areza.
Blog
MemPalace, Milla Jovovich e cosa significa 'creato da' nel 2026
Automazione

MemPalace, Milla Jovovich e cosa significa 'creato da' nel 2026

10 aprile 2026

Il 6 aprile 2026, Milla Jovovich — sì, quella Milla Jovovich — ha pubblicato un sistema di memoria AI su GitHub con il proprio account. In 48 ore: 7.000+ stelle, un presunto 100% su LongMemEval, un thread da 660k visualizzazioni su X che la accusava di essere una grifter, e Ben Sigman (il suo co-fondatore, CEO di Bitcoin Libre) che ammetteva pubblicamente: "la community dev lo ha fatto a pezzi."

Io distribuisco codice in produzione con Claude Code ogni giorno. Ho un'opinione. Non è quella che ha già letto dieci volte.

Cos'è davvero MemPalace

Tolto il livello celebrity, il repo è una cosa reale. MemPalace è un sistema di memoria AI offline con licenza MIT. ChromaDB per i vettori, SQLite per il grafo, Llama locale opzionale. Un MCP server a 19 tool che si collega a Claude Code, ChatGPT, Gemini, qualsiasi cosa parli MCP. L'idea centrale è quasi banale nella sua correttezza: invece di chiedere a un LLM di sintetizzare ciò che "vale la pena ricordare" (Mem0, Zep, Letta), memorizza le conversazioni verbatim e lascia che la vector search faccia il lavoro. Nessun extraction tax. Nessun riassunto allucinato. Un'architettura "Palace" con stanze/ali/armadi che mappa il metodo dei loci sul retrieval, e il README sostiene che questa struttura da sola migliora il recall del 34% rispetto allo storage piatto.

Poi c'è AAAK — "AI-Authored Abbreviation Kit" — un dialetto di compressione lossy pensato per una riduzione di token 30x, leggibile da qualsiasi LLM testuale senza decoder. Due hook di Claude Code salvano automaticamente ogni 15 messaggi e lanciano un dump di emergenza prima della compaction del contesto. pip install mempalace, fatto.

Se si lavora con Claude Code, ognuna di quelle scelte di design centra il bersaglio. Il hook save-on-precompact da solo è il tipo di cosa che si costruisce dopo la terza volta che si perde una sessione che serviva.

La Tabella dei Benchmark

SistemaLongMemEvalCostoNote
MemPalace (raw)96,6%$0Zero API, solo locale
MemPalace (hybrid + Haiku rerank)100% → 98,4%~centesimiRivisto dopo lo scrutinio
MemPalace (modalità AAAK)84,2%$0Regressione vs raw — il README ora lo ammette
Mem0~85%A pagamentoMemoria estratta da LLM
Zep~85%A pagamentoKG stile Graphiti su Neo4j
LettaN/A$20–200/meseGestito da agente

Il numero raw del 96,6% è reale e riproducibile dal repo. Il 100% non lo era. Una community note sul post X di Sigman — ora appuntata ovunque — afferma che il 100% ha usato "fix mirati per le 3 domande sbagliate" più LLM reranking, con uno score held-out di 98,4%. Il 100% di LoCoMo ha ugualmente usato top-k=50 superiore al numero di sessioni; il numero onesto senza rerank era 88,9%.

A credito del team, il README lo dice apertamente adesso. "Preferiamo avere ragione che fare impressione" è l'energia del commit message attuale, e hanno ringraziato i critici per nome nei ringraziamenti. Non è poco.

La Timeline della Controversia

  • 5–6 aprile: Il repo va live. Sigman twitta. Jovovich pubblica un reel su Instagram ("perché non creare un Memory Palace virtuale?"). Affermazione: primo 100% assoluto su LongMemEval.
  • 7 aprile: Prima pagina di HN. r/ContextEngineering lo raccoglie. 7k stelle in 48 ore, poi 23k+ secondo Cybernews.
  • 7 aprile: Il thread da 660k visualizzazioni arriva. Un commentatore AI scava la git history, trova che Jovovich ha 7 commit in 2 giorni, ipotizza un dev fantasma di nome "Lu", accusa l'intera operazione di essere a pagamento. "Riconosco un grifter da chilometri di distanza."
  • 7 aprile: Brian Roemmele distribuisce MemPalace nella sua "Zero-Human Company" da 79 dipendenti. Il loop del meme si completa.
  • 8 aprile: Sigman cede pubblicamente: "La community dev lo ha fatto a pezzi." Il claim del 100% viene rivisto a 96,6% raw. Cybernews pubblica il pezzo "i dev non ci credono". Le community note si accumulano sui post di Sigman descrivendo il coinvolgimento di Jovovich come "concettuale o promozionale."
  • 8–10 aprile: Riscritture del README. Caveat onesti sui benchmark. Ringraziamenti nominali ai critici. Issue aperte per il pinning di ChromaDB, una shell injection negli hook, un segfault su macOS ARM64.

Sono successe due cose distinte, e la maggior parte dei commenti le appiattisce in una sola. La critica ai benchmark era corretta e il team l'ha corretta. La critica "Milla non l'ha costruito davvero" è dove si fa interessante, ed è quella su cui dissento praticamente da tutti.

La Parte in cui Ho la Pelle in Gioco

Sono un founder solo. Il mio co-fondatore scrive codice che io non saprei scrivere. Gestisco un'agenzia SEO/AEO e distribuisco sistemi in produzione — CRM su Telegram con n8n, pipeline di contenuti in LangGraph, enrichment per cold outreach in Python — e una percentuale enorme dei keystrokes effettivi viene da Claude Code. Nei miei giorni migliori sono un architetto, un revisore e una funzione di gusto. Nei peggiori sono un tipo che incolla stack trace in una finestra di chat. Entrambi questi giorni producono output.

Quindi quando leggo "Jovovich ha solo 7 commit, dunque non l'ha costruita lei," riconosco immediatamente la forma dell'argomento, perché è lo stesso argomento che le persone usano per dirmi che non sono davvero uno sviluppatore.

Ecco il punto. Nel 2026, "built by" è uno spettro, e la visione dell'authorship basata su git-blame è un artefatto del 2015. Se lo standard è "chi ha premuto i tasti possiede il lavoro," allora metà del software in produzione distribuito adesso è ghost-written dai server di inferenza di Anthropic e dovremmo tutti aggiornare LinkedIn. È ovviamente assurdo. I tasti non sono più dove sta il valore. Il valore sta nel sapere cosa costruire, perché, per chi e quando fermarsi.

Ha Milla Jovovich scritto personalmente il tokenizer AAAK? Quasi certamente no. Ha avuto la frustrazione vissuta di una power user che ha organizzato file per mesi e ha visto l'AI non riuscire a recuperarli, poi ha letto del metodo dei loci e lo ha collegato alla vector search? Stando a ogni resoconto — il suo, quello di Sigman, il reel di Instagram, l'intervista con RT in cui si definisce "l'architetta" — sì. Quello è un contributo reale. Nell'era del vibe-coding, potrebbe essere il contributo. Sigman ha fatto l'ingegneria. Claude Code ha implementato. Jovovich ha specificato e fatto il taste-testing. Un "Lu" potrebbe o non potrebbe aver aiutato — l'accusa del thread X è priva di fonti e il team non l'ha confermata, e onestamente, se c'era un quarto collaboratore che dovrebbe stare nel README, quello è un problema di crediti, non di legittimità.

La parte che mi disturba davvero è il marketing. "Primo 100% assoluto su LongMemEval" con asterischi che si scoprono solo dopo che la community dev li estrae a forza — quella è la forma del grift, ed è la parte di cui Sigman è responsabile. Non la git history. L'overclaim.

Cosa ci Dice MemPalace sul Vibe-Coding nel 2026

Tre cose, e contano se si sta costruendo qualcosa adesso.

1. Il pavimento si è spostato, e il nuovo pavimento è ancora più alto del soffitto della maggior parte delle persone. Un'attrice con un interesse collaterale ha costruito, in collaborazione con un ingegnere e un'AI, un sistema di memoria che batte Mem0 e Zep sul benchmark principale. Non di poco. Di dieci punti. Lo stack ChromaDB + SQLite + Llama locale non è esotico — è il tipo di cosa che un builder competente avrebbe potuto assemblare nel 2024. Nessuno l'ha fatto. La combinazione di Claude Code e una visione di prodotto chiara da parte di un non-ingegnere sta facendo qualcosa che il mercato dei puri ingegneri non faceva, e le 23k stelle sono il mercato che lo conferma.

2. I benchmark sono marketing adesso. Trattateli come tali. Questa è la parte scomoda. LongMemEval è una eval di 500 domande con failure mode noti — il fatto che "fix mirati per 3 domande sbagliate" ti sposti da 98,4% a 100% dice che il test è saturo e il delta in cima è rumore. Ogni vendor in questo spazio — Mem0, Zep, Letta, MemPalace — pubblicherà un grafico di benchmark dove è in testa. Il suo compito come builder è far passare i propri dati reali attraverso il tool e vedere se ricorda quello che i suoi utenti reali hanno effettivamente detto. Lo farò probabilmente con MemPalace per un progetto cliente la settimana prossima; lo scriverò.

3. "Built by" continuerà a far esplodere la testa della gente, e chi si adatta per primo vincerà. Se la sua identità come builder dipende dall'essere la persona che digita il codice, il 2026 sarà un anno lungo. Se la sua identità è trovo problemi che vale la pena risolvere e li distribuisco, gli strumenti sono i migliori che siano mai esistiti. Milla Jovovich, di tutte le persone, ha appena dimostrato il limite superiore di quella seconda categoria su scala di celebrity hollywoodiana. La lezione per i founder B2B in DACH e nell'UE non è "assumi un'attrice." È "il collo di bottiglia non è mai stato il codice."

Cosa Userei Davvero

Concretamente, se dovessi distribuire MemPalace in un progetto questa settimana — e lo sto valutando per l'AI di vendita di curtain.lt — ecco cosa farei:

  • Saltare AAAK per ora. Il README stesso dice che produce una regressione. La modalità raw è il prodotto reale.
  • Eseguirlo in modalità MCP su un corpus di test di conversazioni reali con i clienti (ho log di Slack e n8n in abbondanza) e misurare il retrieval su domande che il mio team fa davvero nella pratica. Non le domande di LongMemEval. Quelle reali.
  • Usare il PreCompact hook. Vale l'installazione da solo se si vive su Claude Code.
  • Tenere d'occhio la issue aperta #110 (la shell injection negli hook) prima di metterlo vicino a dati di produzione. Licenza MIT più "prima settimana di esposizione pubblica" significa "leggi il codice prima di fidarti."
  • Non scommettere una consegna per un cliente su di esso finché non esce la v3.1 con la tabella onesta dei benchmark e le issue critiche chiuse.

La Conclusione

MemPalace è un tool reale con un contributo reale, lanciato con benchmark overclaimed da un team che li ha corretti sotto pressione. I critici che hanno forzato la correzione hanno reso un servizio all'open source. I critici che hanno deciso che un "architetto" non ingegnere è automaticamente un impostore stanno combattendo l'ultima guerra.

Nel 2026, i builder interessanti saranno quelli capaci di tenere due idee in testa contemporaneamente: questo tool è genuinamente utile, e il marketing attorno ad esso era disonesto. Entrambe. Allo stesso tempo. Senza collassare nell'hype o nel dismissal.

Questo è il muscolo che vale la pena allenare. Il codice, sempre di più, si costruisce da solo.

Se è un founder, CTO o operatore che cerca di capire cosa significa il vibe-coding per il suo business — non come slogan ma come modello operativo — questa è la conversazione che facciamo ogni settimana su areza.digital. Aiutiamo le aziende europee a distribuire sistemi AI in produzione dove il codice è sempre più la parte a basso costo. Prenota una chiamata conoscitiva di 30 minuti →


Fonti:

  • Repo MemPalace: github.com/milla-jovovich/mempalace
  • Cybernews: "Milla Jovovich creates MemPalace AI memory tool with 'perfect score' on benchmark, but devs aren't buying it"
  • Bitcoin News: "Resident Evil Star Milla Jovovich Builds AI Memory Tool With Engineer Ben Sigman"
  • mempalace.tech — storia di origine e note sui benchmark
  • RT: intervista a Jovovich sul framing da architetta
  • Community note sul thread X di lancio di Sigman (held-out 98,4%, LoCoMo 88,9%)

Scritto da Nikita Janochkin, fondatore di areza.digital — un umano con un'opinione forte, redatto con Claude Code, come tutto il resto qui. Ultimo aggiornamento 10 aprile 2026.

Smetti di perdere lead a causa di un sito lento

Prenota un audit di attrito gratuito e scopri esattamente dove il tuo sito perde denaro.

Prenota una chiamata →