Automatización

MemPalace, Milla Jovovich y lo que significa 'creado por' en 2026

10 de abril de 2026

El 6 de abril de 2026, Milla Jovovich — sí, esa Milla Jovovich — publicó un sistema de memoria IA en GitHub bajo su propia cuenta. En menos de 48 horas acumuló más de 7.000 estrellas, un supuesto 100% en LongMemEval, un hilo de X con 660k visualizaciones acusándola de grifter, y Ben Sigman (su cofundador, CEO de Bitcoin Libre) admitiendo públicamente que "la comunidad dev lo destrozó."

Yo programo con Claude Code todos los días. Tengo una opinión. No es la que usted ya ha leído diez veces.

Qué es MemPalace en realidad

Quite la capa de celebrity y el repositorio es algo real. MemPalace es un sistema de memoria IA offline con licencia MIT. ChromaDB para vectores, SQLite para el grafo, Llama local opcional. Un servidor MCP de 19 herramientas que se conecta con Claude Code, ChatGPT, Gemini, cualquier cosa que hable MCP. La idea central es casi aburrida de lo correcta que es: en lugar de pedirle a un LLM que resuma qué "vale la pena recordar" (Mem0, Zep, Letta), almacena las conversaciones de forma literal y deja que la búsqueda vectorial haga el trabajo. Sin impuesto de extracción. Sin resúmenes alucinados. Una arquitectura "Palace" con habitaciones, alas y armarios que mapea el método de los loci sobre la recuperación, y el README afirma que esta estructura por sí sola mejora el recall en un 34% sobre el almacenamiento plano.

Luego está AAAK — "AI-Authored Abbreviation Kit" — un dialecto de compresión con pérdida orientado a una reducción de tokens de 30x, legible por cualquier LLM de texto sin necesidad de un decodificador. Dos hooks de Claude Code guardan automáticamente cada 15 mensajes y ejecutan un volcado de emergencia antes de la compactación de contexto. pip install mempalace, listo.

Si usted ha estado construyendo con Claude Code, cada una de esas decisiones de diseño tiene sentido. El hook de guardado en precompact por sí solo es el tipo de cosa que uno construye después de la tercera vez que pierde una sesión que necesitaba.

La tabla de benchmarks

Sistema	LongMemEval	Coste	Notas
MemPalace (raw)	96,6%	$0	Cero API, solo local
MemPalace (hybrid + Haiku rerank)	100% → 98,4%	~céntimos	Revisado tras escrutinio
MemPalace (modo AAAK)	84,2%	$0	Regresión vs raw — README ahora lo admite
Mem0	~85%	Pago	Memorias extraídas por LLM
Zep	~85%	Pago	KG estilo Graphiti sobre Neo4j
Letta	N/A	$20–200/mes	Gestionado por agente

El número raw del 96,6% es real y reproducible desde el repo. El 100% no lo era. Una nota comunitaria en el hilo de X de Sigman — ahora fijada en todas partes — indica que el 100% utilizó "correcciones específicas para las 3 preguntas fallidas" más LLM reranking, con una puntuación held-out de 98,4%. El 100% de LoCoMo también utilizó top-k=50 superando el conteo de sesiones; la cifra honesta sin reranking fue del 88,9%.

Hay que reconocerle algo al equipo: el README ahora lo dice explícitamente. "Preferimos tener razón antes que impresionar" es la energía del mensaje de commit actual, y han agradecido a los críticos por su nombre en los agradecimientos. Eso no es poco.

La cronología de la controversia

5–6 de abril: El repositorio se publica. Sigman tuitea. Jovovich sube un reel de Instagram ("¿por qué no crear un Memory Palace virtual?"). Afirmación: el primer 100% en LongMemEval de la historia.
7 de abril: Página principal de HN. r/ContextEngineering lo recoge. 7k estrellas en 48 horas, eventualmente 23k+ según Cybernews.
7 de abril: El hilo de X con 660k visualizaciones aparece. Un comentarista de IA revisa el historial de git, encuentra que Jovovich tiene 7 commits en 2 días, alega un dev fantasma llamado "Lu," y califica todo el asunto de operación pagada. "Sé reconocer a un grifter desde lejos."
7 de abril: Brian Roemmele despliega MemPalace en su "Empresa Cero-Humanos" de 79 empleados. El bucle del meme se completa.
8 de abril: Sigman cede públicamente: "La comunidad dev lo destrozó." La afirmación del 100% se revisa al 96,6% raw. Cybernews publica el artículo "los devs no se lo creen". Las notas comunitarias se acumulan en los posts de Sigman describiendo la participación de Jovovich como "conceptual o promocional."
8–10 de abril: Reescrituras del README. Advertencias honestas sobre los benchmarks. Agradecimientos nominales a los críticos. Issues abiertos para el pinning de ChromaDB, una inyección de shell en los hooks, un segfault en macOS ARM64.

Aquí ocurrieron dos cosas distintas, y la mayoría de los comentarios las colapsan en una. La crítica a los benchmarks era correcta y el equipo la corrigió. La crítica de que "Milla no lo construyó de verdad" es donde se pone interesante, y donde discrepo con prácticamente todo el mundo.

La parte en la que tengo algo en juego

Soy un fundador en solitario. Mi cofundador escribe código que yo no soy capaz de escribir. Dirijo una agencia de SEO/AEO y entrego sistemas en producción — CRMs de Telegram sobre n8n, pipelines de contenido en LangGraph, enriquecimiento de outreach en frío en Python — y un porcentaje muy alto de las pulsaciones reales provienen de Claude Code. En mis mejores días soy un arquitecto, un revisor y una función de criterio. En mis peores días soy un tipo pegando stack traces en una ventana de chat. Ambos días producen entregables.

Así que cuando leo "Jovovich solo tiene 7 commits, por lo tanto no lo construyó", reconozco la forma del argumento de inmediato, porque es el mismo argumento que la gente usa para decirme a mí que no soy realmente un desarrollador.

La cuestión es esta. En 2026, "construido por" es un espectro, y la visión de la autoría desde git-blame es un artefacto de 2015. Si el criterio es "quien pulsó las teclas posee el trabajo," entonces la mitad del software en producción que se entrega ahora mismo está escrito de forma fantasma por los servidores de inferencia de Anthropic y todos deberíamos actualizar nuestro LinkedIn. Eso es obviamente absurdo. Las teclas ya no son donde está el valor. El valor está en saber qué construir, por qué, para quién, y cuándo parar.

¿Escribió Milla Jovovich personalmente el tokenizador de AAAK? Casi con toda certeza no. ¿Tuvo la frustración vivida de una power user que organizó archivos durante meses y vio cómo la IA fallaba al recuperarlos, luego leyó sobre el método de los loci y lo conectó con la búsqueda vectorial? Por todas las cuentas — la suya, la de Sigman, el reel de Instagram, la entrevista en RT donde se llama a sí misma "la arquitecta" — sí. Esa es una contribución real. En la era del vibe-coding, puede ser la contribución. Sigman programó la ingeniería. Claude Code implementó. Jovovich especificó y actuó como árbitro de criterio. Un tal "Lu" puede o no haber colaborado — la alegación del hilo de X no tiene fuentes y el equipo no lo ha confirmado, y honestamente, si hubo un cuarto contribuidor que debería estar en el README, eso es un problema de crédito, no un problema de legitimidad.

La parte que realmente me molesta es el marketing. "El primer 100% en LongMemEval de la historia" con asteriscos que solo se descubren después de que la comunidad dev los saca a la fuerza — esa es la forma del grift, y es la parte que le corresponde a Sigman. No el historial de git. La exageración.

Lo que MemPalace nos dice sobre el vibe-coding en 2026

Tres cosas, y son importantes si usted está construyendo algo ahora mismo.

1. El suelo se ha elevado, y el nuevo suelo sigue siendo más alto que el techo de la mayoría. Una actriz en activo con un interés secundario construyó, en colaboración con un ingeniero y una IA, un sistema de memoria que supera a Mem0 y Zep en el benchmark principal. No por poco. Por diez puntos. El stack ChromaDB + SQLite + Llama local no es exótico — es el tipo de cosa que un builder en solitario competente podría haber ensamblado en 2024. Nadie lo hizo. La combinación de Claude Code y una visión de producto clara proveniente de alguien que no es ingeniero está haciendo algo que el mercado de ingenieros puros no estaba haciendo, y las 23k estrellas son el mercado diciéndoselo.

2. Los benchmarks son marketing ahora. Trátelos como tal. Esta es la parte incómoda. LongMemEval es una evaluación de 500 preguntas con modos de fallo conocidos — el hecho de que "correcciones específicas para 3 preguntas fallidas" lo mueva del 98,4% al 100% indica que el test está saturado y que el delta en la cima es ruido. Cada vendedor en este espacio — Mem0, Zep, Letta, MemPalace — va a publicar un gráfico de benchmark donde ellos están en la cima. Su trabajo como builder es pasar sus propios datos por la herramienta y ver si recuerda lo que sus usuarios reales realmente dijeron. Probablemente haré esto con MemPalace para un proyecto de cliente la próxima semana; lo escribiré.

3. "Construido por" va a seguir rompiéndole los esquemas a la gente, y quienes se adapten primero ganarán. Si su identidad como builder depende de ser la persona que escribe el código, 2026 va a ser un año largo. Si su identidad es encuentro problemas que valen la pena resolver y los entrego, las herramientas están en el mejor momento de su historia. Milla Jovovich, de entre todas las personas posibles, acaba de demostrar el límite superior de esa segunda categoría a escala de celebrity de Hollywood. La lección para los fundadores B2B en DACH y la UE no es "contraten a una actriz." Es "el cuello de botella nunca fue el código."

Para qué lo usaría en la práctica

Concretamente, si estuviera integrando MemPalace en un proyecto esta semana — y lo estoy considerando para la IA de ventas de curtain.lt — esto es lo que haría:

Omitir AAAK por ahora. El propio README dice que produce regresión. El modo raw es el producto real.
Ejecutarlo en modo MCP contra un corpus de prueba de conversaciones reales de clientes (tengo logs de Slack y n8n de sobra) y medir la recuperación en preguntas que mi equipo hace en la práctica. No preguntas de LongMemEval. Preguntas reales.
Usar el hook PreCompact. Este solo vale la instalación si usted vive en Claude Code.
Estar pendiente del issue #110 abierto (la inyección de shell en los hooks) antes de colocarlo cerca de datos de producción. Licencia MIT más "primera semana de exposición pública" equivale a "lea el código antes de confiar en él."
No apostar un entregable de cliente en él hasta que la v3.1 se publique con la tabla de benchmarks honesta incorporada y los issues críticos cerrados.

La conclusión

MemPalace es una herramienta real con una contribución real, lanzada con benchmarks exagerados por un equipo que los corrigió bajo presión. Los críticos que forzaron la corrección le hicieron un favor al open source. Los críticos que decidieron que un "arquitecto" que no es ingeniero es automáticamente un fraude están combatiendo la guerra pasada.

En 2026, los builders interesantes serán quienes puedan mantener dos ideas en la cabeza al mismo tiempo: esta herramienta es genuinamente útil, y el marketing que la rodeaba fue deshonesto. Las dos. Al mismo tiempo. Sin colapsar en la exageración ni en el rechazo.

Ese es el músculo que vale la pena desarrollar. El código, cada vez más, se construye solo.

Si usted es fundador, CTO u operador tratando de entender qué significa el vibe-coding para su negocio — no como eslogan sino como modelo operativo — esa es la conversación que mantenemos en areza.digital cada semana. Ayudamos a empresas europeas a entregar sistemas IA en producción donde el código es cada vez más la parte barata. Reservar una llamada de descubrimiento de 30 minutos →

Fuentes:

Repositorio MemPalace: github.com/milla-jovovich/mempalace
Cybernews: "Milla Jovovich creates MemPalace AI memory tool with 'perfect score' on benchmark, but devs aren't buying it"
Bitcoin News: "Resident Evil Star Milla Jovovich Builds AI Memory Tool With Engineer Ben Sigman"
mempalace.tech, historia de origen y notas de benchmarks
RT: Entrevista a Jovovich sobre el encuadre de arquitecta
Notas comunitarias en el hilo de lanzamiento de Sigman en X (held-out 98,4%, LoCoMo 88,9%)

Escrito por Nikita Janochkin, fundador de areza.digital — un humano con una opinión firme, redactado con Claude Code, como todo lo demás por aquí. Última actualización 10 de abril de 2026.

Deja de perder leads por un sitio web lento

Reserva una auditoría de fricciones gratuita y descubre exactamente dónde pierde dinero tu sitio web.

Reservar llamada →