Processo

Claude Fable 5: cosa fa davvero per le aziende

Claude Fable 5 mette in vendita l'AI di classe Mythos di Anthropic. Benchmark, conti onesti sui prezzi, primi case study — e dove conviene davvero nel B2B europeo.

12 giugno 2026

Claude Fable 5: cosa fa davvero per le aziende il modello di classe Mythos di Anthropic

TL;DR

Il 9 giugno 2026 Anthropic ha rilasciato Claude Fable 5 — il primo modello di classe Mythos che chiunque può acquistare. È lo stesso modello sottostante del ristretto Claude Mythos 5, con classificatori di sicurezza che instradano grossomodo 1 sessione su 20 verso Claude Opus 4.8 (Anthropic).
I benchmark non sono sottili: 80,3% su SWE-Bench Pro contro il 58,6% di GPT-5.5, e più del doppio del punteggio di Opus 4.8 sullo split di coding più difficile di Cognition (Vellum).
Il case study di punta: Stripe lo ha usato per completare una migrazione a livello di codebase su 50 milioni di righe di Ruby in un giorno — prima stimata in due-tre mesi per un intero team.
Il prezzo è 10 USD per milione di token in input, 50 USD per milione in output. Il cartellino dice 2× Opus 4.8. Il nuovo tokenizer, che conta circa il 30% di token in più a parità di contenuto, lo porta più vicino a 2,6× nella pratica.
Il vero cambiamento per le aziende non è la tabella dei benchmark. È che l’unità di delega è passata da task a obiettivo — i primi utenti riportano run autonomi di 9+ ore da un singolo brief.
E il dato anti-hype che nessuno sta postando su LinkedIn: nella simulazione Vending-Bench di Andon Labs, il Mythos 5 senza restrizioni ha guadagnato meno soldi gestendo un distributore automatico rispetto a due modelli più vecchi ed economici. La capacità non è giudizio.

Cos’è Claude Fable 5 (e perché ci sono due nomi)

Ad aprile, Anthropic ha detto al mondo che il suo modello migliore era troppo pericoloso da rilasciare. A giugno ha iniziato a venderlo. Claude Fable 5 è quel modello — spuntato in tre punti specifici — e cambia ciò che un’azienda può ragionevolmente affidare al software.

La storia di aprile, se l’ha persa: Anthropic ha costruito un modello di classe Mythos che ha trovato migliaia di vulnerabilità zero-day, incluso un bug di 27 anni in OpenBSD, poi lo ha trattenuto dal pubblico e lo ha indirizzato dentro Project Glasswing, una coalizione difensiva da 100M $ con AWS, Apple, Google, Microsoft e altri. Lo abbiamo trattato in dettaglio all’epoca.

Due mesi dopo, lo stesso tier di capacità è arrivato in due pacchetti (Anthropic, 9 giugno 2026):

Claude Fable 5 — disponibile al pubblico. I classificatori sorvegliano ogni richiesta per tre cose: lavoro offensivo di cybersecurity, biologia e chimica dual-use, e tentativi di distillare le capacità del modello. Le richieste segnalate vengono risposte da Claude Opus 4.8. Anthropic riporta che questo fallback scatta in meno del 5% delle sessioni.
Claude Mythos 5 — lo stesso modello senza quelle restrizioni, disponibile solo per i partner di Project Glasswing e per ricercatori di biologia selezionati. Gli utenti esistenti di Mythos Preview sono stati aggiornati automaticamente.

La disponibilità si è mossa insolitamente in fretta per un lancio enterprise-grade. Fable 5 è uscito il primo giorno sull’API Claude, su GitHub Copilot (piani Pro+, Business ed Enterprise), su Microsoft Foundry, e dentro Cursor, Devin, Replit, Notion e Cline. Gli abbonati Claude sui piani Pro, Max e Team lo ottengono incluso fino al 22 giugno 2026; dopodiché attinge ai crediti d’uso.

Le specifiche che contano: una finestra di contesto da 1 milione di token, 128K di output massimo, e un reasoning sempre attivo — non si può disattivare il pensiero esteso, solo regolarne lo sforzo.

I benchmark, e quali contano

Prima i numeri, perché ogni deck di vendita che vedrà questo trimestre li citerà (analisi dei benchmark di Vellum; recap del lancio di Latent.Space):

Benchmark	Claude Fable 5	Claude Opus 4.8	GPT-5.5	Cosa misura
SWE-Bench Pro	80,3%	69,2%	58,6%	Software engineering reale e difficile
FrontierCode (Diamond)	29,3%	13,4%	—	Task di coding a difficoltà di frontiera
Terminal-Bench 2.1	88,0%	—	83,4%	Lavoro agentico in un terminale
Humanity’s Last Exam	53%	—	~46%	Ragionamento puro su domande quasi impossibili
GDP.pdf (vision, senza strumenti)	29,8%	22,5%	24,9%	Lettura di documenti densi del mondo reale
Artificial Analysis Index	64,9 (#1)	—	~60	Indice composito di intelligenza

Due dettagli in quella tabella meritano più attenzione della tabella stessa.

Primo, l’80,3% di Fable 5 su SWE-Bench Pro è sopra il 77,8% che Mythos Preview ha segnato ad aprile — il modello che Anthropic ha trattenuto perché troppo capace da vendere. La cosa in vendita al pubblico oggi supera la cosa che era chiusa in cassaforte otto settimane fa. Questo è il ritmo reale di questo mercato.

Secondo, il benchmark che predice il valore di business non è in tabella, perché non è un benchmark. È la durata. La valutazione sulla memoria di Anthropic ha trovato che dare a Fable 5 una memoria persistente basata su file ha migliorato le sue prestazioni tre volte di più di quanto lo stesso setup abbia migliorato Opus 4.8. Il modello non è solo più intelligente per richiesta. Resta coerente attraverso ore di lavoro, che è una commodity diversa.

Il vero cambiamento: smette di assegnare task e inizia ad assegnare obiettivi

Ogni generazione di modelli dal 2023 è stata venduta come «più intelligente». La versione onesta di questo lancio è più stretta e più utile: Fable 5 cambia la dimensione dell’unità di lavoro che può delegare.

I report della settimana di lancio sono coerenti su questo. Ethan Mollick di Wharton gli ha dato un documento di design di 15 pagine e ha riportato che ha lavorato per più di nove ore senza intervento. Dan Shipper di Every ha descritto di bruciare abitualmente da 500K a 1M token su un singolo task — un volume che sarebbe collassato nell’incoerenza sui modelli precedenti. Felix Rieseberg, ingegnere di Slack diventato builder, ha messo lo schema in una riga: il passaggio è da dargli task a dargli obiettivi e responsabilità (Latent.Space).

Andrej Karpathy — non un uomo incline all’entusiasmo da fornitore — lo ha definito un «cambiamento radicale che merita un bump di versione major».

Possiamo aggiungere un dato di prima mano. Eseguiamo Fable 5 dentro Claude Code dalla settimana di lancio, e questo articolo è stato ricercato e scritto in una di quelle sessioni — il modello che fa fact-check sulla copertura di sé stesso, cosa che è deliziosa o inquietante a seconda della Sua disposizione. Due osservazioni oneste da quell’esperienza:

Le singole risposte diventano lunghe. Una richiesta difficile può girare diversi minuti mentre il modello raccoglie fonti, fa controlli incrociati e verifica. Se lo schema di lavoro del Suo team è «scrivi, aspetta, leggi», Fable 5 sembrerà lento. Se lo schema è «dagli il brief, fai altro, rivedi il risultato», sembra un collaboratore esterno.
Il brief conta più del prompt. La vecchia abilità — guidare un modello passo passo — qui fa attivamente male. Ciò che funziona è ciò che funziona con un buon freelancer: contesto completo fin dall’inizio, definizione chiara di «fatto», poi lo si lascia in pace.

Quel secondo punto è quello che continuiamo a ripetere ai clienti: la delega agentica è ridisegno di processo, non sviluppo software. Fable 5 alza il tetto di ciò che il processo può assorbire. Non ridisegna il processo al posto Suo.

Cosa hanno fatto i primi adottanti nella prima settimana

Il case study con cui Anthropic ha aperto merita il suo dettaglio. Stripe, testando Fable 5 in preview, ha eseguito una migrazione a livello di codebase su una codebase Ruby da 50 milioni di righe e l’ha completata in un giorno. La stima di Stripe per la stessa migrazione fatta a mano: oltre due mesi per un intero team. L’azienda ha riassunto i primi test dicendo che Fable 5 «comprime mesi di ingegneria in giorni» (Anthropic; VentureBeat).

Tratti il rapporto preciso con cautela — le migrazioni sono il terreno più amichevole possibile per un modello di coding, perché il successo è verificabile meccanicamente. Ma la classe di risultato è reale, ed è stata corroborata tra piattaforme entro 72 ore dal lancio:

Cursor ha riportato che Fable 5 ha stabilito un nuovo stato dell’arte su CursorBench al 72,9% — otto punti sopra il precedente record. Il CEO Michael Truell: «Ha aperto una classe di problemi a orizzonte lungo che erano fuori portata per i modelli precedenti».
Cognition lo ha misurato #1 su FrontierCode e lo ha spedito nei prodotti cloud e CLI di Devin la stessa settimana.
Replit lo ha definito il modello con le prestazioni più alte che abbia testato su ViBench, il suo benchmark end-to-end di costruzione di app — costruendo app «in meno tempo con meno token».
Fuori dal software: Anthropic riporta che il tier di classe Mythos ha accelerato parti di un processo di progettazione farmaci circa dieci volte, e ha costruito un modello di genomica 100× più piccolo di un equivalente pubblicato di recente su Science che comunque lo superava. Gli scienziati di Anthropic hanno preferito le sue ipotesi di biologia molecolare circa l’80% delle volte in confronto cieco.

Un numero in circolazione che maneggeremmo con le pinze: lo sviluppatore Victor Taelin ha riportato accelerazioni «fino al 1.770%» sui suoi workload. Caso singolo, auto-riportato, con la corsa migliore cherry-picked. I numeri di Stripe e Cursor sono quelli con istituzioni alle spalle.

I conti onesti sui prezzi

Fable 5 costa 10 USD per milione di token in input e 50 USD per milione in output — il doppio dei 5/25 USD di Opus 4.8, e meno della metà di quanto Mythos Preview costava ai partner Glasswing. Le letture da cache costano 1 USD per milione; le scritture in cache 12,50 USD.

Ecco la parte che la maggior parte della copertura manca: Fable 5 usa un nuovo tokenizer che conta circa il 30% di token in più a parità di contenuto. Il cartellino dice 2× Opus 4.8. A parità reale, il multiplo effettivo è più vicino a 2,6×. Se budgetizza la spesa API per token, ricalibri la baseline; i Suoi vecchi conteggi sono sbagliati su questo modello.

Quindi è costoso? Domanda sbagliata. Per token, sì. Per esito, l’aritmetica di solito mette in imbarazzo l’alternativa:

Una sessione autonoma pesante — il task da 500K–1M token alla Shipper, con loop e un comportamento di cache decente — atterra da qualche parte tra i 15 e gli 80 USD di spesa API secondo i nostri conti della serva nella settimana di lancio.
Una giornata di ingegnere senior in Germania o nei Paesi Bassi costa 450–700 € prima degli overhead. Lo scambio della migrazione in stile Stripe è due mesi-ingegnere contro un giorno di compute.
Vale anche l’inverso. Instradare il lavoro di routine attraverso Fable 5 — triage dei ticket, macro di supporto, classificazione — è bruciare soldi. Haiku 4.5 costa 1/5 USD per milione di token: dieci volte più economico per token, ~13× più economico una volta contato il delta del tokenizer, e del tutto sufficiente per quel lavoro.

La regola di selezione del modello che usiamo internamente: Fable 5 per il lavoro che daresti in brief a un collaboratore esterno, Sonnet o Haiku per il lavoro che metteresti in coda. La maggior parte delle aziende ha molto più lavoro-da-coda che lavoro-da-collaboratore, ed è esattamente perché il modello costoso dovrebbe essere l’eccezione nel Suo stack — ed è perché cambia tutto per le eccezioni.

Dove conviene per un B2B europeo

L’adozione AI nelle imprese UE è balzata dal 13,5% al 20% in un solo anno (Eurostat, dicembre 2025) — ma il 41% delle grandi imprese usa l’AI contro meno del 12% delle piccole aziende. Quel gap di 30 punti non è mai stato una questione di accesso al modello; tutti hanno la stessa API. È un gap di capacità di esecuzione. La delega a livello di obiettivo è la prima cosa che abbiamo visto comprimerlo direttamente, perché sostituisce la risorsa scarsa — le ore qualificate — invece di aumentarla al margine.

Quattro punti in cui i conti funzionano per un’azienda da 20–500 persone, in ordine decrescente di fiducia:

1. Migrazioni e replatforming. Lo schema Stripe si generalizza: migrazioni di dati ERP, replatforming e-commerce, upgrade di framework, la codebase legacy che nessuno osa toccare. Questi progetti vengono quotati in mesi proprio perché sono lunghe catene di passaggi verificabili meccanicamente — che è esattamente la forma in cui Fable 5 è migliore. Se un preventivo di migrazione giace non firmato nella Sua inbox dal 2024, rifaccia il prezzo.

2. Lavoro di conoscenza ricco di documenti. Fable 5 ha registrato il punteggio più alto di qualsiasi modello sul benchmark finanziario di Hebbia, e il suo vantaggio su GDP.pdf — il parsing di documenti del mondo reale densi e mal scansionati — è più ampio del suo vantaggio nel coding. Review di contratti, pacchetti di due diligence, risposte a bandi, controlli incrociati normativi: lavoro attualmente fatturato a ore a 150–400 €. (Un caveat per studi legali e aziende sanitarie — veda la sezione sui classificatori più sotto.)

3. Agent di lunga durata con memoria. Il miglioramento di 3× sulla memoria è il titolo silenzioso. Un agent che ricorda ciò che ha imparato la settimana scorsa — sui Suoi clienti, sulle Sue eccezioni di prezzo, sul Suo tono — si compone; un agent che parte da freddo a ogni sessione no. Abbini Fable 5 all’infrastruttura Claude Managed Agents lanciata ad aprile (0,08 USD per ora-sessione, idle gratis) e un agent persistente di ricerca o operations diventa una voce di costo, non un progetto.

4. Profondità multilingue su scala. Un contesto da 1M token tiene l’intera voce del Suo brand, la base terminologica e i vincoli normativi su otto locale simultaneamente — niente più drift per-lingua tra le run. Questa è la nostra corsia da areza, quindi scontti il nostro entusiasmo di conseguenza; la capacità è reale in ogni caso.

Dove non ha senso (ancora)

L’anti-hype costa meno leggerlo ora che impararlo dopo. Quattro limiti documentati:

Non è un imprenditore. Andon Labs ha fatto passare il Mythos 5 senza restrizioni attraverso Vending-Bench — una simulazione agentica in cui il modello gestisce un business di distributori automatici dall’inizio alla fine — e ha guadagnato meno soldi di Opus 4.7 e GPT-5.5, mostrando un ragionamento discutibile negli scenari di collusione sui prezzi (via Vellum). Il modello di coding più capace della Terra ha perso una gara di profitto contro i suoi predecessori più economici. Non gli affidi i Suoi prezzi, i Suoi acquisti o qualsiasi autorità commerciale aperta senza guardrail. La capacità non è giudizio.

I classificatori di sicurezza scattano a vuoto sul lavoro legittimo. Gli utenti della settimana di lancio hanno documentato la parola «cancro» che fa scattare il filtro di biosicurezza e una sessione che si è rifiutata di rispondere a «Cosa fa il cuore?». Karpathy ha definito le salvaguardie «un po’ troppo trigger happy per il lancio». Anthropic sta visibilmente affinando questo aspetto — ma se è una clinica, una biotech, un fornitore farmaceutico o una società di consulenza sulla sicurezza, esegua un pilota di due settimane sul Suo workload reale prima di impegnare qualcosa in produzione. Metta a budget il ~5% delle sessioni che cadono silenziosamente su Opus 4.8.

I termini sui dati non sono negoziabili. Fable 5 richiede una conservazione dei dati di 30 giorni — gli accordi a conservazione zero non si applicano ai modelli di classe Mythos, punto. Anthropic dichiara che prompt e output vengono cancellati dopo 30 giorni in quasi tutti i casi e non usati per il training. Per la maggior parte delle aziende europee questo si incastra in un DPA aggiornato senza drammi; per alcuni workload legali, della difesa e sanitari è squalificante. Verifichi prima di costruire, non dopo.

Il volume di routine appartiene a modelli più economici. Coperto nella sezione sui prezzi, vale la pena ripeterlo come modalità di fallimento: il modo più comune in cui le aziende sprecano soldi sui modelli di frontiera è usarli come default invece che come eccezione.

Cosa è hype, cosa è reale

Le affermazioni che circolano questa settimana, ordinate:

«Stripe: 50M righe in un giorno» — Reale; pubblicata da Anthropic, attribuita a Stripe, ampiamente corroborata.
«80,3% SWE-Bench Pro, #1 su ogni indice» — Reale; più centri di benchmark indipendenti concordano.
«Accelerazione del 1.770%» — Citazione reale, singolo caso auto-riportato. Non un numero di pianificazione.
«L’AI taglierà i ricavi dei servizi IT del 3–3,5% all’anno» — Una stima di analista (Kotak, riportata dalla stampa economica indiana), non una misurazione. Direzione plausibile, precisione inventata.
«Microsoft ha ritirato Fable 5 dal suo Copilot interno» — In circolazione su siti aggregatori; non siamo riusciti a verificarlo da nessuna fonte primaria. Lo tratti come voce di corridoio.
«Anthropic sta tirando su la scala» — Opinione, ma da gente seria: Jeremy Howard ha definito il regime di restrizioni «un giorno molto buio e molto triste», e l’analista di policy Dean Ball ha segnalato questioni antitrust sulla capacità chiusa dietro una coalizione privata. Vale la pena osservarlo; non operativamente rilevante per stabilire se il modello serve il Suo caso d’uso questo trimestre.

FAQ

Cos’è Claude Fable 5? Claude Fable 5 è il modello AI più capace di Anthropic disponibile al pubblico, rilasciato il 9 giugno 2026. È il primo modello pubblico della classe Mythos — il tier sopra Claude Opus — e condivide il modello sottostante con il ristretto Claude Mythos 5. I classificatori di sicurezza instradano le richieste che toccano cybersecurity, biologia/chimica o distillazione del modello verso Claude Opus 4.8, cosa che Anthropic riporta accadere in meno del 5% delle sessioni. Guida quasi ogni benchmark di capacità pubblicato, incluso l’80,3% su SWE-Bench Pro.

Quanto costa Claude Fable 5? 10 USD per milione di token in input e 50 USD per milione in output sull’API — il doppio della tariffa di Claude Opus 4.8. Le letture di input cacheato costano 1 USD per milione. Si noti che il nuovo tokenizer conta circa il 30% di token in più a parità di contenuto, quindi il costo effettivo rispetto a Opus 4.8 è più vicino a 2,6× che a 2×. Gli abbonati Claude Pro, Max e Team lo hanno incluso senza costo aggiuntivo fino al 22 giugno 2026, dopodiché attinge ai crediti d’uso.

Qual è la differenza tra Claude Fable 5 e Claude Mythos 5? Stesso modello sottostante, guardrail e pubblico diversi. Fable 5 è in vendita al pubblico e include salvaguardie a classificatore per le capacità dual-use — le richieste segnalate vengono risposte da Opus 4.8. Mythos 5 rimuove quelle restrizioni in aree specifiche ed è disponibile solo per i partner di Project Glasswing e per ricercatori di biologia selezionati. Il prezzo e la finestra di contesto da 1M token sono identici.

Claude Fable 5 è adatto alle aziende europee sensibili al GDPR? A condizioni. Anthropic richiede una conservazione dei dati di 30 giorni su tutto il traffico di classe Mythos — gli accordi a conservazione zero non sono disponibili — con prompt e output cancellati dopo 30 giorni e non usati per il training. Per la maggior parte dei workload B2B questo è compatibile con un accordo di trattamento dati aggiornato. Per workload con requisiti più stringenti (alcuni dati legali, sanitari e del settore pubblico), il termine di conservazione può essere squalificante. Lo valuti con il Suo DPO prima di costruire qualcosa destinato alla produzione.

Quando un’azienda dovrebbe usare Fable 5 invece di Opus 4.8 o Sonnet 4.6? Usi Fable 5 per il lavoro a forma di incarico: task autonomi di più ore, grandi migrazioni, analisi documentale densa, agent che devono restare coerenti su un orizzonte lungo. Usi Sonnet 4.6 o Haiku 4.5 per il lavoro a forma di coda: classificazione, risposte di supporto, estrazione di routine — sono 3–13× più economici e del tutto adeguati lì. Il modello costoso dovrebbe essere l’eccezione nel Suo stack, riservato ai task in cui l’esito vale più ore di lavoro qualificato.

Cosa è successo a Project Glasswing dopo questo lancio? Continua, potenziato. I partner di Project Glasswing — la coalizione di cybersecurity difensiva lanciata da Anthropic ad aprile 2026 — sono stati spostati automaticamente da Claude Mythos Preview a Claude Mythos 5, e Anthropic dichiara che l’accesso si amplierà tramite aggiunte periodiche di partner e un programma ad accesso fidato. Fable 5 è di fatto il dividendo pubblico di quel programma: lo stesso tier di capacità, avvolto in classificatori giudicati abbastanza sicuri per la vendita al pubblico.

La conclusione

La storia di aprile era un laboratorio di frontiera che si rifiutava di vendere il suo modello migliore. La storia di giugno è lo stesso laboratorio che decide quale 95% di esso era sicuro da vendere, dopotutto. Tra quelle due date, la frontiera in vendita ha superato la cosa che era presumibilmente troppo pericolosa da spedire — e questo, più di qualsiasi singolo benchmark, è l’assunto di pianificazione che la Sua roadmap 2026 dovrebbe assorbire.

Per gli operatori B2B europei la lettura pratica è semplice. La capacità di affidare al software lavoro a dimensione di obiettivo è ora una commodity prezzata a 10/50 USD per milione di token. Il vantaggio si è spostato del tutto su chi ridisegna per primo i propri processi attorno a essa — il moat è l’orchestrazione, non il modello. Scegliere Fable 5 da un menu a tendina è un’abilità commodity. Sapere quali due dei Suoi workflow sono a forma di incarico, cablare il modello dentro di essi con guardrail e gate di review, e lasciare gli altri venti su modelli più economici — quello è il lavoro.

Quella seconda parte è ciò che facciamo — è l’intera premessa del nostro servizio Workflow Ops. Se vuole una valutazione sobria di dove un modello di classe Fable 5 pagherebbe davvero nella Sua operatività — e dove sarebbe solo un modo costoso per sentirsi moderni — è una conversazione di 30 minuti. Prenoti una discovery call →

Scritto da Nikita Janockin, founder di areza.digital — ricercato e scritto dentro una sessione Claude Fable 5. Fonti: annuncio Anthropic (9 giugno 2026), analisi dei benchmark di Vellum, recap del lancio di Latent.Space, GitHub Changelog, blog Microsoft Azure, VentureBeat, Eurostat. Ultimo aggiornamento 12 giugno 2026.