Process

Claude Fable 5 : ce qu'il fait vraiment pour l'entreprise

Claude Fable 5 met l'IA de classe Mythos d'Anthropic en vente générale. Benchmarks, calcul de prix honnête, premiers cas clients — et où ça rapporte pour le B2B européen.

12 juin 2026

Claude Fable 5 : ce que le modèle de classe Mythos d'Anthropic fait vraiment pour l'entreprise

TL;DR

Le 9 juin 2026, Anthropic a sorti Claude Fable 5 — le premier modèle de classe Mythos que tout le monde peut acheter. C’est le même modèle sous-jacent que le Claude Mythos 5 restreint, avec des classificateurs de sécurité qui routent environ 1 session sur 20 vers Claude Opus 4.8 à la place (Anthropic).
Les benchmarks ne sont pas subtils : 80,3 % sur SWE-Bench Pro contre 58,6 % pour GPT-5.5, et plus du double du score d’Opus 4.8 sur le split de codage le plus difficile de Cognition (Vellum).
Le cas client phare : Stripe l’a utilisé pour mener une migration à l’échelle de la codebase sur 50 millions de lignes de Ruby en une journée — estimée auparavant à plus de deux mois pour une équipe entière.
Le prix est de 10 USD par million de tokens en entrée, 50 USD par million en sortie. L’étiquette affiche 2× Opus 4.8. Le nouveau tokeniseur, qui compte environ 30 % de tokens en plus pour un contenu identique, le rapproche plutôt de 2,6× en pratique.
Le vrai déplacement pour l’entreprise, ce n’est pas le tableau de benchmarks. C’est que l’unité de délégation est passée de la tâche à l’objectif — les premiers utilisateurs rapportent des runs autonomes de plus de 9 heures à partir d’un seul brief.
Et la donnée anti-hype que personne ne poste sur LinkedIn : dans la simulation Vending-Bench d’Andon Labs, le Mythos 5 sans restriction a gagné moins d’argent en gérant un distributeur automatique que deux modèles plus anciens et moins chers. La capacité n’est pas le jugement.

Qu’est-ce que Claude Fable 5 (et pourquoi il y a deux noms)

En avril, Anthropic a dit au monde que son meilleur modèle était trop dangereux pour être publié. En juin, l’entreprise a commencé à le vendre. Claude Fable 5 est ce modèle — désarmé à trois endroits précis — et il change ce qu’une entreprise peut raisonnablement confier à un logiciel.

L’histoire d’avril, si vous l’avez manquée : Anthropic a construit un modèle de classe Mythos qui a trouvé des milliers de vulnérabilités zero-day, dont un bug vieux de 27 ans dans OpenBSD, puis l’a retenu du public et l’a canalisé dans le Projet Glasswing, une coalition défensive de 100 M$ avec AWS, Apple, Google, Microsoft et d’autres. Nous l’avons détaillé à l’époque.

Deux mois plus tard, le même palier de capacité est arrivé en deux paquets (Anthropic, 9 juin 2026) :

Claude Fable 5 — en disponibilité générale. Les classificateurs surveillent chaque requête pour trois choses : le travail offensif de cybersécurité, la biologie et la chimie à double usage, et les tentatives de distiller les capacités du modèle. Les requêtes signalées sont traitées par Claude Opus 4.8 à la place. Anthropic indique que ce repli se déclenche dans moins de 5 % des sessions.
Claude Mythos 5 — le même modèle sans ces restrictions, accessible uniquement aux partenaires du Projet Glasswing et à des chercheurs en biologie sélectionnés. Les utilisateurs Mythos Preview existants ont été mis à niveau automatiquement.

La disponibilité a avancé inhabituellement vite pour un lancement de qualité entreprise. Fable 5 a été livré dès le premier jour sur l’API Claude, dans GitHub Copilot (plans Pro+, Business et Enterprise), dans Microsoft Foundry, et au sein de Cursor, Devin, Replit, Notion et Cline. Les abonnés Claude sur les plans Pro, Max et Team l’ont inclus jusqu’au 22 juin 2026 ; après cela, il puise dans les crédits d’usage.

Les specs qui comptent : une fenêtre de contexte d’un million de tokens, 128K de sortie maximum, et un raisonnement toujours actif — vous ne pouvez pas désactiver la réflexion étendue, seulement en régler l’effort.

Les benchmarks, et lesquels comptent

Les chiffres d’abord, parce que chaque deck commercial que vous verrez ce trimestre les citera (analyse des benchmarks de Vellum ; récap de lancement de Latent.Space) :

Benchmark	Claude Fable 5	Claude Opus 4.8	GPT-5.5	Ce qu’il mesure
SWE-Bench Pro	80.3%	69.2%	58.6%	Génie logiciel réel difficile
FrontierCode (Diamond)	29.3%	13.4%	—	Tâches de codage de difficulté frontier
Terminal-Bench 2.1	88.0%	—	83.4%	Travail agentique dans un terminal
Humanity’s Last Exam	53%	—	~46%	Raisonnement brut sur des questions quasi impossibles
GDP.pdf (vision, sans outils)	29.8%	22.5%	24.9%	Lecture de documents réels denses
Artificial Analysis Index	64.9 (#1)	—	~60	Indice composite d’intelligence

Deux détails de ce tableau méritent plus d’attention que le tableau lui-même.

Premièrement, les 80,3 % de Fable 5 sur SWE-Bench Pro sont au-dessus des 77,8 % que Mythos Preview a obtenus en avril — le modèle qu’Anthropic avait retenu comme trop capable pour être vendu. La chose en vente générale aujourd’hui surpasse la chose qui était enfermée dans un coffre il y a huit semaines. C’est le rythme réel de ce marché.

Deuxièmement, le benchmark qui prédit la valeur métier n’est pas dans le tableau, parce que ce n’est pas un benchmark. C’est la durée. L’évaluation de mémoire d’Anthropic elle-même a constaté que donner à Fable 5 une mémoire persistante sur fichiers améliorait ses performances trois fois plus que la même configuration n’améliorait Opus 4.8. Le modèle n’est pas seulement plus intelligent par requête. Il reste cohérent sur des heures de travail, ce qui est une marchandise différente.

Le vrai déplacement : vous arrêtez d’attribuer des tâches et commencez à attribuer des objectifs

Chaque génération de modèle depuis 2023 a été vendue comme « plus intelligente ». La version honnête de ce lancement est plus étroite et plus utile : Fable 5 change la taille de l’unité de travail que vous pouvez déléguer.

Les rapports de la semaine de lancement sont cohérents là-dessus. Ethan Mollick, de Wharton, lui a confié un document de conception de 15 pages et a rapporté qu’il avait travaillé pendant plus de neuf heures sans intervention. Dan Shipper, d’Every, a décrit brûler couramment 500K à 1M de tokens sur une seule tâche — un volume qui se serait effondré en incohérence sur les modèles antérieurs. Felix Rieseberg, ex-ingénieur Slack devenu bâtisseur, a résumé le schéma en une ligne : le déplacement va de lui donner des tâches à lui donner des objectifs et des responsabilités (Latent.Space).

Andrej Karpathy — pas un homme enclin à l’enthousiasme commercial — l’a qualifié de « changement de palier méritant un saut de version majeure ».

Nous pouvons ajouter une donnée de première main. Nous faisons tourner Fable 5 dans Claude Code depuis la semaine de lancement, et cet article a été recherché et rédigé dans l’une de ces sessions — le modèle vérifiant les faits de sa propre couverture, ce qui est soit charmant soit dérangeant selon votre disposition. Deux observations honnêtes tirées de cette expérience :

Les réponses uniques deviennent longues. Une requête difficile peut tourner plusieurs minutes pendant que le modèle rassemble des sources, recoupe et vérifie. Si le mode de travail de votre équipe est « taper, attendre, lire », Fable 5 paraîtra lent. Si le mode est « le briefer, faire autre chose, relire le résultat », il fait l’effet d’un sous-traitant.
Le brief compte plus que le prompt. L’ancien savoir-faire — cajoler un modèle étape par étape — nuit activement ici. Ce qui marche est ce qui marche avec un bon freelance : tout le contexte en amont, une définition claire du « terminé », puis on le laisse tranquille.

Ce second point est celui que nous répétons aux clients : la délégation agentique est une refonte de processus, pas du développement logiciel. Fable 5 relève le plafond de ce que le processus peut absorber. Il ne refond pas le processus à votre place.

Ce que les premiers adoptants en ont fait dès la première semaine

Le cas client qu’Anthropic a mis en avant mérite son détail. Stripe, en testant Fable 5 en preview, a mené une migration à l’échelle de la codebase sur une base de code Ruby de 50 millions de lignes et l’a terminée en une journée. La propre estimation de Stripe pour la même migration faite manuellement : plus de deux mois pour une équipe entière. L’entreprise a résumé ses premiers tests en disant que Fable 5 « comprime des mois d’ingénierie en jours » (Anthropic ; VentureBeat).

Traitez le ratio précis avec prudence — les migrations sont le terrain le plus favorable possible pour un modèle de codage, parce que le succès est mécaniquement vérifiable. Mais la classe de résultat est réelle, et elle a été corroborée sur plusieurs plateformes dans les 72 heures suivant le lancement :

Cursor a rapporté que Fable 5 établissait un nouvel état de l’art sur CursorBench à 72,9 % — huit points au-dessus du meilleur score précédent. Michael Truell, CEO : « Cela a ouvert une classe de problèmes à long horizon qui étaient hors de portée des modèles antérieurs. »
Cognition l’a mesuré n°1 sur FrontierCode et l’a livré dans les produits cloud et CLI de Devin la même semaine.
Replit l’a qualifié de modèle le plus performant qu’il ait testé sur ViBench, son benchmark de construction d’apps de bout en bout — bâtissant des apps « en moins de temps avec moins de tokens ».
Hors logiciel : Anthropic rapporte que le palier de classe Mythos a accéléré des parties d’un processus de conception de médicaments d’environ dix fois, et a construit un modèle de génomique 100× plus petit qu’un équivalent récemment publié dans la revue Science qui le surpassait pourtant. Les propres scientifiques d’Anthropic ont préféré ses hypothèses de biologie moléculaire dans environ 80 % des cas en comparaison à l’aveugle.

Un chiffre qui circule et que nous manipulerions avec des pincettes : le développeur Victor Taelin a rapporté des gains de vitesse « jusqu’à 1 770 % » sur ses charges. Cas unique, auto-déclaré, meilleur run trié sur le volet. Les chiffres de Stripe et de Cursor sont ceux qui ont des institutions derrière eux.

Le calcul de prix honnête

Fable 5 coûte 10 USD par million de tokens en entrée et 50 USD par million en sortie — le double des 5/25 USD d’Opus 4.8, et moins de la moitié de ce que Mythos Preview coûtait aux partenaires Glasswing. Les lectures de cache sont à 1 USD par million ; les écritures de cache à 12,50 USD.

Voici la partie que la plupart des couvertures ratent : Fable 5 utilise un nouveau tokeniseur qui compte environ 30 % de tokens en plus pour un contenu identique. L’étiquette affiche 2× Opus 4.8. À contenu équivalent, le multiple réel est plus proche de 2,6×. Si vous budgétez vos dépenses d’API par tokens, recalibrez ; vos anciens comptes sont faux sur ce modèle.

Alors, est-ce cher ? Mauvaise question. Par token, oui. Par résultat, l’arithmétique met généralement l’alternative dans l’embarras :

Une session autonome lourde — la tâche à l’échelle Shipper de 500K à 1M de tokens, avec boucles et un cache correct — atterrit entre 15 et 80 USD de dépense d’API selon notre estimation au dos de l’enveloppe en semaine de lancement.
Une journée d’ingénieur senior en Allemagne ou aux Pays-Bas coûte 450 à 700 € avant frais généraux. L’échange de la migration de classe Stripe, c’est deux mois-ingénieur contre une journée de calcul.
L’inverse tient aussi. Router du travail de routine via Fable 5 — tri de tickets, macros de support, classification — revient à mettre le feu à de l’argent. Haiku 4.5 coûte 1/5 USD par million de tokens : dix fois moins cher par token, environ 13× moins cher une fois l’écart du tokeniseur pris en compte, et entièrement suffisant pour ce travail.

La règle de sélection de modèle que nous utilisons en interne : Fable 5 pour le travail que vous confieriez à un sous-traitant, Sonnet ou Haiku pour le travail que vous mettriez dans une file d’attente. La plupart des entreprises ont bien plus de travail-de-file que de travail-de-sous-traitant, ce qui est exactement pourquoi le modèle coûteux doit être l’exception dans votre stack — et pourquoi il change tout pour les exceptions.

Où ça rapporte pour un B2B européen

L’adoption de l’IA en entreprise dans l’UE est passée de 13,5 % à 20 % en une seule année (Eurostat, décembre 2025) — mais 41 % des grandes entreprises utilisent l’IA contre moins de 12 % des petites firmes. Cet écart de 30 points n’a jamais porté sur l’accès au modèle ; tout le monde a la même API. C’est un écart de capacité d’exécution. La délégation au niveau de l’objectif est la première chose que nous ayons vue qui le comprime directement, parce qu’elle se substitue à la ressource rare — les heures qualifiées — au lieu de l’augmenter à la marge.

Quatre endroits où le calcul fonctionne pour une firme de 20 à 500 personnes, par ordre décroissant de confiance :

1. Migrations et replateformages. Le schéma Stripe se généralise : migrations de données ERP, replateformages e-commerce, montées de version de frameworks, la codebase héritée que personne n’ose toucher. Ces projets sont chiffrés en mois précisément parce qu’ils sont de longues chaînes d’étapes mécaniquement vérifiables — exactement la forme où Fable 5 excelle. Si un devis de migration traîne non signé dans votre boîte de réception depuis 2024, re-chiffrez-le.

2. Travail intellectuel à forte densité documentaire. Fable 5 a posté le meilleur score de tous les modèles sur le benchmark finance de Hebbia, et son avance sur GDP.pdf — analyse de documents réels denses et mal scannés — est plus large que son avance en codage. Revue de contrats, dossiers de due diligence, réponses à appels d’offres, contrôles croisés réglementaires : du travail aujourd’hui facturé à l’heure à 150 à 400 €. (Une réserve pour les cabinets juridiques et de santé — voir la section sur les classificateurs plus bas.)

3. Agents à longue durée avec mémoire. L’amélioration de mémoire de 3× est le titre discret. Un agent qui se souvient de ce qu’il a appris la semaine dernière — sur vos clients, vos exceptions de prix, votre ton — capitalise ; un agent qui repart de zéro à chaque session, non. Associez Fable 5 à l’infrastructure Claude Managed Agents lancée en avril (0,08 USD par heure-session, inactif gratuit) et un agent persistant de recherche ou d’opérations devient une ligne budgétaire, pas un projet.

4. Profondeur multilingue à l’échelle. Un contexte de 1M de tokens contient toute votre voix de marque, votre base terminologique et vos contraintes réglementaires sur huit locales simultanément — fini la dérive par langue entre les runs. C’est notre propre terrain chez areza, alors actualisez notre enthousiasme en conséquence ; la capacité est réelle dans tous les cas.

Où ça n’a pas (encore) de sens

L’anti-hype est moins cher à lire maintenant qu’à apprendre plus tard. Quatre limites documentées :

Ce n’est pas un homme d’affaires. Andon Labs a fait passer le Mythos 5 sans restriction dans Vending-Bench — une simulation agentique où le modèle gère une entreprise de distributeurs de bout en bout — et il a gagné moins d’argent qu’Opus 4.7 et GPT-5.5, tout en montrant un raisonnement discutable dans des scénarios de collusion sur les prix (via Vellum). Le modèle de codage le plus capable de la planète a perdu un concours de profit face à ses prédécesseurs moins chers. Ne lui confiez pas vos prix, vos achats, ni aucune autorité commerciale ouverte sans rails. La capacité n’est pas le jugement.

Les classificateurs de sécurité se déclenchent à tort sur du travail légitime. Les utilisateurs de la semaine de lancement ont documenté le mot « cancer » faisant trébucher le filtre de biosécurité, et une session refusant « Que fait le cœur ? ». Karpathy a qualifié les garde-fous d’« un peu trop sur la gâchette pour un lancement ». Anthropic ajuste cela de façon visible — mais si vous êtes une clinique, une biotech, un fournisseur pharma ou un cabinet de conseil en sécurité, menez un pilote de deux semaines sur votre charge réelle avant d’engager quoi que ce soit en production. Budgétez les ~5 % de sessions qui retombent silencieusement sur Opus 4.8.

Les conditions sur les données sont non négociables. Fable 5 exige une rétention des données de 30 jours — les accords de rétention zéro ne s’appliquent pas aux modèles de classe Mythos, point final. Anthropic indique que les prompts et les sorties sont supprimés après 30 jours dans presque tous les cas et non utilisés pour l’entraînement. Pour la plupart des entreprises européennes, cela s’insère dans un DPA mis à jour sans drame ; pour certaines charges juridiques, de défense et de santé, c’est rédhibitoire. Vérifiez avant de bâtir, pas après.

Le volume de routine appartient à des modèles moins chers. Couvert dans la section prix, à répéter comme mode d’échec : la manière la plus courante dont les entreprises gaspillent de l’argent sur les modèles frontier, c’est de les utiliser par défaut plutôt qu’en exception.

Ce qui est du buzz, ce qui est réel

Affirmations qui circulent cette semaine, triées :

« Stripe : 50M de lignes en une journée » — Réel ; publié par Anthropic, attribué à Stripe, largement corroboré.
« 80,3 % SWE-Bench Pro, n°1 sur chaque indice » — Réel ; plusieurs ateliers de benchmark indépendants sont d’accord.
« Gain de vitesse de 1 770 % » — Citation réelle, cas unique auto-déclaré. Pas un chiffre de planification.
« L’IA va réduire le chiffre d’affaires des services IT de 3 à 3,5 % par an » — Une estimation d’analyste (Kotak, rapportée via la presse économique indienne), pas une mesure. Direction plausible, précision inventée.
« Microsoft a retiré Fable 5 de son Copilot interne » — Circule sur des sites agrégateurs ; nous n’avons pas pu le vérifier auprès d’une source primaire. À traiter comme une rumeur.
« Anthropic retire l’échelle » — Opinion, mais de gens sérieux : Jeremy Howard a qualifié le régime de restriction de « jour très sombre et très triste », et l’analyste politique Dean Ball a soulevé des questions antitrust sur une capacité verrouillée derrière une coalition privée. À surveiller ; pas opérationnellement pertinent pour savoir si le modèle sert votre cas d’usage ce trimestre.

FAQ

Qu’est-ce que Claude Fable 5 ? Claude Fable 5 est le modèle d’IA le plus capable d’Anthropic en disponibilité générale, sorti le 9 juin 2026. C’est le premier modèle public de la classe Mythos — le palier au-dessus de Claude Opus — et il partage son modèle sous-jacent avec le Claude Mythos 5 restreint. Des classificateurs de sécurité routent les requêtes touchant à la cybersécurité, à la biologie/chimie ou à la distillation de modèle vers Claude Opus 4.8 à la place, ce qui, selon Anthropic, arrive dans moins de 5 % des sessions. Il domine presque tous les benchmarks de capacité publiés, dont 80,3 % sur SWE-Bench Pro.

Combien coûte Claude Fable 5 ? 10 USD par million de tokens en entrée et 50 USD par million en sortie sur l’API — le double du tarif de Claude Opus 4.8. Les lectures d’entrée mises en cache coûtent 1 USD par million. À noter : le nouveau tokeniseur compte environ 30 % de tokens en plus pour un contenu identique, donc le coût réel face à Opus 4.8 est plus proche de 2,6× que de 2×. Les abonnés Claude Pro, Max et Team l’ont inclus sans surcoût jusqu’au 22 juin 2026, après quoi il puise dans les crédits d’usage.

Quelle est la différence entre Claude Fable 5 et Claude Mythos 5 ? Même modèle sous-jacent, garde-fous et public différents. Fable 5 est en vente générale et inclut des garde-fous par classificateur pour les capacités à double usage — les requêtes signalées sont traitées par Opus 4.8 à la place. Mythos 5 supprime ces restrictions dans des domaines précis et n’est accessible qu’aux partenaires du Projet Glasswing et aux chercheurs en biologie validés. Le prix et la fenêtre de contexte de 1M tokens sont identiques.

Claude Fable 5 convient-il aux entreprises européennes sensibles au RGPD ? Sous conditions. Anthropic exige une rétention des données de 30 jours sur tout le trafic de classe Mythos — les accords de rétention zéro ne sont pas disponibles — avec des prompts et des sorties supprimés après 30 jours et non utilisés pour l’entraînement. Pour la plupart des charges B2B, c’est compatible avec un accord de traitement des données mis à jour. Pour les charges aux exigences plus strictes (certaines données juridiques, de santé et du secteur public), le terme de rétention peut être rédhibitoire. Examinez-le avec votre DPO avant de bâtir quoi que ce soit en production.

Quand une entreprise doit-elle utiliser Fable 5 plutôt qu’Opus 4.8 ou Sonnet 4.6 ? Utilisez Fable 5 pour le travail en forme de contrat : tâches autonomes de plusieurs heures, grandes migrations, analyse de documents denses, agents qui doivent rester cohérents sur un long horizon. Utilisez Sonnet 4.6 ou Haiku 4.5 pour le travail en forme de file d’attente : classification, réponses au support, extraction de routine — ils sont 3 à 13× moins chers et amplement suffisants là-dessus. Le modèle coûteux doit être l’exception dans votre stack, réservé aux tâches où le résultat vaut plusieurs heures de travail qualifié.

Qu’est devenu le Projet Glasswing après ce lancement ? Il continue, enrichi. Les partenaires du Projet Glasswing — la coalition de cybersécurité défensive lancée par Anthropic en avril 2026 — ont été déplacés automatiquement de Claude Mythos Preview vers Claude Mythos 5, et Anthropic indique que l’accès s’élargira via des ajouts périodiques de partenaires et un programme d’accès de confiance. Fable 5 est de fait le dividende public de ce programme : le même palier de capacité, enveloppé de classificateurs jugés assez sûrs pour la vente générale.

Le mot de la fin

L’histoire d’avril, c’était un laboratoire frontier refusant de vendre son meilleur modèle. L’histoire de juin, c’est le même laboratoire décidant quels 95 % de ce modèle étaient finalement sûrs à vendre. Entre ces deux dates, la frontière en vente a dépassé la chose qui était soi-disant trop dangereuse à livrer — et cela, plus que n’importe quel benchmark isolé, est l’hypothèse de planification que votre feuille de route 2026 devrait absorber.

Pour les opérateurs B2B européens, la lecture pratique est simple. La capacité de confier du travail à la taille d’un objectif à un logiciel est désormais une marchandise au prix de 10/50 USD par million de tokens. L’avantage est entièrement passé à celui qui refond ses processus autour en premier — le fossé, c’est l’orchestration, pas le modèle. Choisir Fable 5 dans un menu déroulant est une compétence de commodité. Savoir lesquels de vos deux workflows sont en forme de contrat, câbler le modèle dedans avec des rails et des points de revue, et laisser les vingt autres sur des modèles moins chers — c’est ça le travail.

Cette seconde partie est ce que nous faisons — c’est toute la prémisse de notre service Workflow Ops. Si vous voulez une évaluation sobre de l’endroit où un modèle de classe Fable 5 rapporterait vraiment dans votre opération — et de l’endroit où il ne serait qu’une façon coûteuse de se sentir moderne — c’est une conversation de 30 minutes. Réservez un appel découverte →

Rédigé par Nikita Janockin, fondateur d’areza.digital — recherché et rédigé au sein d’une session Claude Fable 5. Sources : annonce Anthropic (9 juin 2026), analyse des benchmarks de Vellum, récap de lancement de Latent.Space, GitHub Changelog, blog Microsoft Azure, VentureBeat, Eurostat. Dernière mise à jour le 12 juin 2026.