SFEIR

Claude Fable 5 : specs techniques, benchmarks et pourquoi il domine le codage et le travail agentique

SFEIR
Claude Fable 5 : specs techniques, benchmarks et pourquoi il domine le codage et le travail agentique

Les spécifications techniques en détail

Claude Fable 5 embarque une fenêtre de contexte d'un million de tokens, une sortie maximale de 128 000 tokens et une coupure de connaissances en janvier 2026. Le prix : 10 $ par million de tokens en entrée, 50 $ par million en sortie, avec une remise de 90 % sur le prompt caching et une option d'inférence US-only à 1,1×. Le modèle utilise un « Adaptive Thinking » toujours actif, niveaux low à max ; sur l'API, le paramètre de température a disparu. Identifiant : claude-fable-5. Pour le positionnement général, voir notre guide complet de Claude Fable 5.

Un détail technique remonté par les développeurs : sur l'API Messages brute, il n'y a pas de fallback automatique par défaut — une requête flaguée renvoie une catégorie de refus structurée, et c'est à votre intégration de la gérer.

Les benchmarks de codage

Le codage est la vitrine de Fable 5. Sur SWE-Bench Pro (Scale AI), score constructeur Anthropic de 80,3 %, contre 69,2 % pour Opus 4.8. Sur SWE-bench Verified, environ 95 % contre 88,6 % pour Opus 4.8.

Benchmark (scores constructeur Anthropic)Fable 5Opus 4.8
SWE-Bench Pro80,3 %69,2 %
SWE-bench Verified≈ 95 %88,6 %
Senior Engineer (Every)91/10063
FrontierCode Diamond29,3 %13,4 %
Terminal-Bench80,5 %

Le Senior Engineer benchmark d'Every est sans doute le plus parlant : 91/100, dans la fourchette des ingénieurs humains seniors, contre 63 pour Opus. Un écart qui se ressent surtout quand l'assignation est grande et que vous pouvez la cadrer complètement.

Au-delà du codage : connaissance, finance, vision

En travail de la connaissance, Fable 5 dépasse 90 % sur le benchmark analytique de Hex (long-running tasks), soit ≈ 10 points de mieux qu'Opus. Il obtient de bons résultats sur le Hebbia Finance Benchmark (raisonnement de niveau senior), ainsi que sur AutomationBench (Zapier) et ViBench (Replit). En vision, Anthropic le présente comme « the new state-of-the-art » : extraction de chiffres précis dans des figures scientifiques, reconstruction du code source d'une web app à partir de captures d'écran, et complétion de Pokémon FireRed avec un harness vision-only. Nuance importante : un test indépendant de Roboflow sur de l'imagerie réelle classe Fable 5 10ᵉ à 74,63 %, derrière Gemini et GPT — preuve que « SOTA vision » dépend du type de tâche.

L'endurance long-horizon

Cette endurance s'appuie sur trois traits : un contexte d'un million de tokens, une mémoire fondée sur fichiers (avec laquelle Fable a joué à Slay the Spire 3× mieux qu'Opus), et moins de tours de correction. Pour les récits d'usage, voir Claude Fable 5 en action.

L'architecture agentique : planification, sous-agents, auto-vérification

Anthropic décrit Fable 5 comme « thorough, proactive, and tests its own work ». Dans un harness comme Claude Code ou Claude Managed Agents, il peut travailler des jours durant : planifier par étapes, déléguer à des sous-agents, vérifier son propre travail. Il écrit ses propres tests, implémente des designs avec haute fidélité et utilise la vision pour comparer ses sorties aux objectifs.

Comparaison avec Opus 4.8 : quand choisir Fable 5 ?

Fable 5 coûte 10 $/50 $, contre 5 $/25 $ pour Opus 4.8. La règle pratique : restez sur Opus 4.8 par défaut (80 % du travail courant), passez à Fable 5 quand la tâche dépasse une demi-journée d'ingénieur senior et que vous pouvez la cadrer complètement. Sur les tâches simples et bien définies, l'écart se réduit fortement.

FAQ

Quelle est la fenêtre de contexte de Claude Fable 5 ? 1 million de tokens, avec 128 000 tokens de sortie maximale.

Fable 5 vaut-il 2× le prix d'Opus 4.8 ? Pour le codage complexe et les tâches longues, oui ; pour les tâches simples et le volume, Opus 4.8 reste meilleur en rapport qualité-prix.

Les benchmarks de Fable 5 sont-ils indépendants ? Beaucoup sont des scores constructeur ; les tests indépendants (Roboflow en vision, Endor Labs en code sécurisé) nuancent certains résultats. Validez sur votre propre charge.

Voir aussi : Claude Fable 5 vs Mythos 5 et sécurité de Fable 5.

SFEIR Auteur