SFEIR

Claude Fable 5 en action : exemples concrets de codage, agents et productivité

SFEIR
Claude Fable 5 en action : exemples concrets de codage, agents et productivité

Pourquoi les exemples comptent plus que les benchmarks

Les benchmarks disent où un modèle se classe ; les récits d'usage disent ce qu'il change concrètement. Pour Claude Fable 5, le motif est constant : plus la tâche est dure, longue et ouverte, plus l'écart se creuse. Cet article rassemble les cas les mieux documentés. Pour les chiffres bruts, voir specs et benchmarks de Fable 5.

Simon Willison : « a beast » et « relentlessly proactive »

Le développeur Simon Willison a publié deux comptes-rendus de référence. Le premier, le jour du lancement, après ~5,5 heures de test : « This is something of a beast. It's slow, expensive and has been quite happily churning through everything I've thrown at it so far. » Il y raconte trois réalisations :

  1. micropython-wasm → CPython complet. Il demande à Fable de cloner sa librairie et de voir comment passer de MicroPython à un Python complet. Fable identifie les builds cpython-wasi-build de Brett Cannon, et après quelques échanges produit un wheel autonome de 13,9 Mo embarquant les wrappers Python, les fichiers WASM et la bibliothèque standard.
  2. Librairie LLM 0.32a3. Fable résout non seulement la fonctionnalité visée (pause/reprise des appels d'outils) mais identifie et implémente quatre améliorations dans la librairie sous-jacente, avec une qualité d'API, de tests et de documentation que Willison juge excellente — « several days' worth of work » condensés en quelques heures.
  3. Datasette Agent PR #20. La fonctionnalité d'approbation humaine en cours d'exécution, livrée et mergée.

Le second billet, deux jours plus tard, décrit Fable comme « relentlessly proactive » : « It knows a whole lot of tricks and it will deploy pretty much any of them to get to its goal. »

L'anecdote du scrollbar : un agent qui invente ses propres outils

L'histoire la plus parlante : Willison repère une scrollbar horizontale parasite dans un menu. Il fournit une capture d'écran et une seule consigne (« regarde les dépendances pour comprendre cette scrollbar »). Pendant qu'il s'éloigne, Fable :

  • déduit la recette pour lancer le serveur de développement local (avec les variables d'environnement factices nécessaires) ;
  • lance une session Playwright Chrome, puis cycle sur Firefox et WebKit ;
  • active l'affichage permanent des scrollbars dans Chrome (puis le désactive) ;
  • crée une page HTML de test et l'ouvre dans le vrai Safari ;
  • contourne un blocage macOS (« osascript is not allowed assistive access ») en passant par pyobjc-framework-Quartz pour itérer sur les fenêtres ouvertes et récupérer leur numéro, puis utilise la CLI screencapture pour prendre un PNG ;
  • édite les templates de Datasette pour injecter du JavaScript déclenchant le raccourci clavier « / » 1,2 seconde après le chargement ;
  • écrit son propre serveur web Python (http.server) avec en-têtes CORS pour récupérer des mesures POSTées depuis la page ;
  • scripte son chemin à travers le shadow DOM d'un Web Component pour mesurer le textarea ;
  • hacke un correctif dans le template, le confirme, puis documente la marche à suivre.

Au bout de cette démonstration, Fable a heurté un garde-fou invisible et est retombé sur Opus 4.8 — lequel, disposant de la transcription, a pu poursuivre, trouver, tester et committer le correctif (un fix CSS de deux lignes). Willison conclut sur un avertissement de sécurité : un agent aussi proactif, s'il était détourné par une injection de prompt, pourrait causer des dégâts considérables.

Autres retours de développeurs

Au-delà des récits de Simon Willison, d'autres voix nominatives ont partagé leur impression. Boris Cherny (Claude Code) juge Fable 5 nettement meilleur que les modèles précédents. Ethan Mollick, lui, rapporte avoir laissé le modèle travailler de façon autonome sur des tâches longues.

Les coûts réels : « My wallet can hear it thinking »

La puissance a un prix. L'avertissement in-app indique que Fable consomme les limites « ~2x faster than Opus ». Simon Willison rapporte ainsi 110,42 $ en une journée (dont 99,26 $ sur une session) sur un plan Max à 100 $/mois. Un utilisateur résume : « My wallet can hear it thinking. » Conseil pratique : configurez un plafond de dépenses, car au-delà de votre fenêtre d'abonnement, l'usage peut basculer en pay-as-you-go.

Un bémol indépendant : sur le benchmark Agent Security League d'Endor Labs (génération de code sûr), Fable 5 obtient un score moyen (59,8 % FuncPass, 19,0 % SecPass), avec un nombre élevé de timeouts et de cas de mémorisation — preuve que « SOTA en codage offensif » ne signifie pas « SOTA en code sécurisé ».

FAQ

Combien coûte une journée d'usage intensif de Fable 5 ? Les anecdotes rapportées vont de quelques dizaines à plus d'une centaine de dollars selon l'intensité agentique ; comptez environ 2× la consommation d'Opus.

Fable 5 peut-il travailler sans supervision ? Oui, sur des tâches longues ; Ethan Mollick rapporte l'avoir laissé travailler de façon autonome. Mais une revue humaine reste indispensable.

Quel est le meilleur cas d'usage de Fable 5 ? Les migrations, refactors multi-fichiers et projets long-horizon où l'on peut cadrer la tâche complètement.

Voir aussi : avantages et inconvénients de Fable 5 et le guide complet.

SFEIR Auteur