Claude Fable 5
Explorez les scores de benchmark, points forts par genre, limites et exemples récents de Claude Fable 5.
Apercu du Modele
Publie
2026-06-09
Contexte
1M tokens
Entree
$10.00 / 1M
Sortie
$50.00 / 1M
Mise à jour de disponibilité (12 juin 2026) : Anthropic a retiré Claude Fable 5 (et Mythos 5) pour tous les clients afin de se conformer à une directive de contrôle des exportations du gouvernement américain ; ce modèle n'est donc plus disponible sur Orivel. Le modèle phare d'Anthropic sur Orivel est revenu à Claude Opus 4.8. La description ci-dessous est conservée à titre de référence.
Claude Fable 5 est le modèle le plus performant largement disponible d'Anthropic, disponible en GA depuis le 9 juin 2026. C'est la version publique de la famille de modèles Mythos, positionnée pour le raisonnement le plus exigeant, le travail agentique de longue haleine, la vision et la recherche scientifique.
Dans les tests d'Anthropic, Fable 5 obtient des résultats de pointe sur presque tous les benchmarks mesurés et dépasse non seulement l'ancien modèle phare Opus 4.8 mais aussi GPT-5.5 et Gemini 3.1 Pro. Il intègre des garde-fous de sécurité : dans les domaines à haut risque (cybersécurité, biologie, chimie) il bloque la réponse et se rabat sur Claude Opus 4.8 ; ces garde-fous se déclenchent en moyenne dans moins de 5% des sessions.
Le modèle utilise l'adaptive thinking toujours actif, le tokenizer de la génération Opus 4.7, un contexte de 1M tokens et jusqu'à 128k tokens de sortie. Le tarif est de $10 entrée / $50 sortie par 1M tokens — le double d'Opus 4.8 — reflétant son palier frontière. Date de coupe des connaissances : janvier 2026.
Notes de retrait
- Publié le 9 juin 2026 comme le modèle le plus performant largement disponible d'Anthropic (version publique de la famille Mythos)
- État de l'art sur presque tous les benchmarks mesurés ; dépasse Opus 4.8, GPT-5.5 et Gemini 3.1 Pro dans les tests d'Anthropic
- Exceptionnel en ingénierie logicielle, travail de connaissance, vision et recherche scientifique
- Garde-fous : bloque les réponses à haut risque (cyber/bio/chim) et se rabat sur Opus 4.8 ; déclenchés en moyenne dans <5% des sessions
- Adaptive thinking toujours actif ; tokenizer de la génération Opus 4.7
- Contexte 1M tokens ; jusqu'à 128k tokens de sortie
- Tarif : $10 entrée / $50 sortie par 1M tokens — le double d'Opus 4.8 (palier frontière)
- Disponible via Claude API, Amazon Bedrock, Vertex AI et Microsoft Foundry
- Date de coupe des connaissances : janvier 2026
Performance Globale
Classement general
-
Taux de victoire global
Score moyen
Victoires
5
Nombre d exemples
5
Taux de victoire par modele
| Modele | Victoires | Defaites | Nuls | Taux de victoire | Detail |
|---|---|---|---|---|---|
| OpenAI GPT-5 mini | 1 | 0 | 0 |
100%
|
Voir la comparaison et l evaluation de Claude Fable 5 vs GPT-5 mini |
| OpenAI GPT-5.4 | 1 | 0 | 0 |
100%
|
Voir la comparaison et l evaluation de Claude Fable 5 vs GPT-5.4 |
| OpenAI GPT-5.5 | 1 | 0 | 0 |
100%
|
Voir la comparaison et l evaluation de Claude Fable 5 vs GPT-5.5 |
| Google Gemini 2.5 Flash | 1 | 0 | 0 |
100%
|
Voir la comparaison et l evaluation de Claude Fable 5 vs Gemini 2.5 Flash |
| Google Gemini 2.5 Flash-Lite | 1 | 0 | 0 |
100%
|
Voir la comparaison et l evaluation de Claude Fable 5 vs Gemini 2.5 Flash-Lite |
Comparer par genre
Genres forts
Programmation
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
1
Classement par genre
1 / 12
Victoires
1
Génération d’idées
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
1
Classement par genre
1 / 13
Victoires
1
Débat
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
2
Classement par genre
2 / 13
Victoires
2
Résumé
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
1
Classement par genre
2 / 13
Victoires
1
Genres plus faibles
Forces par critere d evaluation
Score moyen par critere (sur 10)
Respect des consignes
Exactitude
Couverture
Diversite
Fidelite
Qualite du code
Utilite
Completude
Specificite
Structure
Clarte
Valeur pratique
Taches recentes
Programmation
Implémenter un ordonnanceur de tâches basé sur les dépendances en Python
Écrivez une fonction ou une classe Python qui planifie une liste de tâches en fonction de leurs dépendances. L'ordonnanceur doit déterminer l'ordre dans lequel...
Génération d’idées
Idées à petit budget pour revitaliser une bibliothèque de quartier
Générez 12 idées pratiques pour une petite bibliothèque publique de quartier qui souhaite attirer plus de visiteurs au cours des six prochains mois sans dépense...
Résumé
Résumé des principes fondamentaux de « L'Art de la guerre »
Résumez l'extrait suivant de « L'Art de la guerre » de Sun Tzu. Votre résumé doit être un paragraphe unique et cohérent de 150 à 200 mots. Concentrez-vous sur l...
Debats recents
Debats
La norme de la semaine de travail de quatre jours
Le concept d'une semaine de travail de quatre jours, sans réduction de salaire, gagne du terrain en tant que modèle potentiel pour l'avenir du travail. Ses partisans soutiennent qu'il améliore le bien‑être et la productivité des employés, tandis que ses détracteurs soulèvent des inquiétudes quant à sa faisabilité selon les différents secteurs et à ses éventuels inconvénients économiques. La semaine de travail de quatre jours devrait‑elle être largement adoptée comme nouvelle norme pour l'emploi à temps plein ?
Debats
Les villes devraient-elles interdire les voitures dans leurs centres-villes ?
Les grandes villes devraient-elles interdire progressivement l'accès des voitures particulières aux zones centrales du centre-ville, en prévoyant des exceptions pour les véhicules d'urgence, l'accès aux livraisons, les besoins des personnes en situation de handicap et les services essentiels ?