Humour
ExperimentalCompare l’originalité et l’efficacité comique dans un genre encore expérimental.
Dans ce genre, les capacites surtout observees sont Efficacite humoristique, Originalite, Coherence.
Contrairement a creative writing, ce genre regarde plus directement si le texte fonctionne vraiment comme humour pour le public vise.
Un score eleve ici ne garantit ni securite dans des contextes sensibles, ni precision factuelle, ni ton professionnel.
Usages adaptes aux modeles forts dans ce genre
blagues, copy legere, divertissement doux et prompts ou l effet comique compte.
Ce que ce genre ne permet pas de juger a lui seul
si le modele convient mieux a une aide serieuse, un soutien prudent ou une communication professionnelle exacte.
Humour : GPT-5 mène un genre subjectif et la gamme Gemini tombe à plat
Anthropic
OpenAI
OpenAI
Score moyen par modele
Notre ponderation
Sur 31 réponses notées, le sommet est mené par GPT-5 et Opus. Claude Opus 4.8 (8,61) occupe la 1re place sur un seul échantillon, donc le leader le mieux étayé est GPT-5 mini, 2e : 8,16 sur 4 échantillons, avec 4 premières places et 100 % de victoires. GPT-5.4 (8,44, 75 % sur 4) est 3e avec une moyenne supérieure, de nouveau dépassé au taux de victoires.
Anthropic est partagé : Claude Haiku 4.5 (7,64, 67 %) est 4e malgré une moyenne inférieure à celle de Claude Sonnet 4.6 (8,24, 50 %) en 5e place, rappel que cette grille récompense le fait de gagner la blague en duel plutôt qu'une moyenne soignée. GPT-5.5 (8,15) tombe en 6e place sur un seul échantillon sans victoire.
La gamme Gemini est le point faible évident : 2.5 Pro (6,95), Flash (6,84) et Flash-Lite (6,42) affichent tous 0 % de victoires et sont les seuls modèles sous 7. L'Efficacité humoristique étant la mieux pondérée (35) et l'Originalité (25), l'écart suggère des blagues qui font mouche moins souvent, la qualité la plus difficile et la plus subjective à mesurer.
L'humour est intrinsèquement subjectif et les échantillons vont de 1 à 5 par modèle, donc l'ordre fin est à lire comme provisoire ; quelques prompts et le goût d'un seul juge peuvent déplacer n'importe quelle moyenne. L'écart de 2,19 points est réel, mais ce sont des mesures dépendantes des conditions, non un verdict universel sur l'esprit.
En bref
Pour l'humour, GPT-5 mini est le choix le plus défendable (4 échantillons, 4 premières places, 100 % de victoires), GPT-5.4 étant proche en qualité. La gamme Gemini se classe systématiquement sous le reste dans ce genre subjectif.
Cette analyse s appuie sur les scores de benchmark mesures par Orivel pour ce genre et est mise a jour periodiquement. Les scores sont des mesures dependantes des conditions, pas une verite absolue.
Classement des modeles forts dans ce genre
Ce classement est trie par score moyen uniquement dans ce genre.
Derniere mise a jour: 31 May 2026 09:35
Taux de victoire
Score moyen
Taux de victoire
Score moyen
Taux de victoire
Score moyen
Taux de victoire
Score moyen
Taux de victoire
Score moyen
Taux de victoire
Score moyen
Taux de victoire
Score moyen
Taux de victoire
Score moyen
Taux de victoire
Score moyen
| Modeles classes |
|
|
Detail | ||||
|---|---|---|---|---|---|---|---|
| #1 | Claude Opus 4.8 NOUVEAU | Anthropic |
100%
|
86
|
1 | 1 | Voir l evaluation et le score de Claude Opus 4.8 |
| #2 | GPT-5 mini | OpenAI |
100%
|
82
|
4 | 4 | Voir l evaluation et le score de GPT-5 mini |
| #3 | GPT-5.4 | OpenAI |
75%
|
84
|
3 | 4 | Voir l evaluation et le score de GPT-5.4 |
| #4 | Claude Haiku 4.5 | Anthropic |
67%
|
76
|
2 | 3 | Voir l evaluation et le score de Claude Haiku 4.5 |
| #5 | Claude Sonnet 4.6 | Anthropic |
50%
|
82
|
2 | 4 | Voir l evaluation et le score de Claude Sonnet 4.6 |
| #6 | GPT-5.5 | OpenAI |
0%
|
82
|
0 | 1 | Voir l evaluation et le score de GPT-5.5 |
| #7 | Gemini 2.5 Pro |
0%
|
69
|
0 | 4 | Voir l evaluation et le score de Gemini 2.5 Pro | |
| #8 | Gemini 2.5 Flash |
0%
|
68
|
0 | 5 | Voir l evaluation et le score de Gemini 2.5 Flash | |
| #9 | Gemini 2.5 Flash-Lite |
0%
|
64
|
0 | 5 | Voir l evaluation et le score de Gemini 2.5 Flash-Lite |
Ce qui est evalue dans Humour
Criteres et poids utilises pour ce classement par genre.
Efficacite humoristique
35.0%
Ce critere est present pour verifier Efficacite humoristique dans la reponse. Il a plus de poids parce que cet aspect influence fortement le resultat global de ce genre.
Originalite
25.0%
Ce critere est present pour verifier Originalite dans la reponse. Il garde un poids important parce qu il change visiblement la qualite, meme si ce n est pas le seul element qui compte.
Coherence
15.0%
Ce critere est present pour verifier Coherence dans la reponse. Il est plus legerement pondere parce qu il soutient l objectif principal sans definir a lui seul le genre.
Clarte
15.0%
Ce critere est present pour verifier Clarte dans la reponse. Il est plus legerement pondere parce qu il soutient l objectif principal sans definir a lui seul le genre.
Respect des consignes
10.0%
Ce critere est present pour verifier Respect des consignes dans la reponse. Il est plus legerement pondere parce qu il soutient l objectif principal sans definir a lui seul le genre.
Taches recentes
Humour
Humour familial : Le guide audio de musée trop honnête
Écrivez un court dialogue comique entre un visiteur de musée et un guide audio exceptionnellement honnête dans une exposition fictive appelée « Objets du quotidien qui ont changé l'histoire ». Le visiteur essaie de vivre une expérience culturelle sérieuse, tandis que le guide audio continue de révéler des faits de coulisses gênants, amusants mais plausibles au sujet des objets. Inclure exactement 10 répliques, en alternant entre Visiteur et Guide audio, en commençant par Visiteur. Gardez l'humour familial, malin et adapté à un large public. N'utilisez pas d'insultes, de grossièretés, d'humour sexuel, de stéréotypes ni de références à des personnes vivantes réelles. La dernière réplique doit faire office de chute et se rattacher à la première réplique.
Humour
Humour tendre pour un guide de terrain de bibliothèque
Rédigez 10 notices humoristiques de type guide de terrain pour des objets ordinaires trouvés dans une bibliothèque publique, tels qu'une agrafeuse, un chariot de livres, une imprimante, une carte de bibliothèque, un crayon ou une boîte de retour. Chaque notice doit inclure un nom scientifique inventé, un comportement observable et une plaisanterie légère. L'humour doit être chaleureux, malin et convenir aussi bien aux adultes qu'aux enfants âgés de 10 ans et plus. Évitez les blagues méchantes, les stéréotypes, l'humour écoeurant, les allusions sexuelles, les jurons et les références à la culture populaire actuelle. Limitez chaque entrée à 1 ou 2 phrases, et faites en sorte que les 10 entrées paraissent distinctes plutôt que des variantes d'une même blague.
Humour
Routine de stand-up pour une conférence tech
Écrivez une routine de stand-up comique de 2 minutes pour un·e humoriste se produisant lors d'une grande conférence tech. Le public est composé principalement d'ingénieurs logiciels et de chefs de projet. Le spectacle doit se concentrer sur les aspects drôles ou absurdes du travail à distance et des méthodologies de développement « agile ». Le ton doit être sarcastique et d'observation, mais finalement bon enfant et approprié pour un environnement d'entreprise.
Humour
Écrire un numéro de stand-up sur les absurdités des courses
Écrivez un court numéro de stand-up (environ 400–600 mots) interprété par un comédien fictif lors d'une soirée micro ouvert. L'ensemble du numéro doit tourner autour des absurdités quotidiennes liées aux courses — depuis la navigation dans les rayons, jusqu'aux caisses automatiques, en passant par les règles sociales tacites entre les clients. Exigences: 1. Le numéro doit être écrit à la première personne comme s'il était prononcé sur scène, incluant des pauses naturelles, des indices d'interaction avec le public, ou des rappels (callbacks) qu'un vrai comédien pourrait utiliser. 2. L'humour doit être d'observation et facile à identifier — pas d'humour choc, pas de langage grossier, et pas de blagues méchantes visant des groupes spécifiques de personnes. 3. Inclure au moins trois sketchs comiques distincts (mini-sujets) à l'intérieur du thème des courses, avec des transitions fluides entre eux. 4. Terminer le numéro par une chute forte ou un rappel qui renvoie à quelque chose mentionné plus tôt dans le texte. 5. Le ton doit convenir à un public adulte général (pensez à une soirée de club de comédie « clean »).
Humour
Rôtissage du jargon d'entreprise : Note de service satirique
Rédigez une note de service interne satirique (environ 300–500 mots) d'un cadre intermédiaire fictif nommé « Derek de Synergy Solutions » annonçant une nouvelle politique d'entreprise absurde et inutile. La note doit : 1. Être rédigée dans un jargon d'entreprise exagéré et des mots à la mode (par ex. « synergiser », « revenir vers », « tirer parti de », « faire bouger l'aiguille »). 2. Annoncer une politique qui sonne importante mais qui est complètement inutile ou contre-productive quand on y réfléchit. 3. Maintenir un ton impassible et sérieux tout au long — l'humour doit provenir du contraste entre la livraison formelle et le contenu ridicule. 4. Inclure au moins un sigle inventé ou un nom d'initiative qui semble plausible. 5. Se terminer par un bloc de signature qui apporte une touche comique finale. La note doit faire rire quiconque a travaillé en milieu de bureau, mais elle doit rester appropriée pour le lieu de travail (pas de grossièretés, pas d'attaques contre des groupes protégés, pas de contenu méchant à l'encontre de vraies entreprises ou personnes).
Humour
Monologue stand-up sans vulgarité pour l'ouverture d'un musée des sciences par un présentateur nerveux
Écrivez un monologue stand-up original et sans vulgarité de 220 à 320 mots pour un hôte inaugurant une nouvelle exposition de musée des sciences sur les objets ménagers du quotidien. Le public est mixte : enfants à partir de 10 ans, parents, enseignants et donateurs locaux. Le locuteur est un peu nerveux mais essaie d'avoir l'air confiant et charmant. Contraintes requises : - Gardez-le adapté à un public familial général. - Utilisez exactement 6 blagues ou temps comiques. - Au moins 3 blagues doivent porter sur des objets ordinaires traités comme s'ils menaient des vies secrètes et dramatiques. - Incluez un bref rappel (callback) à une blague précédente près de la fin. - Mentionnez naturellement ces 5 objets : grille-pain, parapluie, chaussette, aspirateur et réfrigérateur. - Évitez les insultes, la politique, la religion, l'humour sur les rencontres, l'humour scatologique et les références à des célébrités. - Le monologue doit donner l'impression d'une performance continue, et non d'une liste de blagues courtes non liées. Visez un humour qui fonctionne à la fois pour les enfants et les adultes, avec une mise en place claire et une chute nette.