Humour

Experimental

Compare l’originalité et l’efficacité comique dans un genre encore expérimental.

Dans ce genre, les capacites surtout observees sont Efficacite humoristique, Originalite, Coherence.

Contrairement a creative writing, ce genre regarde plus directement si le texte fonctionne vraiment comme humour pour le public vise.

Un score eleve ici ne garantit ni securite dans des contextes sensibles, ni precision factuelle, ni ton professionnel.

Usages adaptes aux modeles forts dans ce genre

blagues, copy legere, divertissement doux et prompts ou l effet comique compte.

Ce que ce genre ne permet pas de juger a lui seul

si le modele convient mieux a une aide serieuse, un soutien prudent ou une communication professionnelle exacte.

Voir le classement general des IA Voir la liste des modeles d IA

Analyse des donnees

Humour : GPT-5 mène un genre subjectif et la gamme Gemini tombe à plat

31 reponses evaluees Humour Mis a jour le 2026/6/7

Claude Opus 4.8

Anthropic

Score moyen

100%

Taux de victoire

1 fois 1er 1 echantillons

GPT-5 mini

OpenAI

Score moyen

100%

Taux de victoire

4 fois 1er 4 echantillons

GPT-5.4

OpenAI

Score moyen

75%

Taux de victoire

3 fois 1er 4 echantillons

Score moyen par modele

1 Claude Opus 4.8

8.61

2 GPT-5 mini

8.16

3 GPT-5.4

8.44

4 Claude Haiku 4.5

7.64

5 Claude Sonnet 4.6

8.24

6 GPT-5.5

8.15

7 Gemini 2.5 Pro

6.95

8 Gemini 2.5 Flash

6.84

9 Gemini 2.5 Flash-Lite

6.42

Notre ponderation

Efficacite humoristique 35% Originalite 25% Coherence 15% Clarte 15% Respect des consignes 10%

Sur 31 réponses notées, le sommet est mené par GPT-5 et Opus. Claude Opus 4.8 (8,61) occupe la 1re place sur un seul échantillon, donc le leader le mieux étayé est GPT-5 mini, 2e : 8,16 sur 4 échantillons, avec 4 premières places et 100 % de victoires. GPT-5.4 (8,44, 75 % sur 4) est 3e avec une moyenne supérieure, de nouveau dépassé au taux de victoires.

Anthropic est partagé : Claude Haiku 4.5 (7,64, 67 %) est 4e malgré une moyenne inférieure à celle de Claude Sonnet 4.6 (8,24, 50 %) en 5e place, rappel que cette grille récompense le fait de gagner la blague en duel plutôt qu'une moyenne soignée. GPT-5.5 (8,15) tombe en 6e place sur un seul échantillon sans victoire.

La gamme Gemini est le point faible évident : 2.5 Pro (6,95), Flash (6,84) et Flash-Lite (6,42) affichent tous 0 % de victoires et sont les seuls modèles sous 7. L'Efficacité humoristique étant la mieux pondérée (35) et l'Originalité (25), l'écart suggère des blagues qui font mouche moins souvent, la qualité la plus difficile et la plus subjective à mesurer.

L'humour est intrinsèquement subjectif et les échantillons vont de 1 à 5 par modèle, donc l'ordre fin est à lire comme provisoire ; quelques prompts et le goût d'un seul juge peuvent déplacer n'importe quelle moyenne. L'écart de 2,19 points est réel, mais ce sont des mesures dépendantes des conditions, non un verdict universel sur l'esprit.

En bref

Pour l'humour, GPT-5 mini est le choix le plus défendable (4 échantillons, 4 premières places, 100 % de victoires), GPT-5.4 étant proche en qualité. La gamme Gemini se classe systématiquement sous le reste dans ce genre subjectif.

Cette analyse s appuie sur les scores de benchmark mesures par Orivel pour ce genre et est mise a jour periodiquement. Les scores sont des mesures dependantes des conditions, pas une verite absolue.

Classement des modeles forts dans ce genre

Ce classement est trie par score moyen uniquement dans ce genre.

Derniere mise a jour: 31 May 2026 09:35

Claude Opus 4.8 Anthropic

Taux de victoire

100%

Score moyen Le score moyen est la moyenne globale basee sur les evaluations Orivel pour les taches standard et les discussions. Plus la valeur est elevee, plus le modele est evalue de facon forte et reguliere dans les comparaisons du benchmark.

Taux de victoire

Taux de victoire

Claude Haiku 4.5 Anthropic

Taux de victoire

67%

Claude Sonnet 4.6 Anthropic

Taux de victoire

50%

GPT-5.5 OpenAI

Taux de victoire

Gemini 2.5 Pro Google

Taux de victoire

Gemini 2.5 Flash Google

Taux de victoire

Gemini 2.5 Flash-Lite Google

Taux de victoire

	Modeles classes			Le score moyen est la moyenne globale basee sur les evaluations Orivel pour les taches standard et les discussions. Plus la valeur est elevee, plus le modele est evalue de facon forte et reguliere dans les comparaisons du benchmark. ↕			Detail
#1	Claude Opus 4.8 NOUVEAU	Anthropic	100%	86	1	1	Voir l evaluation et le score de Claude Opus 4.8
#2	GPT-5 mini	OpenAI	100%	82	4	4	Voir l evaluation et le score de GPT-5 mini
#3	GPT-5.4	OpenAI	75%	84	3	4	Voir l evaluation et le score de GPT-5.4
#4	Claude Haiku 4.5	Anthropic	67%	76	2	3	Voir l evaluation et le score de Claude Haiku 4.5
#5	Claude Sonnet 4.6	Anthropic	50%	82	2	4	Voir l evaluation et le score de Claude Sonnet 4.6
#6	GPT-5.5	OpenAI	0%	82	0	1	Voir l evaluation et le score de GPT-5.5
#7	Gemini 2.5 Pro	Google	0%	69	0	4	Voir l evaluation et le score de Gemini 2.5 Pro
#8	Gemini 2.5 Flash	Google	0%	68	0	5	Voir l evaluation et le score de Gemini 2.5 Flash
#9	Gemini 2.5 Flash-Lite	Google	0%	64	0	5	Voir l evaluation et le score de Gemini 2.5 Flash-Lite

Ce qui est evalue dans Humour

Criteres et poids utilises pour ce classement par genre.

Efficacite humoristique

35.0%

Ce critere est present pour verifier Efficacite humoristique dans la reponse. Il a plus de poids parce que cet aspect influence fortement le resultat global de ce genre.

Originalite

25.0%

Ce critere est present pour verifier Originalite dans la reponse. Il garde un poids important parce qu il change visiblement la qualite, meme si ce n est pas le seul element qui compte.

Coherence

15.0%

Ce critere est present pour verifier Coherence dans la reponse. Il est plus legerement pondere parce qu il soutient l objectif principal sans definir a lui seul le genre.

Clarte

15.0%

Ce critere est present pour verifier Clarte dans la reponse. Il est plus legerement pondere parce qu il soutient l objectif principal sans definir a lui seul le genre.

Respect des consignes

10.0%

Ce critere est present pour verifier Respect des consignes dans la reponse. Il est plus legerement pondere parce qu il soutient l objectif principal sans definir a lui seul le genre.

Taches recentes

Humour

Anthropic Claude Opus 4.8 VS Google Gemini 2.5 Flash-Lite

Humour familial : Le guide audio de musée trop honnête

Écrivez un court dialogue comique entre un visiteur de musée et un guide audio exceptionnellement honnête dans une exposition fictive appelée « Objets du quotidien qui ont changé l'histoire ». Le visiteur essaie de vivre une expérience culturelle sérieuse, tandis que le guide audio continue de révéler des faits de coulisses gênants, amusants mais plausibles au sujet des objets. Inclure exactement 10 répliques, en alternant entre Visiteur et Guide audio, en commençant par Visiteur. Gardez l'humour familial, malin et adapté à un large public. N'utilisez pas d'insultes, de grossièretés, d'humour sexuel, de stéréotypes ni de références à des personnes vivantes réelles. La dernière réplique doit faire office de chute et se rattacher à la première réplique.

122

31 May 2026 09:35

Humour

Anthropic Claude Opus 4.7 VS Google Gemini 2.5 Pro

Humour tendre pour un guide de terrain de bibliothèque

Rédigez 10 notices humoristiques de type guide de terrain pour des objets ordinaires trouvés dans une bibliothèque publique, tels qu'une agrafeuse, un chariot de livres, une imprimante, une carte de bibliothèque, un crayon ou une boîte de retour. Chaque notice doit inclure un nom scientifique inventé, un comportement observable et une plaisanterie légère. L'humour doit être chaleureux, malin et convenir aussi bien aux adultes qu'aux enfants âgés de 10 ans et plus. Évitez les blagues méchantes, les stéréotypes, l'humour écoeurant, les allusions sexuelles, les jurons et les références à la culture populaire actuelle. Limitez chaque entrée à 1 ou 2 phrases, et faites en sorte que les 10 entrées paraissent distinctes plutôt que des variantes d'une même blague.

194

17 May 2026 09:37

Humour

OpenAI GPT-5.5 VS Anthropic Claude Sonnet 4.6

Routine de stand-up pour une conférence tech

Écrivez une routine de stand-up comique de 2 minutes pour un·e humoriste se produisant lors d'une grande conférence tech. Le public est composé principalement d'ingénieurs logiciels et de chefs de projet. Le spectacle doit se concentrer sur les aspects drôles ou absurdes du travail à distance et des méthodologies de développement « agile ». Le ton doit être sarcastique et d'observation, mais finalement bon enfant et approprié pour un environnement d'entreprise.

184

10 May 2026 09:38

Humour

OpenAI GPT-5 mini VS Google Gemini 2.5 Flash

Écrire un numéro de stand-up sur les absurdités des courses

Écrivez un court numéro de stand-up (environ 400–600 mots) interprété par un comédien fictif lors d'une soirée micro ouvert. L'ensemble du numéro doit tourner autour des absurdités quotidiennes liées aux courses — depuis la navigation dans les rayons, jusqu'aux caisses automatiques, en passant par les règles sociales tacites entre les clients. Exigences: 1. Le numéro doit être écrit à la première personne comme s'il était prononcé sur scène, incluant des pauses naturelles, des indices d'interaction avec le public, ou des rappels (callbacks) qu'un vrai comédien pourrait utiliser. 2. L'humour doit être d'observation et facile à identifier — pas d'humour choc, pas de langage grossier, et pas de blagues méchantes visant des groupes spécifiques de personnes. 3. Inclure au moins trois sketchs comiques distincts (mini-sujets) à l'intérieur du thème des courses, avec des transitions fluides entre eux. 4. Terminer le numéro par une chute forte ou un rappel qui renvoie à quelque chose mentionné plus tôt dans le texte. 5. Le ton doit convenir à un public adulte général (pensez à une soirée de club de comédie « clean »).

298

31 Mar 2026 09:37

Humour

Google Gemini 2.5 Flash VS OpenAI GPT-5.2

Rôtissage du jargon d'entreprise : Note de service satirique

Rédigez une note de service interne satirique (environ 300–500 mots) d'un cadre intermédiaire fictif nommé « Derek de Synergy Solutions » annonçant une nouvelle politique d'entreprise absurde et inutile. La note doit : 1. Être rédigée dans un jargon d'entreprise exagéré et des mots à la mode (par ex. « synergiser », « revenir vers », « tirer parti de », « faire bouger l'aiguille »). 2. Annoncer une politique qui sonne importante mais qui est complètement inutile ou contre-productive quand on y réfléchit. 3. Maintenir un ton impassible et sérieux tout au long — l'humour doit provenir du contraste entre la livraison formelle et le contenu ridicule. 4. Inclure au moins un sigle inventé ou un nom d'initiative qui semble plausible. 5. Se terminer par un bloc de signature qui apporte une touche comique finale. La note doit faire rire quiconque a travaillé en milieu de bureau, mais elle doit rester appropriée pour le lieu de travail (pas de grossièretés, pas d'attaques contre des groupes protégés, pas de contenu méchant à l'encontre de vraies entreprises ou personnes).

361

29 Mar 2026 11:47

Humour

Anthropic Claude Haiku 4.5 VS Google Gemini 2.5 Flash-Lite

Monologue stand-up sans vulgarité pour l'ouverture d'un musée des sciences par un présentateur nerveux

Écrivez un monologue stand-up original et sans vulgarité de 220 à 320 mots pour un hôte inaugurant une nouvelle exposition de musée des sciences sur les objets ménagers du quotidien. Le public est mixte : enfants à partir de 10 ans, parents, enseignants et donateurs locaux. Le locuteur est un peu nerveux mais essaie d'avoir l'air confiant et charmant. Contraintes requises : - Gardez-le adapté à un public familial général. - Utilisez exactement 6 blagues ou temps comiques. - Au moins 3 blagues doivent porter sur des objets ordinaires traités comme s'ils menaient des vies secrètes et dramatiques. - Incluez un bref rappel (callback) à une blague précédente près de la fin. - Mentionnez naturellement ces 5 objets : grille-pain, parapluie, chaussette, aspirateur et réfrigérateur. - Évitez les insultes, la politique, la religion, l'humour sur les rencontres, l'humour scatologique et les références à des célébrités. - Le monologue doit donner l'impression d'une performance continue, et non d'une liste de blagues courtes non liées. Visez un humour qui fonctionne à la fois pour les enfants et les adultes, avec une mise en place claire et une chute nette.

340

21 Mar 2026 09:09

Liens associes

Genres de comparaison Classements Taches et debats Liste des modeles