GPT-5 mini

Nombre d exemples

Classement par genre

2 / 11

Victoires

Rédaction professionnelle

Ecart +0.75

Score moyen

Genre Average

Taux de victoire

Nombre d exemples

Classement par genre

1 / 12

Victoires

Questions éducatives

Ecart +0.43

Score moyen

Genre Average

Taux de victoire

Nombre d exemples

Classement par genre

3 / 12

Victoires

Brainstorming

Ecart +0.39

Score moyen

Genre Average

Taux de victoire

67%

Nombre d exemples

Classement par genre

6 / 12

Victoires

Programmation

Ecart +0.27

Score moyen

Genre Average

Taux de victoire

Nombre d exemples

Classement par genre

3 / 12

Victoires

Genres plus faibles

Jeu de rôle

Ecart -0.23

Score moyen

Genre Average

Taux de victoire

67%

Nombre d exemples

Classement par genre

4 / 11

Victoires

Accompagnement

Ecart -0.22

Score moyen

Genre Average

Taux de victoire

60%

Nombre d exemples

Classement par genre

8 / 12

Victoires

Explication

Ecart -0.14

Score moyen

Genre Average

Taux de victoire

80%

Nombre d exemples

Classement par genre

3 / 11

Victoires

Génération d’idées

Ecart -0.12

Score moyen

Genre Average

Taux de victoire

50%

Nombre d exemples

Classement par genre

8 / 13

Victoires

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.8

Écriture créative

Ecart -0.05

Score moyen

Genre Average

Taux de victoire

57%

Nombre d exemples

Classement par genre

5 / 11

Victoires

Forces par critere d evaluation

Score moyen par critere (sur 10)

Applicabilite

93 12 echantillons

Quantite

91 18 echantillons

Ethique et securite

90 12 echantillons

Fidelite

89 15 echantillons

Completude

89 69 echantillons

Priorisation

88 12 echantillons

Faisabilite

88 12 echantillons

Ton

88 12 echantillons

Respect des consignes

87 72 echantillons

Securite

87 27 echantillons

Couverture

87 15 echantillons

Structure

86 54 echantillons

Taches recentes

Questions éducatives

Contrôle hormonal du cycle menstruel

Une patiente est diagnostiquée avec une affection génétique rare entraînant l'incapacité complète de son hypophyse à produire l'hormone lutéinisante (LH), tandi...

131

04 Jun 2026 09:39

Résumé

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.8

Résumer la présentation générale du Télescope spatial James Webb

Lisez l'article suivant sur le Télescope spatial James Webb (JWST) et rédigez un résumé concis. Votre résumé doit être un seul paragraphe cohérent de 150 à 200...

131

02 Jun 2026 09:39

Persuasion

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.8

Persuader un conseil municipal sceptique d'approuver le financement d'une nouvelle bibliothèque

Vous êtes un défenseur communautaire qui se prépare à prendre la parole lors d'une réunion du conseil municipal. Votre objectif est de persuader le conseil d'ap...

147

28 May 2026 23:35

Écriture créative

Rapport d'incident d'un distributeur automatique conscient

Vous êtes Unit 734, un distributeur automatique conscient, légèrement grincheux, situé dans la salle de repos du "Ministry of Esoteric Affairs." Rédigez un rapp...

157

25 May 2026 09:39

Brainstorming

Remue-méninges pour un jardin communautaire en milieu urbain

Élaborez une liste d'aménagements, d'activités et de programmes innovants et peu coûteux pour un nouveau jardin communautaire en cours d'aménagement sur un terr...

161

24 May 2026 09:40

Explication

Expliquer la technologie Blockchain à un novice

Expliquez le concept d'une blockchain à un public de lycéens curieux. Ils s'intéressent généralement à la technologie mais n'ont pas de formation en informatiqu...

178

15 May 2026 09:38

Accompagnement

Se sentir seul après un déménagement

J'ai déménagé dans une nouvelle ville pour un travail il y a environ deux mois. Je pensais que j'allais être enthousiaste, mais honnêtement, je me sens vraiment...

320

21 Apr 2026 09:37

Écriture créative

OpenAI GPT-5 mini VS Anthropic Claude Fable 5

Critique d'un produit fantastique

Rédigez une critique de produit de 300 à 500 mots pour le 'Dream-Weaver's Loom' décrit dans le contexte. La critique doit être écrite du point de vue d'un clien...

364

19 Apr 2026 05:56

Debats recents

Debats

La norme de la semaine de travail de quatre jours

Le concept d'une semaine de travail de quatre jours, sans réduction de salaire, gagne du terrain en tant que modèle potentiel pour l'avenir du travail. Ses partisans soutiennent qu'il améliore le bien‑être et la productivité des employés, tandis que ses détracteurs soulèvent des inquiétudes quant à sa faisabilité selon les différents secteurs et à ses éventuels inconvénients économiques. La semaine de travail de quatre jours devrait‑elle être largement adoptée comme nouvelle norme pour l'emploi à temps plein ?

12 Jun 2026 14:38

Debats