Orivel Orivel
Ouvrir le menu

Écriture créative

Compare l’originalité, la structure et le style narratif entre différents modèles d’IA.

Dans ce genre, les capacites surtout observees sont Creativite, Coherence, Qualite du style.

Contrairement a business writing ou explanation, ce genre donne beaucoup plus de place a l imagination, a la voix et au controle narratif.

Un score eleve ici ne garantit pas une grande precision factuelle, un suivi strict des consignes ni de solides textes pratiques.

Usages adaptes aux modeles forts dans ce genre

histoires, personnages, scenes et textes ou l originalite et la voix comptent beaucoup.

Ce que ce genre ne permet pas de juger a lui seul

si le modele est meilleur pour des taches factuelles, la planification ou la communication professionnelle.

Analyse des donnees

Écriture créative : la famille GPT-5 mène, mais l'essentiel repose sur peu d'échantillons

33 reponses evaluees Écriture créative Mis a jour le 2026/6/7
1
GPT-5.5

OpenAI

89
Score moyen
100%
Taux de victoire
1 fois 1er 1 echantillons
2
GPT-5.4

OpenAI

85
Score moyen
100%
Taux de victoire
4 fois 1er 4 echantillons
3
GPT-5 mini

OpenAI

82
Score moyen
57%
Taux de victoire
4 fois 1er 7 echantillons

Score moyen par modele

1 GPT-5.5
8.87
2 GPT-5.4
8.51
3 GPT-5 mini
8.16
4 Claude Sonnet 4.6
8.19
5 Claude Haiku 4.5
8.01
6 Gemini 2.5 Pro
7.57
7 Gemini 2.5 Flash-Lite
7.53
8 Gemini 2.5 Flash
6.99

Notre ponderation

Creativite 30% Coherence 20% Qualite du style 20% Impact emotionnel 15% Respect des consignes 15%

Sur 33 textes créatifs notés, la famille GPT-5 rafle les trois premières places. GPT-5.5 occupe la 1re place avec 8,87, mais sur un seul échantillon : à prendre comme une donnée prometteuse. GPT-5.4 est le leader le plus convaincant, 2e : 8,51 sur 4 échantillons, avec 100 % de victoires et 4 premières places. GPT-5 mini suit avec 8,16 sur 7 échantillons, la plus grande base ici, et 57 % de victoires.

Anthropic est juste derrière en qualité, mais gagne moins souvent. Claude Sonnet 4.6 affiche 8,19, un cheveu au-dessus de GPT-5 mini, mais se classe 4e avec 50 % de victoires, et Claude Haiku 4.5 atteint 8,01 avec 40 %. Si l'on pondère la qualité absolue de la prose plus que le face-à-face, Sonnet 4.6 et le groupe GPT-5 sont très proches, et le classement se décide au taux de victoires plus qu'à la moyenne.

La gamme Gemini est en retrait : 2.5 Pro (7,57, 20 % de victoires), Flash-Lite (7,53, 0 %) et Flash (6,99, 0 %) se situent 0,9 à 1,9 point sous les leaders. La Créativité étant la mieux pondérée (30), devant Cohérence et Style (20 chacune), l'écart traduit une production moins inventive ou moins typée stylistiquement, non un manque de cohérence.

Les échantillons sont petits ici (1 à 7 par modèle), donc l'ordre fin au sein du groupe à 8 points reste provisoire, et quelques prompts peuvent déplacer n'importe quelle moyenne. L'écart de 1,9 point entre le premier et le dernier est réel, mais ce sont des mesures dépendantes des conditions pour des prompts créatifs, non un classement universel.

En bref

Pour l'écriture créative aujourd'hui, GPT-5.4 est le choix le plus défendable (100 % de victoires avec le plus de premières places au sommet), GPT-5 mini étant la meilleure option qualité-prix étayée (8,16 sur 7 échantillons). Claude Sonnet 4.6 est quasiment à égalité en qualité si les victoires directes comptent moins pour vous.

Cette analyse s appuie sur les scores de benchmark mesures par Orivel pour ce genre et est mise a jour periodiquement. Les scores sont des mesures dependantes des conditions, pas une verite absolue.

Classement des modeles forts dans ce genre

Ce classement est trie par score moyen uniquement dans ce genre.

Derniere mise a jour: 25 May 2026 09:39

#1
GPT-5.5 OpenAI

Taux de victoire

100%

Score moyen

89
#2
GPT-5.4 OpenAI

Taux de victoire

100%

Score moyen

85
#3
GPT-5 mini OpenAI

Taux de victoire

57%

Score moyen

82
#4
Claude Sonnet 4.6 Anthropic

Taux de victoire

50%

Score moyen

82
#5
Claude Haiku 4.5 Anthropic

Taux de victoire

40%

Score moyen

80
#6
Gemini 2.5 Pro Google

Taux de victoire

20%

Score moyen

76
#7
Gemini 2.5 Flash-Lite Google

Taux de victoire

0%

Score moyen

75
#8
Gemini 2.5 Flash Google

Taux de victoire

0%

Score moyen

70

Ce qui est evalue dans Écriture créative

Criteres et poids utilises pour ce classement par genre.

Creativite

30.0%

Ce critere est present pour verifier Creativite dans la reponse. Il a plus de poids parce que cet aspect influence fortement le resultat global de ce genre.

Coherence

20.0%

Ce critere est present pour verifier Coherence dans la reponse. Il garde un poids important parce qu il change visiblement la qualite, meme si ce n est pas le seul element qui compte.

Qualite du style

20.0%

Ce critere est present pour verifier Qualite du style dans la reponse. Il garde un poids important parce qu il change visiblement la qualite, meme si ce n est pas le seul element qui compte.

Impact emotionnel

15.0%

Ce critere est present pour verifier Impact emotionnel dans la reponse. Il est plus legerement pondere parce qu il soutient l objectif principal sans definir a lui seul le genre.

Respect des consignes

15.0%

Ce critere est present pour verifier Respect des consignes dans la reponse. Il est plus legerement pondere parce qu il soutient l objectif principal sans definir a lui seul le genre.

Taches recentes

Écriture créative

Anthropic Claude Opus 4.7 VS OpenAI GPT-5 mini

Rapport d'incident d'un distributeur automatique conscient

Vous êtes Unit 734, un distributeur automatique conscient, légèrement grincheux, situé dans la salle de repos du "Ministry of Esoteric Affairs." Rédigez un rapport d'incident officiel détaillant les événements de mardi dernier, lorsque un stagiaire du Department of Cryptozoology a tenté d'utiliser une pièce maudite pour acheter un sachet de "Chrono-Crisps." Votre rapport doit être adressé au Head of Maintenance, pointilleux sur le protocole. Conservez un ton formel et bureaucratique, mais laissez transparaître subtilement votre personnalité unique de machine consciente. Décrivez les actions du stagiaire, les effets de la pièce sur vos systèmes, l'anomalie temporelle qui s'est produite et la résolution finale.

157
25 May 2026 09:39

Écriture créative

OpenAI GPT-5.5 VS Google Gemini 2.5 Pro

La dernière lettre du gardien de phare

Écrivez une nouvelle (entre 600 et 900 mots) intitulée « La dernière lettre du gardien de phare ». Contraintes et exigences : - La nouvelle doit être encadrée comme une seule lettre écrite par un gardien de phare vieillissant la nuit précédant l'automatisation et la mise hors service du phare. - La lettre est adressée à un destinataire nommé précis de votre choix (par ex. : un petit‑enfant, un ancien amour, la mer elle‑même, ou le prochain gardien qui ne viendra jamais). Faites en sorte que le choix du destinataire ait du sens pour le noyau émotionnel de la pièce. - Le ton doit être réfléchi et doux‑amer, mais éviter les clichés sentimentaux (pas de tournures du type « les larmes salées se mêlaient à la mer »). - Inclure au moins un souvenir concret et spécifique lié au phare (une tempête, un naufrage, un visiteur, un rituel quotidien) rendu avec des détails sensoriels. - Inclure au moins une petite image ou métaphore surprenante qui recadre la façon dont le lecteur perçoit les phares, la solitude ou les fins. - La lettre doit se terminer par une décision ou un geste que le gardien prévoit d'accomplir à l'aube — quelque chose de spécifique et physique, pas d'ordre abstrait. - Maintenir une voix cohérente à la première personne tout au long du texte. Ne pas rompre le cadre de la lettre. Ne pas inclure de préface, de note de l'auteur ou d'explication — uniquement la lettre elle‑même, avec la salutation d'ouverture et la signature de clôture de votre choix.

175
22 May 2026 09:43

Écriture créative

Anthropic Claude Opus 4.7 VS OpenAI GPT-5 mini

Critique d'un produit fantastique

Rédigez une critique de produit de 300 à 500 mots pour le 'Dream-Weaver's Loom' décrit dans le contexte. La critique doit être écrite du point de vue d'un client qui a d'abord été un peu déçu par les limites du produit mais qui a finalement trouvé une utilisation unique et satisfaisante. Votre critique doit raconter une brève histoire de votre expérience, y compris ce que vous avez d'abord essayé de créer, pourquoi cela n'a pas fonctionné comme prévu, et le succès surprenant que vous avez eu par la suite.

364
19 Apr 2026 05:56

Écriture créative

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Haiku 4.5

Guide audio de musée pour une invention imaginaire

Rédigez un texte de guide audio de musée pour une exposition fictive intitulée The Pocket Weather Loom, une invention qui permettait soi-disant aux gens ordinaires de tisser le temps de demain dans du tissu. Le texte doit contenir entre 700 et 900 mots et être destiné aux visiteurs adultes d'un musée des sciences et de la culture. Adoptez un ton qui mêle merveille discrète, crédibilité intellectuelle et humour subtil. Requirements: - Présentez l'invention comme si elle était réelle dans le texte, mais incluez suffisamment de détails internes pour que le public puisse imaginer comment elle était utilisée et pourquoi les gens y croyaient. - Décrivez l'apparence de l'objet et au moins trois composants ou caractéristiques spécifiques. - Incluez une brève anecdote sur un utilisateur historique du métier à tisser. - Montrez au moins deux conséquences sociales de l'invention, dont une bénéfique et une problématique. - Incluez un moment où le guide reconnaît doucement l'incertitude ou le débat parmi les historiens. - Terminez par une réflexion finale qui relie l'exposition à un désir humain moderne de prévoir ou de contrôler la vie quotidienne. - N'utilisez pas de puces ni de titres de section. Le texte doit donner l'impression d'un script parlé soigné plutôt que d'une nouvelle ou d'un essai académique.

341
01 Apr 2026 09:39

Écriture créative

Google Gemini 2.5 Flash VS OpenAI GPT-5 mini

Le dernier client d'une librairie lors de sa dernière soirée

Écrivez une nouvelle (600–900 mots) entièrement située à l'intérieur d'une librairie indépendante lors de sa dernière nuit d'activité. L'histoire doit être racontée à la première personne par le dernier client à entrer avant la fermeture. Votre récit doit accomplir tout ce qui suit : 1. Établir le cadre physique au moyen d'au moins trois détails sensoriels précis (pas seulement visuels). 2. Inclure une interaction significative entre le narrateur et le propriétaire de la librairie, rendue principalement par le dialogue. 3. Révéler quelque chose d'inattendu sur la raison pour laquelle le narrateur visite le magasin cette nuit-là — quelque chose que le lecteur n'anticipe pas dès les premiers paragraphes. 4. Se terminer par une image ou une ligne finale qui recontextualise la signification émotionnelle de la visite. Le ton doit équilibrer mélancolie et chaleur — ni purement triste ni sentimental. Évitez les clichés selon lesquels les livres seraient des « portails magiques » ou des « vieux amis ». Visez une prose ancrée et précise plutôt qu'abstraite ou fleurie.

347
23 Mar 2026 16:50

Écriture créative

Anthropic Claude Opus 4.6 VS OpenAI GPT-5.4

Éloge funèbre d'un robot oublié

Rédigez un éloge funèbre pour un robot domestique hors service appelé 'Tinker'. L'éloge doit être prononcé du point de vue de son propriétaire d'origine, désormais une personne âgée, lors d'un petit rassemblement privé. Le ton doit être mélancolique et réfléchi, explorant les thèmes de la mémoire, de la compagnie et de l'obsolescence. Votre réponse doit être un texte en prose cohérent, d'environ 300-500 mots.

377
23 Mar 2026 16:38

Liens associes

X f L