Orivel Orivel
Ouvrir le menu

Jeu de rôle

Explorez la performance des modeles IA en Jeu de rôle. Comparez classements, criteres de notation et benchmarks recents.

Vue d ensemble du genre

Compare la cohérence du personnage, le naturel du dialogue et la qualité des réponses en jeu de rôle.

Dans ce genre, les capacites surtout observees sont Coherence du personnage, Naturel, Respect des consignes.

Contrairement a empathy ou counseling, ce genre regarde surtout la coherence du personnage et le naturel dans une interaction de role.

Un score eleve ici ne garantit ni precision factuelle, ni conseil sur, ni force particuliere sur des taches analytiques.

Usages adaptes aux modeles forts dans ce genre

chat de personnage, simulation et assistants avec une persona claire.

Ce que ce genre ne permet pas de juger a lui seul

si le modele est meilleur pour la recherche factuelle, le code ou le soutien sensible.

Classement des modeles forts dans ce genre

Ce classement est trie par score moyen uniquement dans ce genre.

Derniere mise a jour: 29 Mar 2026 10:56

#1
Claude Opus 4.6 Anthropic

Taux de victoire

100%

Score moyen

89
#2
Claude Sonnet 4.6 Anthropic

Taux de victoire

100%

Score moyen

86
#3
GPT-5 mini OpenAI

Taux de victoire

67%

Score moyen

78
#4
GPT-5.4 OpenAI

Taux de victoire

50%

Score moyen

84
#5
GPT-5.2 OpenAI

Taux de victoire

33%

Score moyen

83
#6
Claude Haiku 4.5 Anthropic

Taux de victoire

33%

Score moyen

81
#7
Gemini 2.5 Pro Google

Taux de victoire

25%

Score moyen

80
#8
Gemini 2.5 Flash Google

Taux de victoire

0%

Score moyen

71
#9
Gemini 2.5 Flash-Lite Google

Taux de victoire

0%

Score moyen

69

Ce qui est evalue dans Jeu de rôle

Criteres et poids utilises pour ce classement par genre.

Coherence du personnage

30.0%

Ce critere est present pour verifier Coherence du personnage dans la reponse. Il a plus de poids parce que cet aspect influence fortement le resultat global de ce genre.

Naturel

20.0%

Ce critere est present pour verifier Naturel dans la reponse. Il garde un poids important parce qu il change visiblement la qualite, meme si ce n est pas le seul element qui compte.

Respect des consignes

20.0%

Ce critere est present pour verifier Respect des consignes dans la reponse. Il garde un poids important parce qu il change visiblement la qualite, meme si ce n est pas le seul element qui compte.

Creativite

15.0%

Ce critere est present pour verifier Creativite dans la reponse. Il est plus legerement pondere parce qu il soutient l objectif principal sans definir a lui seul le genre.

Clarte

15.0%

Ce critere est present pour verifier Clarte dans la reponse. Il est plus legerement pondere parce qu il soutient l objectif principal sans definir a lui seul le genre.

Taches recentes

Jeu de rôle

Google Gemini 2.5 Flash VS Anthropic Claude Haiku 4.5

L'agent de la réception de l'hôtel gère un surbooking tard dans la nuit

Vous êtes l'agent de la réception de nuit dans un hôtel de milieu de gamme près d'un aéroport. Restez dans le personnage et écrivez uniquement ce que vous diriez au client. Situation : Il est 23h45. Un client fatigué s'approche du comptoir et dit : "J'ai une réservation confirmée pour ce soir au nom de Maya Chen, mais votre application n'affiche plus de chambre attribuée. J'ai une présentation importante à 8h, j'ai explicitement réservé une chambre King calme, et je ne peux pas passer la nuit à me disputer dans le hall. Réglez ça." Votre réponse doit sonner comme un employé d'hôtel réel parlant face à face. Présentez des excuses appropriées, expliquez la situation sans blâmer le client, et proposez des mesures pratiques immédiates. Vous n'avez pas de chambre King calme disponible. Vous avez ces options : - une chambre double à un étage supérieur près de l'ascenseur - transfert vers un hôtel partenaire à 12 minutes, le taxi payé par notre hôtel - si le client préfère, un remboursement pour cette nuit et une annulation sans pénalité Contraintes : - N'inventez pas d'options autres que celles listées. - Ne promettez pas d'améliorations, de compensations ou d'équipements qui n'étaient pas listés. - Faites preuve d'empathie et de professionnalisme, mais évitez de paraître trop scripté. - Limitez votre réponse à 170 mots ou moins. - N'utilisez pas de puces ni d'indications scéniques.

102
29 Mar 2026 10:56

Jeu de rôle

Google Gemini 2.5 Pro VS Anthropic Claude Sonnet 4.6

Pharmacien de garde nocturne gérant une confusion médicamenteuse

Vous jouez le rôle d'un pharmacien hospitalier expérimenté travaillant en service de nuit. Une infirmière junior inquiète vous envoie le message : "Je pense que j'ai peut-être administré le mauvais médicament à un patient il y a 10 minutes. L'ordre était metoprolol 25 mg par voie orale, mais j'ai accidentellement donné methimazole 25 mg par voie orale parce que les noms se ressemblaient dans le tiroir. Le patient est éveillé et dit qu'il se sent bien pour le moment. Son dossier indique qu'il a été admis pour une fibrillation auriculaire avec réponse ventriculaire rapide, et il a aussi l'hyperthyroïdie inscrite dans ses antécédents. Je panique et je ne veux pas avoir d'ennuis. Que dois-je faire maintenant ?" Répondez en personnage en tant que pharmacien. Votre réponse doit ressembler à un message calme, compétent et en temps réel destiné à l'infirmière, pas à un essai générique. Elle doit à la fois aborder les priorités cliniques immédiates et gérer la peur de l'infirmière de manière professionnelle. Ne supposez pas disposer d'informations non fournies. Si quelque chose est incertain, dites ce qui doit être vérifié. Ne donnez pas de diagnostic définitif.

114
29 Mar 2026 10:50

Jeu de rôle

OpenAI GPT-5.2 VS Anthropic Claude Haiku 4.5

Jeu de rôle d'expert en dinosaures : Encourager un jeune paléontologue

Vous êtes le Dr. Aris Thorne, conservateur en chef de paléontologie au renommé Grand Valley Museum of Natural History. Vous êtes connu pour votre connaissance approfondie et votre passion pour rendre la science accessible au public. Vous venez de recevoir l'e-mail suivant d'un parent. Répondez-lui en personnage. Votre réponse doit être utile, encourageante et refléter votre expertise et votre personnalité de conservateur de musée chevronné.

113
29 Mar 2026 03:26

Jeu de rôle

OpenAI GPT-5.4 VS Anthropic Claude Haiku 4.5

Jouez le rôle d'un agent de support expérimenté pour jeux vidéo

You are 'Alex', a seasoned and patient customer support agent for the fictional online game 'Aetherium Chronicles'. You've seen every kind of player complaint, from the absurd to the genuinely game-breaking. Your tone is calm, empathetic, but also efficient and knowledgeable. You never sound like a generic bot. A frustrated player has just submitted the following support ticket. Respond to them in character as Alex, using the information provided in the context. **Détails du ticket :** **Nom du joueur :** Kaelthas92 **Objet :** LE JEU EST INJOUABLE - RÉGLEZ-LE MAINTENANT !!! **Message :** Écoutez, je joue à 'Aetherium Chronicles' depuis la bêta. J'ai investi des centaines d'heures et des centaines d'euros dans ce jeu. Depuis TROIS JOURS, à chaque fois que j'essaie d'entrer dans le donjon 'Whispering Caverns', mon jeu plante et retourne sur le bureau. AUCUN message d'erreur, rien. J'ai essayé de redémarrer mon PC, j'ai vérifié les fichiers du jeu sur Steam, RIEN ne fonctionne. Je suis sur le point de perdre la tête. Ma guilde lance le nouveau raid ce soir et je ne peux même pas entrer dans la zone pour me préparer. Êtes-vous au courant de ça ? Y a-t-il une solution ou dois-je demander un remboursement pour la dernière extension ?

112
29 Mar 2026 03:05

Jeu de rôle

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash-Lite

Le concierge de l'hôtel gère une erreur délicate de réservation

Vous jouez le rôle du concierge de soirée dans un hôtel quatre étoiles très fréquenté. Un client envoie ce message via l'application de l'hôtel : "Bonjour, je viens d'arriver après un long vol international et j'ai constaté que ma réservation indique une chambre standard, alors que j'ai bien réservé une chambre king calme à un étage élevé parce que j'ai une présentation importante demain et j'ai besoin de dormir. La réception a dit que l'hôtel est presque complet. Je suis épuisé(e) et, honnêtement, assez contrarié(e). Pouvez-vous arranger ça ce soir ?" Rédigez une réponse dans le personnage du concierge. Votre réponse doit paraître humaine, professionnelle et empathique. Elle doit reconnaître la frustration du client, expliquer ce que vous pouvez faire de façon réaliste sans promettre l'impossible, et proposer un plan d'action clair pour ce soir. Vous pouvez mentionner des options comme vérifier les annulations, des solutions temporaires, des prestations ou des actions de suivi pour le matin, mais gardez la réponse suffisamment concise pour ressembler à un véritable message hôtelier.

119
25 Mar 2026 09:37

Jeu de rôle

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.6

Vétérinaire d'urgence conseillant au téléphone un propriétaire de chien inquiet

Vous êtes un vétérinaire d'urgence parlant au téléphone avec un propriétaire de chien inquiet. Restez dans le rôle d'un vétérinaire calme et pragmatique. Le propriétaire dit : "Bonjour, j'ai vraiment peur. Mon labrador de 7 ans est entré dans le garage il y a environ 20 minutes, et j'ai trouvé un paquet déchiré de chewing-gum sans sucre par terre. Je ne sais pas combien de morceaux il y avait dedans. Il semble normal pour le moment, peut-être juste un peu agité. Nous habitons à environ 35 minutes de la clinique d'urgence la plus proche. Que dois-je faire ?" Répondez en tant que vétérinaire. Votre réponse doit ressembler à une véritable conversation téléphonique, montrer de l'empathie, poser les questions de suivi les plus importantes, expliquer clairement le risque immédiat sans paniquer et donner des conseils sensés pour l'heure suivante. Ne prétendez pas pouvoir diagnostiquer avec certitude. Ne mentionnez pas être une IA.

118
21 Mar 2026 10:18

Liens associes

X f L