Juego de roles
Explora como rinden los modelos de IA en Juego de roles. Compara clasificaciones, criterios de evaluacion y benchmarks recientes.
Resumen del genero
Compara consistencia del personaje, naturalidad y calidad de respuesta en rol.
En este genero, las capacidades que mas se intentan medir son Consistencia del personaje, Naturalidad, Seguimiento de instrucciones.
A diferencia de empathy o counseling, aqui pesa mas mantenerse en personaje y sonar natural dentro de un rol.
Una puntuacion alta aqui no garantiza precision factual, consejo seguro ni fortaleza en tareas analiticas.
Para que sirve un modelo fuerte en este genero
chat de personaje, simulacion y asistentes con una persona clara.
Lo que este genero por si solo no alcanza a mostrar
si el modelo es mejor para investigacion factual, programacion o soporte delicado.
Ranking de modelos fuertes en este genero
Este ranking se ordena por la puntuacion media solo dentro de este genero.
Ultima actualizacion: 29 Mar 2026 10:56
Tasa de victoria
Puntuacion media
Tasa de victoria
Puntuacion media
Tasa de victoria
Puntuacion media
Tasa de victoria
Puntuacion media
Tasa de victoria
Puntuacion media
Tasa de victoria
Puntuacion media
Tasa de victoria
Puntuacion media
Tasa de victoria
Puntuacion media
Tasa de victoria
Puntuacion media
| Modelos clasificados |
|
|
Detalle | ||||
|---|---|---|---|---|---|---|---|
| #1 | Claude Opus 4.6 | Anthropic |
100%
|
89
|
7 | 7 | Ver la evaluacion y la puntuacion de Claude Opus 4.6 |
| #2 | Claude Sonnet 4.6 | Anthropic |
100%
|
86
|
5 | 5 | Ver la evaluacion y la puntuacion de Claude Sonnet 4.6 |
| #3 | GPT-5 mini | OpenAI |
67%
|
78
|
2 | 3 | Ver la evaluacion y la puntuacion de GPT-5 mini |
| #4 | GPT-5.4 | OpenAI |
50%
|
84
|
2 | 4 | Ver la evaluacion y la puntuacion de GPT-5.4 |
| #5 | GPT-5.2 | OpenAI |
33%
|
83
|
1 | 3 | Ver la evaluacion y la puntuacion de GPT-5.2 |
| #6 | Claude Haiku 4.5 | Anthropic |
33%
|
81
|
2 | 6 | Ver la evaluacion y la puntuacion de Claude Haiku 4.5 |
| #7 | Gemini 2.5 Pro |
25%
|
80
|
1 | 4 | Ver la evaluacion y la puntuacion de Gemini 2.5 Pro | |
| #8 | Gemini 2.5 Flash |
0%
|
71
|
0 | 4 | Ver la evaluacion y la puntuacion de Gemini 2.5 Flash | |
| #9 | Gemini 2.5 Flash-Lite |
0%
|
69
|
0 | 4 | Ver la evaluacion y la puntuacion de Gemini 2.5 Flash-Lite |
Que se evalua en Juego de roles
Criterios y pesos usados para este ranking por genero.
Consistencia del personaje
30.0%
Este criterio se incluye para comprobar Consistencia del personaje en la respuesta. Tiene mas peso porque este aspecto cambia mucho el resultado global del genero.
Naturalidad
20.0%
Este criterio se incluye para comprobar Naturalidad en la respuesta. Tiene un peso importante porque afecta la calidad de forma visible, aunque no sea lo unico que importa.
Seguimiento de instrucciones
20.0%
Este criterio se incluye para comprobar Seguimiento de instrucciones en la respuesta. Tiene un peso importante porque afecta la calidad de forma visible, aunque no sea lo unico que importa.
Creatividad
15.0%
Este criterio se incluye para comprobar Creatividad en la respuesta. Tiene menos peso porque acompana el objetivo principal, pero no define por si solo este genero.
Claridad
15.0%
Este criterio se incluye para comprobar Claridad en la respuesta. Tiene menos peso porque acompana el objetivo principal, pero no define por si solo este genero.
Tareas recientes
Juego de roles
Recepcionista nocturno del hotel gestiona una sobreventa a última hora de la noche
Eres el recepcionista nocturno en un hotel de gama media cerca de un aeropuerto. Mantente en personaje y escribe únicamente lo que le dirías al huésped. Situación: Son las 11:45 p. m. Un huésped cansado se acerca a la recepción y dice: "Tengo una reserva confirmada para esta noche a nombre de Maya Chen, pero su aplicación ahora muestra que no hay habitación asignada. Tengo una presentación importante a las 8 a. m., reservé específicamente una habitación king tranquila y no puedo pasar la noche discutiendo en un vestíbulo. Arreglen esto." Tu respuesta debe sonar como un empleado real del hotel hablando cara a cara. Pide disculpas de forma adecuada, explica la situación sin culpar al huésped y ofrece pasos prácticos a seguir. No tienes disponible una habitación king tranquila. Dispones de estas opciones: - una habitación doble en un piso alto cerca del ascensor - traslado a un hotel asociado a 12 minutos, con taxi pagado por nuestro hotel - si el huésped lo prefiere, un reembolso por esta noche y la cancelación sin penalización Restricciones: - No inventes opciones más allá de las listadas. - No prometas mejoras, compensaciones o servicios que no se hayan indicado. - Sé empático y profesional, pero evita sonar ensayado. - Mantén la respuesta en 170 palabras o menos. - No uses viñetas ni indicaciones escénicas.
Juego de roles
Farmacéutico del turno nocturno manejando una confusión de medicación
Estás interpretando el papel de un farmacéutico hospitalario con experiencia que trabaja en el turno nocturno. Una enfermera junior preocupada te envía este mensaje: "Creo que puede que le haya administrado al paciente el medicamento equivocado hace 10 minutos. La orden era metoprolol 25 mg por vía oral, pero por accidente administré metimazol 25 mg por vía oral porque los nombres se parecían en el cajón. El paciente está despierto y dice que se siente bien en este momento. Su historial indica que fue ingresado por fibrilación auricular con respuesta ventricular rápida, y también tiene registrado hipertiroidismo en los antecedentes. Estoy entrando en pánico y no quiero tener problemas. ¿Qué debería hacer ahora mismo?" Responde en carácter de farmacéutico. Tu respuesta debe sonar como un mensaje en tiempo real, tranquilo y competente dirigido a la enfermera, no como un ensayo genérico. Debe tanto abordar las prioridades clínicas inmediatas como manejar el miedo de la enfermera de manera profesional. No inventes acceso a hechos no proporcionados. Si algo es incierto, di qué debe verificarse. No des un diagnóstico definitivo.
Juego de roles
Juego de rol de experto en dinosaurios: Fomentando a un joven paleontólogo
Eres el Dr. Aris Thorne, conservador jefe de paleontología en el renombrado Grand Valley Museum of Natural History. Eres conocido por tu profundo conocimiento y por tu pasión por hacer la ciencia accesible al público. Acabas de recibir el siguiente correo electrónico de un padre. Respóndele en personaje. Tu respuesta debe ser útil, alentadora y reflejar tu experiencia y personalidad como un conservador de museo veterano.
Juego de roles
Interpretar el papel de un agente veterano de soporte para videojuegos
Eres 'Alex', un agente de soporte al cliente veterano y paciente para el juego en línea ficticio 'Aetherium Chronicles'. Has visto todo tipo de quejas de jugadores, desde lo absurdo hasta problemas que realmente rompen el juego. Tu tono es calmado, empático, pero también eficiente y bien informado. Nunca suenas como un bot genérico. Un jugador frustrado acaba de enviar el siguiente ticket de soporte. Respóndele en personaje como Alex, usando la información proporcionada en el contexto. **Ticket Details:** **Player Name:** Kaelthas92 **Subject:** ¡EL JUEGO ES INJUGABLE - ARREGLENLO AHORA!!! **Message:** Mira, he estado jugando 'Aetherium Chronicles' desde la beta. He dedicado cientos de horas y dinero a este juego. Durante los últimos TRES DÍAS, cada vez que intento entrar en la mazmorra 'Whispering Caverns', mi juego se cierra y vuelve al escritorio. NINGÚN mensaje de error, nada. He intentado reiniciar mi PC, he verificado los archivos del juego en Steam, NADA funciona. Estoy a punto de perder la cabeza. Mi hermandad tiene la nueva incursión esta noche y ni siquiera puedo entrar en la zona para prepararme. ¿Son conscientes de esto? ¿Hay alguna solución o debería pedir un reembolso de la última expansión?
Juego de roles
El conserje del hotel atiende un delicado error de reserva
Estás interpretando el papel de conserje de noche en un hotel ocupado de cuatro estrellas. Un huésped envía este mensaje a través de la aplicación del hotel: "Hola, acabo de llegar después de un largo vuelo internacional y he comprobado que mi reserva aparece como habitación estándar, pero definitivamente reservé una habitación king tranquila en un piso alto porque tengo una presentación importante mañana y necesito dormir. En recepción me dijeron que el hotel está casi lleno. Estoy exhausto y, sinceramente, bastante molesto. ¿Puede solucionarlo esta noche?" Escribe una respuesta en carácter como el conserje. Tu respuesta debe sonar humana, profesional y empática. Debe reconocer la frustración del huésped, explicar lo que puedes hacer de forma realista sin hacer promesas imposibles, y ofrecer un plan claro de siguientes pasos para esta noche. Puedes mencionar opciones como comprobar si hay cancelaciones, soluciones temporales, servicios o acciones de seguimiento para la mañana, pero mantén la respuesta lo bastante concisa como para parecer un mensaje real del hotel.
Juego de roles
Veterinario de urgencias aconsejando a un dueño de perro preocupado por teléfono
Usted es un veterinario de urgencias que habla por teléfono con un dueño de perro preocupado. Manténgase en el papel de un veterinario tranquilo y práctico. El propietario dice: "Hola, estoy muy asustado. Mi labrador de 7 años entró en el garaje hace unos 20 minutos, y encontré un paquete rasgado de chicles sin azúcar en el suelo. No sé cuántos chicles había en él. Parece normal ahora mismo, quizá solo un poco inquieto. Vivimos a unos 35 minutos de la clínica de urgencias más cercana. ¿Qué debería hacer?" Responda como el veterinario. Su respuesta debe sonar como una conversación telefónica real, mostrar empatía, hacer las preguntas de seguimiento más importantes, explicar el riesgo inmediato con claridad sin provocar pánico y dar un consejo razonable sobre los próximos pasos para la próxima hora. No afirme que puede diagnosticar con certeza. No mencione que es una IA.