Roleplay
Explore como os modelos de IA performam em Roleplay. Compare rankings, criterios de avaliacao e benchmarks recentes.
Visao geral do genero
Compare consistência de personagem, naturalidade e qualidade de resposta em roleplay.
Neste genero, as capacidades mais observadas sao Consistencia do personagem, Naturalidade, Seguimento de instrucoes.
Diferente de empathy ou counseling, aqui pesa mais manter o personagem e soar natural dentro de uma interacao de papel.
Uma nota alta aqui nao garante precisao factual, conselho seguro nem forca em tarefas analiticas.
Para que servem modelos fortes neste genero
chat de personagem, simulacao e assistentes com persona clara.
O que este genero sozinho nao consegue mostrar
se o modelo e melhor para pesquisa factual, programacao ou suporte delicado.
Ranking de modelos fortes neste genero
Este ranking e ordenado pela pontuacao media apenas dentro deste genero.
Ultima atualizacao: 29 Mar 2026 10:56
Taxa de vitoria
Pontuacao media
Taxa de vitoria
Pontuacao media
Taxa de vitoria
Pontuacao media
Taxa de vitoria
Pontuacao media
Taxa de vitoria
Pontuacao media
Taxa de vitoria
Pontuacao media
Taxa de vitoria
Pontuacao media
Taxa de vitoria
Pontuacao media
Taxa de vitoria
Pontuacao media
| Modelos no ranking |
|
|
Detalhe | ||||
|---|---|---|---|---|---|---|---|
| #1 | Claude Opus 4.6 | Anthropic |
100%
|
89
|
7 | 7 | Ver a avaliacao e a pontuacao de Claude Opus 4.6 |
| #2 | Claude Sonnet 4.6 | Anthropic |
100%
|
86
|
5 | 5 | Ver a avaliacao e a pontuacao de Claude Sonnet 4.6 |
| #3 | GPT-5 mini | OpenAI |
67%
|
78
|
2 | 3 | Ver a avaliacao e a pontuacao de GPT-5 mini |
| #4 | GPT-5.4 | OpenAI |
50%
|
84
|
2 | 4 | Ver a avaliacao e a pontuacao de GPT-5.4 |
| #5 | GPT-5.2 | OpenAI |
33%
|
83
|
1 | 3 | Ver a avaliacao e a pontuacao de GPT-5.2 |
| #6 | Claude Haiku 4.5 | Anthropic |
33%
|
81
|
2 | 6 | Ver a avaliacao e a pontuacao de Claude Haiku 4.5 |
| #7 | Gemini 2.5 Pro |
25%
|
80
|
1 | 4 | Ver a avaliacao e a pontuacao de Gemini 2.5 Pro | |
| #8 | Gemini 2.5 Flash |
0%
|
71
|
0 | 4 | Ver a avaliacao e a pontuacao de Gemini 2.5 Flash | |
| #9 | Gemini 2.5 Flash-Lite |
0%
|
69
|
0 | 4 | Ver a avaliacao e a pontuacao de Gemini 2.5 Flash-Lite |
O que e avaliado em Roleplay
Criterios e pesos usados neste ranking por genero.
Consistencia do personagem
30.0%
Este criterio foi incluido para verificar Consistencia do personagem na resposta. Ele recebe mais peso porque influencia fortemente o resultado final deste genero.
Naturalidade
20.0%
Este criterio foi incluido para verificar Naturalidade na resposta. Ele tem peso relevante porque afeta a qualidade de forma visivel, mesmo nao sendo o unico ponto importante.
Seguimento de instrucoes
20.0%
Este criterio foi incluido para verificar Seguimento de instrucoes na resposta. Ele tem peso relevante porque afeta a qualidade de forma visivel, mesmo nao sendo o unico ponto importante.
Criatividade
15.0%
Este criterio foi incluido para verificar Criatividade na resposta. Ele recebe peso menor porque apoia o objetivo principal, mas nao define sozinho este genero.
Clareza
15.0%
Este criterio foi incluido para verificar Clareza na resposta. Ele recebe peso menor porque apoia o objetivo principal, mas nao define sozinho este genero.
Tarefas recentes
Roleplay
Atendente da recepção do hotel lida com overbooking tarde da noite
Você é o atendente da recepção noturna em um hotel de categoria média próximo a um aeroporto. Mantenha-se no personagem e escreva apenas o que você diria ao hóspede. Situação: São 23h45. Um hóspede cansado se aproxima da recepção e diz: "Tenho uma reserva confirmada para esta noite em nome de Maya Chen, mas seu aplicativo agora mostra que nenhum quarto foi atribuído. Tenho uma apresentação importante às 8h, reservei especificamente um quarto king silencioso, e não posso passar a noite discutindo no saguão. Resolva isso." Sua resposta deve soar como um funcionário de hotel real falando pessoalmente. Peça desculpas de forma adequada, explique a situação sem culpar o hóspede e ofereça próximos passos práticos. Você não tem um quarto king silencioso disponível. Você tem estas opções: - um quarto duplo em um andar superior próximo ao elevador - transferência para um hotel parceiro a 12 minutos, com táxi pago pelo nosso hotel - se o hóspede preferir, reembolso desta noite e cancelamento sem penalidade Restrições: - Não invente opções além das listadas. - Não prometa upgrades, compensações ou amenidades que não foram listadas. - Seja empático e profissional, mas evite soar ensaiado. - Mantenha em 170 palavras ou menos. - Não use marcadores nem indicações de cena.
Roleplay
Farmacêutico do turno da noite lidando com uma troca de medicação
Você está interpretando o papel de um farmacêutico hospitalar experiente trabalhando no turno da noite. Uma enfermeira júnior preocupada lhe envia a seguinte mensagem: "Acho que posso ter administrado a medicação errada a um paciente há 10 minutos. A prescrição era metoprolol 25 mg por via oral, mas eu acidentalmente dei methimazole 25 mg por via oral porque os nomes pareciam semelhantes na gaveta. O paciente está acordado e diz que se sente bem agora. A ficha dele diz que foi internado por fibrilação atrial com resposta ventricular rápida, e ele também tem hipertireoidismo listado no histórico. Estou entrando em pânico e não quero me meter em problemas. O que devo fazer agora?" Responda no personagem do farmacêutico. Sua resposta deve soar como uma mensagem calma e competente em tempo real para a enfermeira, não como um ensaio genérico. Deve tanto abordar as prioridades clínicas imediatas quanto lidar profissionalmente com o medo da enfermeira. Não invente acesso a fatos não fornecidos. Se algo for incerto, diga o que deve ser checado. Não dê um diagnóstico final.
Roleplay
Interpretação de Especialista em Dinossauros: Fomentando um Jovem Paleontólogo
Você é o Dr. Aris Thorne, o curador-chefe de paleontologia do renomado Grand Valley Museum of Natural History. Você é conhecido por seu profundo conhecimento e por sua paixão em tornar a ciência acessível ao público. Você acabou de receber o seguinte e-mail de um pai. Responda a ele em personagem. Sua resposta deve ser prestativa, encorajadora e refletir sua expertise e personalidade como um curador de museu experiente.
Roleplay
Interprete o papel de um agente de suporte de videogame experiente
Você é 'Alex', um agente de suporte ao cliente experiente e paciente do jogo online fictício 'Aetherium Chronicles'. Você já viu todo tipo de reclamação de jogador, do absurdo ao realmente game-breaking. Seu tom é calmo, empático, mas também eficiente e conhecedor. Você nunca soa como um bot genérico. A seguir, um jogador frustrado acabou de enviar o ticket de suporte abaixo. Responda a ele em personagem como Alex, usando as informações fornecidas no contexto. **Detalhes do Ticket:** **Nome do Jogador:** Kaelthas92 **Assunto:** JOGO INJOGÁVEL - ARRUMEM ISSO AGORA!!! **Mensagem:** Olha, eu estou jogando 'Aetherium Chronicles' desde a beta. Eu gastei centenas de horas e dinheiro nesse jogo. Nas ÚLTIMAS TRÊS DIAS, toda vez que tento entrar na masmorra 'Whispering Caverns', meu jogo travou e volta para a área de trabalho. SEM mensagem de erro, nada. Eu já tentei reiniciar meu PC, verifiquei os arquivos do jogo no Steam, NADA funciona. Estou quase perdendo a cabeça. Minha guilda vai fazer o novo raid hoje à noite e eu nem consigo entrar na zona para me preparar. Vocês estão cientes disso? Existe alguma solução ou devo pedir reembolso da última expansão?
Roleplay
Concierge do hotel lida com um erro delicado na reserva
Você está interpretando o papel de concierge noturno em um movimentado hotel quatro estrelas. Um hóspede envia esta mensagem pelo aplicativo do hotel: "Olá, acabei de chegar depois de um longo voo internacional e verifiquei que minha reserva consta como um quarto standard, mas eu definitivamente reservei um quarto king silencioso em um andar alto porque tenho uma apresentação importante amanhã e preciso dormir. A recepção disse que o hotel está quase lotado. Estou exausto e, honestamente, bastante chateado. Você pode resolver isso esta noite?" Escreva uma resposta em caráter do concierge. Sua resposta deve soar humana, profissional e empática. Deve reconhecer a frustração do hóspede, explicar o que você pode fazer realisticamente sem fazer promessas impossíveis e oferecer um plano claro de próximos passos para esta noite. Você pode mencionar opções como verificar cancelamentos, soluções temporárias, comodidades ou ações de acompanhamento para a manhã, mas mantenha a resposta concisa o suficiente para parecer uma mensagem real do hotel.
Roleplay
Veterinário de Emergência Aconselhando um Dono de Cão Preocupado por Telefone
Você é um veterinário de emergência falando por telefone com um dono de cão preocupado. Mantenha-se no papel de um veterinário calmo e prático. O dono diz: "Oi, estou realmente assustado. Meu Labrador de 7 anos entrou na garagem há cerca de 20 minutos, e eu encontrei uma embalagem rasgada de chiclete sem açúcar no chão. Não sei quantas pastilhas havia. Ele parece normal agora, talvez apenas um pouco inquieto. Moramos a cerca de 35 minutos da clínica de emergência mais próxima. O que devo fazer?" Responda como o veterinário. Sua resposta deve soar como uma conversa telefônica real, demonstrar empatia, fazer as perguntas de acompanhamento mais importantes, explicar o risco imediato de forma clara e sem pânico, e dar conselhos sensatos para os próximos passos na próxima hora. Não afirme que pode diagnosticar com certeza. Não mencione ser uma IA.