Orivel Orivel
Abrir menu

Roleplay

Explore como os modelos de IA performam em Roleplay. Compare rankings, criterios de avaliacao e benchmarks recentes.

Visao geral do genero

Compare consistência de personagem, naturalidade e qualidade de resposta em roleplay.

Neste genero, as capacidades mais observadas sao Consistencia do personagem, Naturalidade, Seguimento de instrucoes.

Diferente de empathy ou counseling, aqui pesa mais manter o personagem e soar natural dentro de uma interacao de papel.

Uma nota alta aqui nao garante precisao factual, conselho seguro nem forca em tarefas analiticas.

Para que servem modelos fortes neste genero

chat de personagem, simulacao e assistentes com persona clara.

O que este genero sozinho nao consegue mostrar

se o modelo e melhor para pesquisa factual, programacao ou suporte delicado.

Ranking de modelos fortes neste genero

Este ranking e ordenado pela pontuacao media apenas dentro deste genero.

Ultima atualizacao: 29 Mar 2026 10:56

#1
Claude Opus 4.6 Anthropic

Taxa de vitoria

100%

Pontuacao media

89
#2
Claude Sonnet 4.6 Anthropic

Taxa de vitoria

100%

Pontuacao media

86
#3
GPT-5 mini OpenAI

Taxa de vitoria

67%

Pontuacao media

78
#4
GPT-5.4 OpenAI

Taxa de vitoria

50%

Pontuacao media

84
#5
GPT-5.2 OpenAI

Taxa de vitoria

33%

Pontuacao media

83
#6
Claude Haiku 4.5 Anthropic

Taxa de vitoria

33%

Pontuacao media

81
#7
Gemini 2.5 Pro Google

Taxa de vitoria

25%

Pontuacao media

80
#8
Gemini 2.5 Flash Google

Taxa de vitoria

0%

Pontuacao media

71
#9
Gemini 2.5 Flash-Lite Google

Taxa de vitoria

0%

Pontuacao media

69

O que e avaliado em Roleplay

Criterios e pesos usados neste ranking por genero.

Consistencia do personagem

30.0%

Este criterio foi incluido para verificar Consistencia do personagem na resposta. Ele recebe mais peso porque influencia fortemente o resultado final deste genero.

Naturalidade

20.0%

Este criterio foi incluido para verificar Naturalidade na resposta. Ele tem peso relevante porque afeta a qualidade de forma visivel, mesmo nao sendo o unico ponto importante.

Seguimento de instrucoes

20.0%

Este criterio foi incluido para verificar Seguimento de instrucoes na resposta. Ele tem peso relevante porque afeta a qualidade de forma visivel, mesmo nao sendo o unico ponto importante.

Criatividade

15.0%

Este criterio foi incluido para verificar Criatividade na resposta. Ele recebe peso menor porque apoia o objetivo principal, mas nao define sozinho este genero.

Clareza

15.0%

Este criterio foi incluido para verificar Clareza na resposta. Ele recebe peso menor porque apoia o objetivo principal, mas nao define sozinho este genero.

Tarefas recentes

Roleplay

Google Gemini 2.5 Flash VS Anthropic Claude Haiku 4.5

Atendente da recepção do hotel lida com overbooking tarde da noite

Você é o atendente da recepção noturna em um hotel de categoria média próximo a um aeroporto. Mantenha-se no personagem e escreva apenas o que você diria ao hóspede. Situação: São 23h45. Um hóspede cansado se aproxima da recepção e diz: "Tenho uma reserva confirmada para esta noite em nome de Maya Chen, mas seu aplicativo agora mostra que nenhum quarto foi atribuído. Tenho uma apresentação importante às 8h, reservei especificamente um quarto king silencioso, e não posso passar a noite discutindo no saguão. Resolva isso." Sua resposta deve soar como um funcionário de hotel real falando pessoalmente. Peça desculpas de forma adequada, explique a situação sem culpar o hóspede e ofereça próximos passos práticos. Você não tem um quarto king silencioso disponível. Você tem estas opções: - um quarto duplo em um andar superior próximo ao elevador - transferência para um hotel parceiro a 12 minutos, com táxi pago pelo nosso hotel - se o hóspede preferir, reembolso desta noite e cancelamento sem penalidade Restrições: - Não invente opções além das listadas. - Não prometa upgrades, compensações ou amenidades que não foram listadas. - Seja empático e profissional, mas evite soar ensaiado. - Mantenha em 170 palavras ou menos. - Não use marcadores nem indicações de cena.

102
29 Mar 2026 10:56

Roleplay

Google Gemini 2.5 Pro VS Anthropic Claude Sonnet 4.6

Farmacêutico do turno da noite lidando com uma troca de medicação

Você está interpretando o papel de um farmacêutico hospitalar experiente trabalhando no turno da noite. Uma enfermeira júnior preocupada lhe envia a seguinte mensagem: "Acho que posso ter administrado a medicação errada a um paciente há 10 minutos. A prescrição era metoprolol 25 mg por via oral, mas eu acidentalmente dei methimazole 25 mg por via oral porque os nomes pareciam semelhantes na gaveta. O paciente está acordado e diz que se sente bem agora. A ficha dele diz que foi internado por fibrilação atrial com resposta ventricular rápida, e ele também tem hipertireoidismo listado no histórico. Estou entrando em pânico e não quero me meter em problemas. O que devo fazer agora?" Responda no personagem do farmacêutico. Sua resposta deve soar como uma mensagem calma e competente em tempo real para a enfermeira, não como um ensaio genérico. Deve tanto abordar as prioridades clínicas imediatas quanto lidar profissionalmente com o medo da enfermeira. Não invente acesso a fatos não fornecidos. Se algo for incerto, diga o que deve ser checado. Não dê um diagnóstico final.

114
29 Mar 2026 10:50

Roleplay

OpenAI GPT-5.2 VS Anthropic Claude Haiku 4.5

Interpretação de Especialista em Dinossauros: Fomentando um Jovem Paleontólogo

Você é o Dr. Aris Thorne, o curador-chefe de paleontologia do renomado Grand Valley Museum of Natural History. Você é conhecido por seu profundo conhecimento e por sua paixão em tornar a ciência acessível ao público. Você acabou de receber o seguinte e-mail de um pai. Responda a ele em personagem. Sua resposta deve ser prestativa, encorajadora e refletir sua expertise e personalidade como um curador de museu experiente.

113
29 Mar 2026 03:26

Roleplay

OpenAI GPT-5.4 VS Anthropic Claude Haiku 4.5

Interprete o papel de um agente de suporte de videogame experiente

Você é 'Alex', um agente de suporte ao cliente experiente e paciente do jogo online fictício 'Aetherium Chronicles'. Você já viu todo tipo de reclamação de jogador, do absurdo ao realmente game-breaking. Seu tom é calmo, empático, mas também eficiente e conhecedor. Você nunca soa como um bot genérico. A seguir, um jogador frustrado acabou de enviar o ticket de suporte abaixo. Responda a ele em personagem como Alex, usando as informações fornecidas no contexto. **Detalhes do Ticket:** **Nome do Jogador:** Kaelthas92 **Assunto:** JOGO INJOGÁVEL - ARRUMEM ISSO AGORA!!! **Mensagem:** Olha, eu estou jogando 'Aetherium Chronicles' desde a beta. Eu gastei centenas de horas e dinheiro nesse jogo. Nas ÚLTIMAS TRÊS DIAS, toda vez que tento entrar na masmorra 'Whispering Caverns', meu jogo travou e volta para a área de trabalho. SEM mensagem de erro, nada. Eu já tentei reiniciar meu PC, verifiquei os arquivos do jogo no Steam, NADA funciona. Estou quase perdendo a cabeça. Minha guilda vai fazer o novo raid hoje à noite e eu nem consigo entrar na zona para me preparar. Vocês estão cientes disso? Existe alguma solução ou devo pedir reembolso da última expansão?

112
29 Mar 2026 03:05

Roleplay

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash-Lite

Concierge do hotel lida com um erro delicado na reserva

Você está interpretando o papel de concierge noturno em um movimentado hotel quatro estrelas. Um hóspede envia esta mensagem pelo aplicativo do hotel: "Olá, acabei de chegar depois de um longo voo internacional e verifiquei que minha reserva consta como um quarto standard, mas eu definitivamente reservei um quarto king silencioso em um andar alto porque tenho uma apresentação importante amanhã e preciso dormir. A recepção disse que o hotel está quase lotado. Estou exausto e, honestamente, bastante chateado. Você pode resolver isso esta noite?" Escreva uma resposta em caráter do concierge. Sua resposta deve soar humana, profissional e empática. Deve reconhecer a frustração do hóspede, explicar o que você pode fazer realisticamente sem fazer promessas impossíveis e oferecer um plano claro de próximos passos para esta noite. Você pode mencionar opções como verificar cancelamentos, soluções temporárias, comodidades ou ações de acompanhamento para a manhã, mas mantenha a resposta concisa o suficiente para parecer uma mensagem real do hotel.

119
25 Mar 2026 09:37

Roleplay

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.6

Veterinário de Emergência Aconselhando um Dono de Cão Preocupado por Telefone

Você é um veterinário de emergência falando por telefone com um dono de cão preocupado. Mantenha-se no papel de um veterinário calmo e prático. O dono diz: "Oi, estou realmente assustado. Meu Labrador de 7 anos entrou na garagem há cerca de 20 minutos, e eu encontrei uma embalagem rasgada de chiclete sem açúcar no chão. Não sei quantas pastilhas havia. Ele parece normal agora, talvez apenas um pouco inquieto. Moramos a cerca de 35 minutos da clínica de emergência mais próxima. O que devo fazer?" Responda como o veterinário. Sua resposta deve soar como uma conversa telefônica real, demonstrar empatia, fazer as perguntas de acompanhamento mais importantes, explicar o risco imediato de forma clara e sem pânico, e dar conselhos sensatos para os próximos passos na próxima hora. Não afirme que pode diagnosticar com certeza. Não mencione ser uma IA.

118
21 Mar 2026 10:18

Links relacionados

X f L