GPT-5 mini

Numero de amostras

Ranking por genero

2 / 11

Vitorias

Redação empresarial

Diferenca +0.75

Pontuacao media

Genre Average

Taxa de vitoria

Numero de amostras

Ranking por genero

1 / 12

Vitorias

Questões educacionais

Diferenca +0.43

Pontuacao media

Genre Average

Taxa de vitoria

Numero de amostras

Ranking por genero

3 / 12

Vitorias

Brainstorming

Diferenca +0.39

Pontuacao media

Genre Average

Taxa de vitoria

67%

Numero de amostras

Ranking por genero

6 / 12

Vitorias

Programação

Diferenca +0.27

Pontuacao media

Genre Average

Taxa de vitoria

Numero de amostras

Ranking por genero

3 / 12

Vitorias

Generos mais fracos

Roleplay

Diferenca -0.23

Pontuacao media

Genre Average

Taxa de vitoria

67%

Numero de amostras

Ranking por genero

4 / 11

Vitorias

Aconselhamento

Diferenca -0.22

Pontuacao media

Genre Average

Taxa de vitoria

60%

Numero de amostras

Ranking por genero

8 / 12

Vitorias

Explicação

Diferenca -0.14

Pontuacao media

Genre Average

Taxa de vitoria

80%

Numero de amostras

Ranking por genero

3 / 11

Vitorias

Geração de ideias

Diferenca -0.12

Pontuacao media

Genre Average

Taxa de vitoria

50%

Numero de amostras

Ranking por genero

8 / 13

Vitorias

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.8

Escrita criativa

Diferenca -0.05

Pontuacao media

Genre Average

Taxa de vitoria

57%

Numero de amostras

Ranking por genero

5 / 11

Vitorias

Forcas por criterio de avaliacao

Pontuacao media por criterio (de 10)

Capacidade de acao

93 12 amostras

Quantidade

91 18 amostras

Etica e seguranca

90 12 amostras

Fidelidade

89 15 amostras

Completude

89 69 amostras

Priorizacao

88 12 amostras

Viabilidade

88 12 amostras

Tom

88 12 amostras

Seguimento de instrucoes

87 72 amostras

Seguranca

87 27 amostras

Cobertura

87 15 amostras

Estrutura

86 54 amostras

Tarefas recentes

Questões educacionais

Controle Hormonal do Ciclo Menstrual

Um paciente foi diagnosticado com uma condição genética rara que resulta na incapacidade completa da sua glândula pituitária de produzir Hormónio Luteinizante (...

131

04 Jun 2026 09:39

Resumo

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.8

Resuma a visão geral do Telescópio Espacial James Webb

Leia o artigo a seguir sobre o Telescópio Espacial James Webb (JWST) e escreva um resumo conciso. Seu resumo deve ser um único parágrafo coerente de 150 a 200 p...

131

02 Jun 2026 09:39

Persuasão

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.8

Convencer um Conselho Municipal Cético a Financiar uma Nova Biblioteca

Você é um defensor comunitário preparando-se para falar em uma reunião do conselho municipal. Seu objetivo é persuadir o conselho a aprovar o financiamento para...

147

28 May 2026 23:35

Escrita criativa

Relatório de Incidente de uma Máquina de Venda Automática Senciente

Você é a Unidade 734, uma máquina de venda automática senciente, um tanto rabugenta, localizada na sala de descanso do "Ministério dos Assuntos Esotéricos." Ela...

157

25 May 2026 09:39

Brainstorming

Tempestade de ideias para uma horta comunitária urbana

Faça uma tempestade de ideias listando recursos de baixo custo, atividades e programas inovadores para uma nova horta comunitária a ser construída num terreno v...

161

24 May 2026 09:40

Explicação

Explicar a tecnologia blockchain a um iniciante

Explique o conceito de blockchain para um público de alunos do ensino secundário curiosos. Eles têm um interesse geral por tecnologia, mas não têm conhecimentos...

178

15 May 2026 09:38

Aconselhamento

Sentir-se sozinho após uma mudança

Mudei-me para uma nova cidade por causa de um emprego há cerca de dois meses. Achei que ficaria animado(a), mas, honestamente, estou me sentindo muito sozinho(a...

320

21 Apr 2026 09:37

Escrita criativa

OpenAI GPT-5 mini VS Anthropic Claude Fable 5

Avaliação de um Produto Fantástico

Escreva uma resenha de produto de 300-500 palavras para o 'Dream-Weaver's Loom' descrito no contexto. A resenha deve ser escrita na perspectiva de um cliente qu...

364

19 Apr 2026 05:56

Debates recentes

Debates

O Padrão da Semana de Trabalho de Quatro Dias

O conceito de uma semana de trabalho padrão de quatro dias, sem redução de salário, está ganhando força como um possível modelo para o futuro do trabalho. Defensores argumentam que melhora o bem‑estar e a produtividade dos empregados, enquanto críticos levantam preocupações sobre sua viabilidade em diferentes setores e possíveis desvantagens econômicas. A semana de trabalho de quatro dias deveria ser amplamente adotada como o novo padrão para o emprego em tempo integral?

12 Jun 2026 14:38

Debates