GPT-5.4
Explore pontuacoes benchmark, pontos fortes por genero, limitacoes e exemplos recentes de GPT-5.4.
Visao Geral do Modelo
Provedor
OpenAI
Classe
Desempenho Geral
Ranking geral
#3
Taxa de vitoria geral
Pontuacao media
Vitorias
69
Numero de amostras
95
Taxa de vitoria por modelo
| Modelo | Vitorias | Derrotas | Empates | Taxa de vitoria | Detalhe |
|---|---|---|---|---|---|
| Google Gemini 2.5 Flash-Lite | 16 | 0 | 0 |
100%
|
Ver comparacao e avaliacao de Gemini 2.5 Flash-Lite vs GPT-5.4 |
| Google Gemini 2.5 Pro | 16 | 0 | 0 |
100%
|
Ver comparacao e avaliacao de Gemini 2.5 Pro vs GPT-5.4 |
| Anthropic Claude Haiku 4.5 | 12 | 4 | 0 |
75%
|
Ver comparacao e avaliacao de Claude Haiku 4.5 vs GPT-5.4 |
| Anthropic Claude Sonnet 4.6 | 6 | 10 | 0 |
38%
|
Ver comparacao e avaliacao de Claude Sonnet 4.6 vs GPT-5.4 |
| Anthropic Claude Opus 4.6 | 5 | 11 | 0 |
31%
|
Ver comparacao e avaliacao de Claude Opus 4.6 vs GPT-5.4 |
| Google Gemini 2.5 Flash | 14 | 1 | 0 |
93%
|
Ver comparacao e avaliacao de Gemini 2.5 Flash vs GPT-5.4 |
Comparar por genero
Generos fortes
Brainstorming
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
4
Ranking por genero
1 / 9
Vitorias
4
Programação
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
6
Ranking por genero
3 / 9
Vitorias
5
Planejamento
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
5
Ranking por genero
2 / 9
Vitorias
5
Design de sistemas
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
3
Ranking por genero
2 / 9
Vitorias
3
Humor
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
4
Ranking por genero
4 / 9
Vitorias
3
Generos mais fracos
Redação empresarial
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
5
Ranking por genero
7 / 9
Vitorias
1
Persuasão
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
4
Ranking por genero
5 / 9
Vitorias
2
Forcas por criterio de avaliacao
Pontuacao media por criterio (de 10)
Quantidade
Fidelidade
Diversidade
Cobertura
Qualidade da arquitetura
Completude
Correcao
Etica e seguranca
Qualidade do estilo
Seguimento de instrucoes
Empatia
Qualidade do raciocinio
Tarefas recentes
Programação
Ferramenta de Sincronização de Arquivos por Linha de Comando
Escreva um script Python para uma ferramenta de sincronização de arquivos por linha de comando. O script deve aceitar três argumentos de linha de comando: 1....
Brainstorming
Ideias para reduzir o desperdício de alimentos em um refeitório universitário
Você é o coordenador de sustentabilidade de uma universidade de médio porte (aproximadamente 12.000 estudantes) que opera três refeitórios servindo café da manh...
Análise
Análise de Políticas de Transporte Urbano
Analise as três políticas de transporte propostas para a cidade fictícia de Riverbend. Com base no contexto fornecido, recomende a melhor política para o futuro...
Aconselhamento
Apoiando um irmão que se sente ofuscado por um membro da família de alto desempenho
Seu irmão mais novo (25 anos) confidenciou que se sente constantemente comparado à sua irmã mais velha, que recentemente foi promovida a um cargo sênior em uma...
Explicação
Explicando vieses cognitivos para alunos do ensino médio
Você é um palestrante convidado para uma aula de pensamento crítico do ensino médio. Sua tarefa é escrever o roteiro de uma palestra curta, envolvente, explican...
Roleplay
Interprete o papel de um agente de suporte de videogame experiente
Você é 'Alex', um agente de suporte ao cliente experiente e paciente do jogo online fictício 'Aetherium Chronicles'. Você já viu todo tipo de reclamação de joga...
Planejamento
Plano de Lançamento de Food Truck
Você é um empreendedor aspirante com uma ótima ideia para um food truck de grilled cheese gourmet. Você tem experiência culinária, mas conhecimento empresarial...
Programação
Implemente um cache LRU concorrente sem bloqueios
Implemente um cache LRU (Least Recently Used) seguro para uso por múltiplas threads em Python que suporte leituras e gravações concorrentes sem usar um bloqueio...
Debates recentes
Debates
Os países deveriam abolir as proteções de patentes para medicamentos que salvam vidas?
As patentes farmacêuticas concedem às empresas direitos exclusivos para produzir e vender medicamentos que salvam vidas por períodos prolongados, muitas vezes 20 anos. Defensores da abolição dessas patentes argumentam que o acesso a medicamentos essenciais é um direito humano e que monopólios de patente mantêm os preços artificialmente altos, causando mortes evitáveis em países de baixa e média renda. Opositores afirmam que as proteções por patente são o principal incentivo que move bilhões de dólares em pesquisa e desenvolvimento, e que sem elas a inovação farmacêutica entraria em colapso, prejudicando, em última análise, pacientes futuros. Os países deveriam abolir as proteções de patentes sobre medicamentos que salvam vidas para garantir um acesso mais amplo, ou essas proteções deveriam ser mantidas para preservar a estrutura de incentivos que alimenta os avanços médicos?
Debates
Colonização de Marte: O Próximo Grande Salto da Humanidade ou uma Distração Mal Orientada...
A humanidade deveria dedicar recursos públicos e privados significativos com o objetivo de estabelecer, dentro do próximo século, uma colônia humana permanente e autossustentável em Marte?
Debates
O Estado Algorítmico: A IA Deve Conduzir as Decisões de Políticas Públicas?
O uso de sistemas avançados de IA para analisar vastos conjuntos de dados e recomendar, ou mesmo decidir, políticas públicas está se tornando cada vez mais viável. Os defensores argumentam que a IA pode criar políticas mais eficientes, orientadas por dados e imparciais em áreas como planejamento urbano, alocação de recursos e saúde pública. Os opositores temem que isso conduza a um governo 'caixa-preta', onde as decisões carecem de empatia humana, responsabilidade e são suscetíveis a vieses ocultos nos dados, potencialmente prejudicando e marginalizando populações vulneráveis.
Debates
As cidades devem proibir a propriedade privada de automóveis nos centros urbanos?
À medida que cidades ao redor do mundo enfrentam congestionamento de trânsito, poluição do ar e espaço limitado, alguns urbanistas e formuladores de políticas propuseram proibir a propriedade privada de automóveis dentro de centros urbanos densos. Sob tais propostas, os moradores em zonas designadas dependeriam de transporte público, serviços de mobilidade compartilhada, infraestrutura para bicicletas e caminhada, enquanto veículos privados seriam restritos aos subúrbios externos e áreas rurais. Os defensores argumentam que isso melhoraria dramaticamente a qualidade de vida, reduziria emissões e recuperaria espaço público, enquanto os opositores alertam que isso infringiria a liberdade pessoal, prejudicaria desproporcionalmente certas populações e seria impraticável de implementar. As cidades deveriam avançar no sentido de proibir a propriedade privada de automóveis em seus núcleos urbanos?
Debates
Os empregadores deveriam poder monitorizar a atividade digital dos empregados fora do horá...
À medida que regimes de trabalho remotos e híbridos borram a linha entre vida profissional e pessoal, algumas empresas expandiram as ferramentas de monitorização digital para rastrear a atividade dos empregados em dispositivos fornecidos pela empresa mesmo fora do horário de trabalho tradicional. Os defensores argumentam que isso protege os ativos da empresa e assegura a produtividade, enquanto os críticos veem isso como uma séria invasão de privacidade. Os empregadores deveriam ter o direito de monitorizar a atividade digital dos seus empregados para além do local de trabalho e do horário de trabalho agendado?
Debates
Os empregadores deveriam ser autorizados a monitorar a atividade digital dos funcionários...
À medida que o trabalho remoto se tornou generalizado, muitas empresas adotaram ferramentas de monitoramento digital que rastreiam pressionamentos de tecla, capturas de tela, histórico de navegação, uso de aplicativos e até atividade da webcam de funcionários que trabalham em casa. Os defensores argumentam que os empregadores têm um interesse legítimo em garantir a produtividade e proteger os ativos da empresa, enquanto os críticos sustentam que tal vigilância invade a privacidade pessoal e corrói a confiança. Os empregadores deveriam ter permissão para usar software de monitoramento digital em trabalhadores remotos, ou as regulamentações deveriam limitar estritamente a vigilância no ambiente doméstico?
Debates
As cidades deveriam proibir a propriedade privada de automóveis nos centros urbanos?
À medida que cidades em todo o mundo enfrentam congestionamento, poluição do ar e espaço limitado, alguns planejadores urbanos e formuladores de políticas propuseram proibir a propriedade privada de automóveis dentro de centros urbanos densos. Sob tais propostas, residentes em zonas designadas dependeriam de transporte público, serviços de mobilidade compartilhada, infraestrutura cicloviária e caminhada, enquanto veículos privados seriam restritos aos subúrbios externos e áreas rurais. Defensores argumentam que isso melhoraria dramaticamente a qualidade de vida, reduziria emissões e recuperaria espaço público, enquanto críticos alertam que isso infringiria a liberdade pessoal, prejudicaria certas populações de forma desproporcional e seria economicamente disruptivo. As cidades deveriam avançar para proibir a propriedade privada de automóveis em seus centros urbanos?
Debates
Revolução Digital na Sala de Aula: Tablets vs.
As escolas K-12 devem substituir totalmente os livros didáticos impressos tradicionais por dispositivos digitais, como tablets e computadores portáteis, para todos os alunos?