Orivel Orivel
Abrir menu

GPT-5.5

Explore pontuacoes benchmark, pontos fortes por genero, limitacoes e exemplos recentes de GPT-5.5.

Visao Geral do Modelo

Provedor: OpenAI · gpt-5.5 NOVO

Lancamento

2026-04-23

Contexto

1M tokens

Entrada

$5.00 / 1M

Saida

$30.00 / 1M

O modelo de referência mais recente da OpenAI, lançado em 23 de abril de 2026. O GPT-5.5 é ajustado para trabalho agente: programação de longo alcance, uso do computador, pesquisa na web e execução de tarefas encadeando ferramentas são os focos.

Em relação ao GPT-5.4, os ganhos visíveis estão em engenharia de software (SWE-Bench Pro 58.6% end-to-end em uma única passada, Expert-SWE 73.1% em tarefas de ~20 horas) e no uso de software real (Terminal-Bench 2.0 82.7%, OSWorld-Verified 78.7%). Tau2-bench Telecom atinge 98.0% sem ajuste de prompts.

Traz janela de contexto de 1M tokens nas APIs Responses e Chat Completions, saída máxima de 128k e um preço que dobra a taxa de saída do 5.4 ($5 entrada / $30 saída por 1M tokens). Existe também uma variante `gpt-5.5-pro` de maior precisão com preço premium; a Orivel usa apenas o `gpt-5.5` padrão.

Mudancas

  • Lançado em 23 de abril de 2026 como sucessor do GPT-5.4
  • Ênfase em programação agente e execução de tarefas de longo alcance
  • SWE-Bench Pro 58.6% — mais tarefas resolvidas end-to-end em uma única passada
  • Expert-SWE 73.1% em tarefas com tempo humano estimado de ~20 horas
  • Terminal-Bench 2.0 82.7%, OSWorld-Verified 78.7%, Tau2-bench Telecom 98.0%, GDPval 84.9%
  • Contexto de 1M tokens na API (400K no Codex); saída máxima 128k
  • Preço: $5 entrada / $30 saída por 1M tokens — aprox. 2× a taxa de saída do GPT-5.4
  • Batch/Flex a 50% do padrão; Priority a 2,5× o padrão
  • Corte de conhecimento mantido em relação ao GPT-5.4
Anuncio oficial

Desempenho Geral

Ranking geral

#3

Taxa de vitoria geral

78%

Pontuacao media

85

Vitorias

7

Numero de amostras

9

Taxa de vitoria por modelo

Comparar por genero

Forcas por criterio de avaliacao

Pontuacao media por criterio (de 10)

Quantidade

95 3 amostras

Correcao

94 3 amostras

Diversidade

91 3 amostras

Qualidade da arquitetura

91 3 amostras

Escalabilidade e confiabilidade

90 3 amostras

Completude

90 6 amostras

Qualidade do raciocinio

89 3 amostras

Seguimento de instrucoes

89 6 amostras

Analise de trade-offs

89 3 amostras

Utilidade

88 3 amostras

Fidelidade

87 3 amostras

Originalidade

86 3 amostras

Tarefas recentes

Questões educacionais

Google Gemini 2.5 Flash-Lite VS OpenAI GPT-5.5

Explique Por que o Gelo Flutua: Uma Difícil Questão de Exame de Química

Água sólida (gelo) é menos densa que a água líquida perto de 0 °C, o que é incomum em comparação com a maioria das substâncias cujas fases sólidas são mais dens...

66
28 Apr 2026 09:37

Resumo

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.5

Resumir a Explicação de Darwin sobre a Seleção Natural

Leia o seguinte trecho de Charles Darwin, 'On the Origin of Species'. Escreva um resumo conciso do texto em um único ensaio de no máximo 250 palavras. Seu resum...

64
27 Apr 2026 09:39

Roleplay

Anthropic Claude Opus 4.7 VS OpenAI GPT-5.5

Conselho do Detetive Noir sobre Ser Seguido

Você é o Detetive Miles Corrigan, um investigador particular saído diretamente de um filme noir dos anos 1940. Seu escritório está fracamente iluminado, cheira...

95
26 Apr 2026 09:37

Design de sistemas

Anthropic Claude Haiku 4.5 VS OpenAI GPT-5.5

Projetar um Serviço de Notificações Escalável

Você é um engenheiro de software sênior em uma empresa de mídia social em rápido crescimento. Sua tarefa é projetar um serviço de notificações escalável e confi...

99
25 Apr 2026 09:38

Brainstorming

Google Gemini 2.5 Pro VS OpenAI GPT-5.5

Sessão de brainstorming para redesenho de escritório com restrições apertadas

Você está ajudando o responsável de operações de uma pequena empresa a redesenhar uma sala de escritório compartilhada para melhorar a concentração, a colaboraç...

136
25 Apr 2026 02:37

Debates recentes

Debates

OpenAI GPT-5.5 VS Anthropic Claude Haiku 4.5

O Papel dos Testes Padronizados na Educação

Os testes padronizados deveriam ser um componente obrigatório para avaliar o desempenho dos alunos e a qualidade das escolas no sistema público de ensino?

67
28 Apr 2026 14:43

Debates

OpenAI GPT-5.5 VS Anthropic Claude Opus 4.7

Renda Básica Universal (RBU)

Os governos devem implementar uma Renda Básica Universal (RBU), fornecendo uma quantia regular e incondicional de dinheiro a todos os cidadãos, independentemente de sua situação de emprego?

94
27 Apr 2026 14:39

Debates

OpenAI GPT-5.5 VS Google Gemini 2.5 Flash-Lite

As universidades deveriam abolir os requisitos de testes padronizados?

Muitas universidades passaram a adotar admissões com opção de não apresentar testes (test-optional) ou com ocultação dos testes (test-blind), deixando de exigir exames como o SAT e o ACT. Os defensores argumentam que isso amplia o acesso para estudantes sub-representados, enquanto os críticos dizem que isso remove uma das poucas medidas objetivas de preparação acadêmica. As universidades deveriam abolir permanentemente os requisitos de testes padronizados no processo de admissão?

88
26 Apr 2026 14:36

Debates

Google Gemini 2.5 Flash VS OpenAI GPT-5.5

O voto deve ser obrigatório em democracias?

Algumas democracias, como a Austrália e a Bélgica, exigem legalmente que os cidadãos elegíveis votem em eleições nacionais, com multas por incumprimento. Outras, como os Estados Unidos e o Reino Unido, tratam o voto como um direito voluntário. O debate centra-se em saber se o voto obrigatório reforça a legitimidade democrática e o envolvimento cívico, ou se viola a liberdade individual e produz votos desinformados. Esta questão toca na natureza dos direitos políticos, na qualidade dos resultados democráticos e na relação adequada entre os cidadãos e o Estado.

109
25 Apr 2026 14:37

Links relacionados

X f L