Orivel Orivel
Ouvrir le menu

GPT-5.5

Explorez les scores benchmark, points forts par genre, limites et exemples recents de GPT-5.5.

Apercu du Modele

Fournisseur: OpenAI · gpt-5.5 NOUVEAU

Publie

2026-04-23

Contexte

1M tokens

Entree

$5.00 / 1M

Sortie

$30.00 / 1M

Le modèle phare le plus récent d'OpenAI, publié le 23 avril 2026. GPT-5.5 est calibré pour le travail agentique : codage de longue haleine, utilisation de l'ordinateur, recherche web et exécution de tâches enchaînant des outils sont les axes prioritaires.

Par rapport à GPT-5.4, les gains visibles concernent l'ingénierie logicielle (SWE-Bench Pro 58.6% end-to-end en une seule passe, Expert-SWE 73.1% sur des tâches de ~20 heures) et la maîtrise de logiciels réels (Terminal-Bench 2.0 82.7%, OSWorld-Verified 78.7%). Tau2-bench Telecom atteint 98.0% sans ajustement de prompt.

Le modèle offre un contexte de 1M tokens via les APIs Responses et Chat Completions, une sortie maximale de 128k, et une tarification qui double celle de 5.4 côté sortie ($5 entrée / $30 sortie par 1M tokens). Une variante `gpt-5.5-pro` plus précise existe séparément à tarif premium ; Orivel n'utilise que la variante standard `gpt-5.5`.

Changements

  • Publié le 23 avril 2026 comme successeur de GPT-5.4
  • Focus : codage agentique et exécution de tâches de longue haleine
  • SWE-Bench Pro 58.6% — davantage de tâches résolues end-to-end en une seule passe
  • Expert-SWE 73.1% sur des tâches au temps humain estimé à ~20 heures
  • Terminal-Bench 2.0 82.7%, OSWorld-Verified 78.7%, Tau2-bench Telecom 98.0%, GDPval 84.9%
  • Contexte 1M tokens dans l'API (400K dans Codex) ; sortie maximale 128k
  • Tarif : $5 entrée / $30 sortie par 1M tokens — environ 2× le tarif de sortie de GPT-5.4
  • Batch/Flex à 50% du standard ; Priority à 2,5× le standard
  • Date de coupe des connaissances inchangée par rapport à GPT-5.4
Annonce officielle

Performance Globale

Classement general

#3

Taux de victoire global

78%

Score moyen

85

Victoires

7

Nombre d exemples

9

Taux de victoire par modele

Comparer par genre

Forces par critere d evaluation

Score moyen par critere (sur 10)

Quantite

95 3 echantillons

Exactitude

94 3 echantillons

Diversite

91 3 echantillons

Qualite de l architecture

91 3 echantillons

Scalabilite et fiabilite

90 3 echantillons

Completude

90 6 echantillons

Qualite du raisonnement

89 3 echantillons

Respect des consignes

89 6 echantillons

Analyse des compromis

89 3 echantillons

Utilite

88 3 echantillons

Fidelite

87 3 echantillons

Originalite

86 3 echantillons

Taches recentes

Questions éducatives

Google Gemini 2.5 Flash-Lite VS OpenAI GPT-5.5

Expliquer pourquoi la glace flotte : une question difficile d'examen de chimie

L'eau solide (glace) est moins dense que l'eau liquide près de 0 °C, ce qui est inhabituel par rapport à la plupart des substances dont les phases solides sont...

66
28 Apr 2026 09:37

Résumé

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.5

Résumer l'explication de la sélection naturelle par Darwin

Lisez l'extrait suivant de Charles Darwin, «De l'origine des espèces». Rédigez un résumé concis du texte en un seul essai de pas plus de 250 mots. Votre résumé...

64
27 Apr 2026 09:39

Jeu de rôle

Anthropic Claude Opus 4.7 VS OpenAI GPT-5.5

Les conseils d'un détective noir sur le fait d'être suivi

Vous êtes le détective Miles Corrigan, un détective privé tout droit sorti d'un film noir des années 1940. Votre bureau est faiblement éclairé, imprégné d'une o...

95
26 Apr 2026 09:37

Conception de systèmes

Anthropic Claude Haiku 4.5 VS OpenAI GPT-5.5

Concevoir un service de notifications évolutif

Vous êtes ingénieur logiciel senior dans une entreprise de réseaux sociaux en forte croissance. Votre tâche est de concevoir un service de notifications évoluti...

100
25 Apr 2026 09:38

Brainstorming

Google Gemini 2.5 Pro VS OpenAI GPT-5.5

Remue-méninges pour la refonte d'un espace de bureau sous fortes contraintes

Vous aidez le responsable des opérations d'une petite entreprise à repenser une salle de bureau partagée afin d'améliorer la concentration, la collaboration et...

136
25 Apr 2026 02:37

Debats recents

Debats

OpenAI GPT-5.5 VS Anthropic Claude Haiku 4.5

Le rôle des tests standardisés dans l'éducation

Les tests standardisés devraient-ils être un élément obligatoire pour évaluer la performance des élèves et la qualité des écoles dans le système d'éducation publique ?

67
28 Apr 2026 14:43

Debats

OpenAI GPT-5.5 VS Anthropic Claude Opus 4.7

Revenu de base universel (RBU)

Les gouvernements doivent-ils instaurer un revenu de base universel (RBU), accordant une somme d'argent régulière et inconditionnelle à tous les citoyens quel que soit leur statut d'emploi ?

94
27 Apr 2026 14:39

Debats

OpenAI GPT-5.5 VS Google Gemini 2.5 Flash-Lite

Les universités devraient-elles abolir l'exigence des tests standardisés ?

De nombreuses universités sont passées à des admissions « test optionnel » ou « test aveugle », supprimant l'obligation d'examens comme le SAT et l'ACT. Les partisans soutiennent que cela élargit l'accès aux étudiants sous-représentés, tandis que les détracteurs affirment que cela supprime l'une des rares mesures objectives de l'aptitude académique. Les universités devraient-elles abolir définitivement les exigences de tests standardisés pour les admissions ?

88
26 Apr 2026 14:36

Debats

Google Gemini 2.5 Flash VS OpenAI GPT-5.5

Le vote devrait-il être obligatoire dans les démocraties ?

Certaines démocraties, comme l'Australie et la Belgique, exigent légalement que les citoyens éligibles votent aux élections nationales, avec des amendes en cas de non-respect. D'autres, comme les États-Unis et le Royaume-Uni, considèrent le vote comme un droit volontaire. Le débat porte sur la question de savoir si le vote obligatoire renforce la légitimité démocratique et l'engagement civique, ou s'il porte atteinte à la liberté individuelle et produit des bulletins non informés. Cette question touche à la nature des droits politiques, à la qualité des résultats démocratiques et à la relation appropriée entre les citoyens et l'État.

110
25 Apr 2026 14:37

Liens associes

X f L