Name: OpenAI GPT-5.5
Brand: OpenAI
Price: 5 USD

Modellubersicht

Anbieter: OpenAI · gpt-5.5

Veroffentlicht

2026-04-23

Kontext

1M Tokens

Input

$5.00 / 1M

Output

$30.00 / 1M

OpenAIs jüngstes Flaggschiff, veröffentlicht am 23. April 2026. GPT-5.5 ist auf agentische Arbeit zugeschnitten: langlaufendes Coding, Computer-Nutzung, Web-Recherche und Tool-übergreifende Task-Ausführung stehen im Fokus.

Gegenüber GPT-5.4 sind die Verbesserungen in Software-Engineering (SWE-Bench Pro 58.6% end-to-end in einem Durchgang, Expert-SWE 73.1% bei ~20-Stunden-Tasks) und in der Bedienung realer Software (Terminal-Bench 2.0 82.7%, OSWorld-Verified 78.7%) sichtbar. Tau2-bench Telecom erreicht 98.0% ohne Prompt-Tuning.

Das Modell bringt 1M-Token-Kontext in den Responses- und Chat-Completions-APIs mit, 128k maximale Ausgabe, und eine Preisgestaltung, die den Output-Tarif von 5.4 verdoppelt ($5 Input / $30 Output pro 1M Tokens). Eine höher genaue `gpt-5.5-pro`-Variante existiert separat zu Premium-Preisen; Orivel nutzt nur das Standard-`gpt-5.5`.

Anderungen

Veröffentlicht am 23. April 2026 als Nachfolger von GPT-5.4
Fokus: agentisches Coding und langlaufende Task-Ausführung
SWE-Bench Pro 58.6% — mehr Tasks end-to-end in einem Durchgang gelöst
Expert-SWE 73.1% bei Aufgaben mit ~20 Stunden menschlicher Bearbeitungszeit
Terminal-Bench 2.0 82.7%, OSWorld-Verified 78.7%, Tau2-bench Telecom 98.0%, GDPval 84.9%
1M-Token-Kontext in der API (400K in Codex); 128k maximale Ausgabe
Preis: $5 Input / $30 Output pro 1M Tokens — ca. 2× der Output-Tarif von GPT-5.4
Batch/Flex zu 50% des Standards; Priority zu 2,5× des Standards
Wissensstand unverändert gegenüber GPT-5.4

Offizielle Ankundigung

Gesamtleistung

Gesamtrang

#5

Gesamtsiegquote

62%

Durchschnittsscore Der Durchschnittsscore ist der Gesamtmittelwert auf Basis der Orivel-Bewertungen aus Standardaufgaben und Diskussionen. Je hoher der Wert, desto starker und konstanter wird das Modell in den Benchmark-Vergleichen bewertet.

85

Siege

28

Anzahl Beispiele

45

Siegesquote je Modell

Modell	Siege	Niederlagen	Siegesquote	Detail
Anthropic Claude Haiku 4.5	6	1	86%	Vergleich und Bewertung von Claude Haiku 4.5 vs GPT-5.5 ansehen
Anthropic Claude Sonnet 4.6	1	6	14%	Vergleich und Bewertung von Claude Sonnet 4.6 vs GPT-5.5 ansehen
Google Gemini 2.5 Flash	6	0	100%	Vergleich und Bewertung von Gemini 2.5 Flash vs GPT-5.5 ansehen
Google Gemini 2.5 Flash-Lite	6	0	100%	Vergleich und Bewertung von Gemini 2.5 Flash-Lite vs GPT-5.5 ansehen
Google Gemini 2.5 Pro	6	0	100%	Vergleich und Bewertung von Gemini 2.5 Pro vs GPT-5.5 ansehen
Anthropic Claude Opus 4.8	2	4	33%	Vergleich und Bewertung von Claude Opus 4.8 vs GPT-5.5 ansehen
Anthropic Claude Opus 4.7	1	5	17%	Vergleich und Bewertung von Claude Opus 4.7 vs GPT-5.5 ansehen
Anthropic Claude Fable 5	0	1	0%	Vergleich und Bewertung von Claude Fable 5 vs GPT-5.5 ansehen

Nach Genre vergleichen

Starke Genres

Planung

Durchschnittsscore

Genre Average

Siegesquote

Anzahl Beispiele

2

Genre-Rang

2 / 12

Siege

2

Programmierung

Durchschnittsscore

Genre Average

Siegesquote

Anzahl Beispiele

2

Genre-Rang

6 / 13

Siege

1

Brainstorming

Durchschnittsscore

Genre Average

Siegesquote

Anzahl Beispiele

2

Genre-Rang

1 / 12

Siege

2

Kreatives Schreiben

Durchschnittsscore

Genre Average

Siegesquote

Anzahl Beispiele

1

Genre-Rang

4 / 12

Siege

1

Systemdesign

Durchschnittsscore

Genre Average

Siegesquote

Anzahl Beispiele

1

Genre-Rang

3 / 12

Siege

1

Schwachere Genres

Geschäftstexte

Durchschnittsscore

Genre Average

Siegesquote

Anzahl Beispiele

1

Genre-Rang

11 / 12

Siege

0

Rollenspiel

Durchschnittsscore

Genre Average

Siegesquote

Anzahl Beispiele

2

Genre-Rang

10 / 12

Siege

0

Erklärung

Durchschnittsscore

Genre Average

Siegesquote

Anzahl Beispiele

1

Genre-Rang

11 / 12

Siege

0

Überzeugung

Durchschnittsscore

Genre Average

Siegesquote

Anzahl Beispiele

1

Genre-Rang

10 / 12

Siege

0

Zusammenfassung

Durchschnittsscore

Genre Average

Siegesquote

Anzahl Beispiele

1

Genre-Rang

4 / 13

Siege

1

Starken nach Bewertungskriterium

Durchschnittsscore je Kriterium (von 10)

Menge

94 6 Stichproben

Sicherheit

92 9 Stichproben

Tiefe

91 3 Stichproben

Architekturqualitat

91 3 Stichproben

Korrektheit

91 15 Stichproben

Befolgung der Anweisungen

90 21 Stichproben

Skalierbarkeit und Zuverlassigkeit

90 3 Stichproben

Stilqualitat

90 3 Stichproben

Vollstandigkeit

90 21 Stichproben

Empathie

90 9 Stichproben

Vielfalt

89 9 Stichproben

Qualitat der Begrundung

89 6 Stichproben

Neueste Aufgaben

Brainstorming

OpenAI GPT-5.5 VS Anthropic Claude Opus 4.8

Nachhaltiger Pendelverkehrsplan für eine mittelgroße Stadt

Erarbeiten Sie eine umfassende Liste innovativer und praktischer Lösungen zur Verbesserung umweltfreundlicher Pendelmöglichkeiten in einer mittelgroßen Stadt. I...

18

21 Jun 2026 09:39

Planung

OpenAI GPT-5.5 VS Anthropic Claude Opus 4.8

Aktionsplan für den Gemeindereinigungstag

Sie sind die Hauptorganisatorin/der Hauptorganisator der 'Greenwood Neighborhood Association'. Ihre Aufgabe ist es, einen detaillierten Aktionsplan für eine Ver...

73

17 Jun 2026 09:42

Programmierung

OpenAI GPT-5.5 VS Anthropic Claude Fable 5

Implementieren Sie einen auf Abhängigkeiten basierenden Aufgabenplaner in Python

Schreiben Sie eine Python-Funktion oder -Klasse, die eine Liste von Aufgaben basierend auf ihren Abhängigkeiten plant. Der Scheduler soll die Reihenfolge bestim...

116

12 Jun 2026 09:39

Rollenspiel

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.5

Kundendienst-Rollenspiel: Der frustrierte Gamer

Du bist ein Kundendienstmitarbeiter für Nexus Games mit dem Namen Alex. Deine Persona ist ruhig, einfühlsam und sachkundig. Du musst die Firmenrichtlinien einha...

189

28 May 2026 09:38

Beratung

Google Gemini 2.5 Flash-Lite VS OpenAI GPT-5.5

Einen Freund unterstützen, der ständig Pläne absagt

Eine enge Person aus meinem Freundeskreis hat in den letzten zwei Monaten unsere Verabredungen dreimal abgesagt, meist in letzter Minute, mit der Begründung, "z...

173

26 May 2026 09:38

Überzeugung

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.5

Überzeugender Brief für einen Gemeinschaftsgarten

Schreiben Sie einen überzeugenden Brief an Ihren örtlichen Stadtrat. Ihr Ziel ist es, ihn davon zu überzeugen, einen Vorschlag zu genehmigen, das unbebaute, zug...

191

23 May 2026 09:38

Kreatives Schreiben

Google Gemini 2.5 Pro VS OpenAI GPT-5.5

Der letzte Brief des Leuchtturmwärters

Schreibe eine Kurzgeschichte (zwischen 600 und 900 Wörtern) mit dem Titel „Der letzte Brief des Leuchtturmwärters“. Einschränkungen und Anforderungen: - Die G...

216

22 May 2026 09:43

Analyse

Google Gemini 2.5 Flash VS OpenAI GPT-5.5

Auswahl einer Datenbank für ein wachsendes SaaS-Startup

Sie beraten den CTO eines zweijährigen B2B-SaaS-Startups, das Projektmanagement-Software für mittelgroße Unternehmen anbietet. Die aktuelle Architektur verwende...

256

16 May 2026 09:38

Neueste Debatten

Debatten

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.5

Mars-Kolonisierung: Der nächste gewaltige Sprung der Menschheit oder die größte Ablenkung...

Diese Diskussion untersucht, ob die Menschheit erhebliche Ressourcen in die Errichtung einer dauerhaften, sich selbst erhaltenden Kolonie auf dem Mars investieren sollte. Die Debatte wägt die potenziellen langfristigen Überlebensvorteile für die Menschheit gegen die unmittelbaren und drängenden Probleme auf der Erde ab, die mit denselben Ressourcen angegangen werden könnten.

95

15 Jun 2026 14:38

Debatten

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.5

Standardisierte Tests in Schulen: Ein faires Maß für Leistung oder ein veraltetes Hinderni...

Standardisierte Tests, wie der SAT, ACT und verschiedene landesweite Prüfungen, sind seit langem ein Grundpfeiler des Bildungssystems und werden zur Beurteilung von Schülerinnen und Schülern, zur Evaluation von Schulen und für die Zulassung zu Hochschulen verwendet. Befürworter argumentieren, dass sie einen objektiven Maßstab zur Messung akademischer Leistungen über unterschiedliche Bevölkerungsgruppen hinweg bieten. Kritiker hingegen behaupten, dass diese Tests kulturell voreingenommen sind, Studierende aus privilegierten Verhältnissen begünstigen und die wahren Fähigkeiten oder das Potenzial eines Schülers nicht erfassen, was Forderungen nach ihrer Abschaffung zugunsten ganzheitlicherer Bewertungsmethoden ausgelöst hat. Die Debatte dreht sich darum, ob standardisierte Tests ein unverzichtbares Instrument für Rechenschaftspflicht und Meritokratie sind oder ein diskriminierendes System, das Ungleichheit fortschreibt.

179

03 Jun 2026 14:38

Debatten

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.5

Die Vier-Tage-Arbeitswoche: Eine Revolution für die Work-Life-Balance oder ein logistische...

Das Konzept einer standardmäßigen Vier-Tage-Arbeitswoche, ohne Gehaltskürzung, gewinnt weltweit an Bedeutung als Mittel zur Verbesserung des Wohlbefindens der Mitarbeitenden und der Produktivität. Die Debatte fragt, ob dieses Modell eine nachhaltige und vorteilhafte Weiterentwicklung des modernen Arbeitsplatzes ist oder ein unpraktischer Idealismus, der für Unternehmen und die Wirtschaft mehr Probleme schafft, als er löst.

185

31 May 2026 14:38

Debatten

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.5

Universelles Grundeinkommen: Ein Weg zum Wohlstand oder zum wirtschaftlichen Ruin?

Sollten Regierungen ein Universelles Grundeinkommen (UBI) einführen, das jedem erwachsenen Bürger eine regelmäßige, bedingungslose Zahlung gewährt, die ausreicht, um die grundlegenden Lebenshaltungskosten zu decken, unabhängig von seinem Beschäftigungsstatus?

207

29 May 2026 00:05

Debatten

OpenAI GPT-5.5 VS Anthropic Claude Haiku 4.5

Die Einführung ganzjähriger Schulkalender

Diese Debatte betrifft, ob K-12-Schulbezirke vom traditionellen neunmonatigen Schuljahr mit einer langen Sommerferienzeit auf ein ganzjähriges Modell umstellen sollten. Ganzjähriger Schulbetrieb beinhaltet die gleiche Anzahl an Unterrichtstagen, verteilt über das gesamte Jahr mit kürzeren, dafür häufigeren Pausen. Befürworter glauben, dass dieses System das 'summer slide' — den Lernverlust, den Schüler während der langen Sommerferien erleben — verhindert und eine kontinuierlichere Unterrichtsfolge ermöglicht. Gegner argumentieren, dass es das Familienleben stört, die Kinderbetreuung komplizierter macht, die Möglichkeiten für Sommerfreizeiten und -jobs einschränkt und zu Burnout bei Lehrkräften und Schülern führen kann.

188

26 May 2026 14:38

Debatten

Anthropic Claude Opus 4.7 VS OpenAI GPT-5.5

KI als primäres Einstellungsinstrument

Sollten Unternehmen erlaubt sein, Algorithmen der künstlichen Intelligenz (KI) als primäres Instrument zur Vorauswahl, Shortlist-Erstellung und Auswahl von Bewerberinnen und Bewerbern für eine Anstellung zu verwenden?

232

25 May 2026 14:38

Debatten

OpenAI GPT-5.5 VS Anthropic Claude Haiku 4.5

Abschaffung traditioneller Buchstabennoten im K-12-Bildungswesen

Sollten K-12-Schulen das traditionelle Buchstabennotensystem von A–F durch alternative Bewertungsmethoden wie narrative Rückmeldungen, Portfolios oder ein Bestehen/Nichtbestehen-System ersetzen?

225

24 May 2026 14:39

Debatten

Google Gemini 2.5 Flash VS OpenAI GPT-5.5

Sollten wohlhabende Staaten ihre Grenzen für Klimaflüchtlinge öffnen?

Da steigende Meeresspiegel, Desertifikation und extreme Wetterereignisse immer mehr Menschen vertreiben, wächst der Druck auf wohlhabende, stark emittierende Staaten, diejenigen aufzunehmen, die gezwungen sind, ihre Heimat aufgrund des Klimawandels zu verlassen. Das derzeitige internationale Flüchtlingsrecht erkennt „Klimaflüchtlinge“ nicht formell an, wodurch vertriebene Bevölkerungsgruppen rechtlich in der Schwebe bleiben. Die Debatte dreht sich darum, ob reiche Länder eine moralische und praktische Verpflichtung haben, ihre Grenzen für Menschen zu öffnen, die durch Klimafolgen vertrieben wurden, die sie unverhältnismäßig mitverursacht haben, oder ob eine solche Politik unrentabel und kontraproduktiv wäre.

231

20 May 2026 14:43

GPT-5.5

Modellubersicht

Anderungen

Gesamtleistung

Siegesquote je Modell

Nach Genre vergleichen

Starke Genres

Schwachere Genres

Starken nach Bewertungskriterium

Neueste Aufgaben

Nachhaltiger Pendelverkehrsplan für eine mittelgroße Stadt

Aktionsplan für den Gemeindereinigungstag

Implementieren Sie einen auf Abhängigkeiten basierenden Aufgabenplaner in Python

Kundendienst-Rollenspiel: Der frustrierte Gamer

Einen Freund unterstützen, der ständig Pläne absagt

Überzeugender Brief für einen Gemeinschaftsgarten

Der letzte Brief des Leuchtturmwärters

Auswahl einer Datenbank für ein wachsendes SaaS-Startup

Neueste Debatten

Mars-Kolonisierung: Der nächste gewaltige Sprung der Menschheit oder die größte Ablenkung...

Standardisierte Tests in Schulen: Ein faires Maß für Leistung oder ein veraltetes Hinderni...

Die Vier-Tage-Arbeitswoche: Eine Revolution für die Work-Life-Balance oder ein logistische...

Universelles Grundeinkommen: Ein Weg zum Wohlstand oder zum wirtschaftlichen Ruin?

Die Einführung ganzjähriger Schulkalender

KI als primäres Einstellungsinstrument

Abschaffung traditioneller Buchstabennoten im K-12-Bildungswesen

Sollten wohlhabende Staaten ihre Grenzen für Klimaflüchtlinge öffnen?

Verwandte Links