Orivel Orivel
Menue oeffnen

GPT-5.5

Entdecke Benchmark-Scores, Genre-Stärken, Schwächen und aktuelle Beispiele für GPT-5.5.

Modellubersicht

Anbieter: OpenAI · gpt-5.5

Veroffentlicht

2026-04-23

Kontext

1M Tokens

Input

$5.00 / 1M

Output

$30.00 / 1M

OpenAIs jüngstes Flaggschiff, veröffentlicht am 23. April 2026. GPT-5.5 ist auf agentische Arbeit zugeschnitten: langlaufendes Coding, Computer-Nutzung, Web-Recherche und Tool-übergreifende Task-Ausführung stehen im Fokus.

Gegenüber GPT-5.4 sind die Verbesserungen in Software-Engineering (SWE-Bench Pro 58.6% end-to-end in einem Durchgang, Expert-SWE 73.1% bei ~20-Stunden-Tasks) und in der Bedienung realer Software (Terminal-Bench 2.0 82.7%, OSWorld-Verified 78.7%) sichtbar. Tau2-bench Telecom erreicht 98.0% ohne Prompt-Tuning.

Das Modell bringt 1M-Token-Kontext in den Responses- und Chat-Completions-APIs mit, 128k maximale Ausgabe, und eine Preisgestaltung, die den Output-Tarif von 5.4 verdoppelt ($5 Input / $30 Output pro 1M Tokens). Eine höher genaue `gpt-5.5-pro`-Variante existiert separat zu Premium-Preisen; Orivel nutzt nur das Standard-`gpt-5.5`.

Anderungen

  • Veröffentlicht am 23. April 2026 als Nachfolger von GPT-5.4
  • Fokus: agentisches Coding und langlaufende Task-Ausführung
  • SWE-Bench Pro 58.6% — mehr Tasks end-to-end in einem Durchgang gelöst
  • Expert-SWE 73.1% bei Aufgaben mit ~20 Stunden menschlicher Bearbeitungszeit
  • Terminal-Bench 2.0 82.7%, OSWorld-Verified 78.7%, Tau2-bench Telecom 98.0%, GDPval 84.9%
  • 1M-Token-Kontext in der API (400K in Codex); 128k maximale Ausgabe
  • Preis: $5 Input / $30 Output pro 1M Tokens — ca. 2× der Output-Tarif von GPT-5.4
  • Batch/Flex zu 50% des Standards; Priority zu 2,5× des Standards
  • Wissensstand unverändert gegenüber GPT-5.4
Offizielle Ankundigung

Gesamtleistung

Gesamtrang

#5

Gesamtsiegquote

62%

Durchschnittsscore

85

Siege

28

Anzahl Beispiele

45

Siegesquote je Modell

Nach Genre vergleichen

Starken nach Bewertungskriterium

Durchschnittsscore je Kriterium (von 10)

Menge

94 6 Stichproben

Sicherheit

92 9 Stichproben

Tiefe

91 3 Stichproben

Architekturqualitat

91 3 Stichproben

Korrektheit

91 15 Stichproben

Befolgung der Anweisungen

90 21 Stichproben

Skalierbarkeit und Zuverlassigkeit

90 3 Stichproben

Stilqualitat

90 3 Stichproben

Vollstandigkeit

90 21 Stichproben

Empathie

90 9 Stichproben

Vielfalt

89 9 Stichproben

Qualitat der Begrundung

89 6 Stichproben

Neueste Aufgaben

Brainstorming

OpenAI GPT-5.5 VS Anthropic Claude Opus 4.8

Nachhaltiger Pendelverkehrsplan für eine mittelgroße Stadt

Erarbeiten Sie eine umfassende Liste innovativer und praktischer Lösungen zur Verbesserung umweltfreundlicher Pendelmöglichkeiten in einer mittelgroßen Stadt. I...

13
21 Jun 2026 09:39

Planung

OpenAI GPT-5.5 VS Anthropic Claude Opus 4.8

Aktionsplan für den Gemeindereinigungstag

Sie sind die Hauptorganisatorin/der Hauptorganisator der 'Greenwood Neighborhood Association'. Ihre Aufgabe ist es, einen detaillierten Aktionsplan für eine Ver...

73
17 Jun 2026 09:42

Programmierung

OpenAI GPT-5.5 VS Anthropic Claude Fable 5

Implementieren Sie einen auf Abhängigkeiten basierenden Aufgabenplaner in Python

Schreiben Sie eine Python-Funktion oder -Klasse, die eine Liste von Aufgaben basierend auf ihren Abhängigkeiten plant. Der Scheduler soll die Reihenfolge bestim...

116
12 Jun 2026 09:39

Rollenspiel

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.5

Kundendienst-Rollenspiel: Der frustrierte Gamer

Du bist ein Kundendienstmitarbeiter für Nexus Games mit dem Namen Alex. Deine Persona ist ruhig, einfühlsam und sachkundig. Du musst die Firmenrichtlinien einha...

189
28 May 2026 09:38

Beratung

Google Gemini 2.5 Flash-Lite VS OpenAI GPT-5.5

Einen Freund unterstützen, der ständig Pläne absagt

Eine enge Person aus meinem Freundeskreis hat in den letzten zwei Monaten unsere Verabredungen dreimal abgesagt, meist in letzter Minute, mit der Begründung, "z...

173
26 May 2026 09:38

Überzeugung

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.5

Überzeugender Brief für einen Gemeinschaftsgarten

Schreiben Sie einen überzeugenden Brief an Ihren örtlichen Stadtrat. Ihr Ziel ist es, ihn davon zu überzeugen, einen Vorschlag zu genehmigen, das unbebaute, zug...

190
23 May 2026 09:38

Kreatives Schreiben

Google Gemini 2.5 Pro VS OpenAI GPT-5.5

Der letzte Brief des Leuchtturmwärters

Schreibe eine Kurzgeschichte (zwischen 600 und 900 Wörtern) mit dem Titel „Der letzte Brief des Leuchtturmwärters“. Einschränkungen und Anforderungen: - Die G...

216
22 May 2026 09:43

Analyse

Google Gemini 2.5 Flash VS OpenAI GPT-5.5

Auswahl einer Datenbank für ein wachsendes SaaS-Startup

Sie beraten den CTO eines zweijährigen B2B-SaaS-Startups, das Projektmanagement-Software für mittelgroße Unternehmen anbietet. Die aktuelle Architektur verwende...

256
16 May 2026 09:38

Neueste Debatten

Debatten

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.5

Mars-Kolonisierung: Der nächste gewaltige Sprung der Menschheit oder die größte Ablenkung...

Diese Diskussion untersucht, ob die Menschheit erhebliche Ressourcen in die Errichtung einer dauerhaften, sich selbst erhaltenden Kolonie auf dem Mars investieren sollte. Die Debatte wägt die potenziellen langfristigen Überlebensvorteile für die Menschheit gegen die unmittelbaren und drängenden Probleme auf der Erde ab, die mit denselben Ressourcen angegangen werden könnten.

89
15 Jun 2026 14:38

Debatten

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.5

Standardisierte Tests in Schulen: Ein faires Maß für Leistung oder ein veraltetes Hinderni...

Standardisierte Tests, wie der SAT, ACT und verschiedene landesweite Prüfungen, sind seit langem ein Grundpfeiler des Bildungssystems und werden zur Beurteilung von Schülerinnen und Schülern, zur Evaluation von Schulen und für die Zulassung zu Hochschulen verwendet. Befürworter argumentieren, dass sie einen objektiven Maßstab zur Messung akademischer Leistungen über unterschiedliche Bevölkerungsgruppen hinweg bieten. Kritiker hingegen behaupten, dass diese Tests kulturell voreingenommen sind, Studierende aus privilegierten Verhältnissen begünstigen und die wahren Fähigkeiten oder das Potenzial eines Schülers nicht erfassen, was Forderungen nach ihrer Abschaffung zugunsten ganzheitlicherer Bewertungsmethoden ausgelöst hat. Die Debatte dreht sich darum, ob standardisierte Tests ein unverzichtbares Instrument für Rechenschaftspflicht und Meritokratie sind oder ein diskriminierendes System, das Ungleichheit fortschreibt.

179
03 Jun 2026 14:38

Debatten

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.5

Die Vier-Tage-Arbeitswoche: Eine Revolution für die Work-Life-Balance oder ein logistische...

Das Konzept einer standardmäßigen Vier-Tage-Arbeitswoche, ohne Gehaltskürzung, gewinnt weltweit an Bedeutung als Mittel zur Verbesserung des Wohlbefindens der Mitarbeitenden und der Produktivität. Die Debatte fragt, ob dieses Modell eine nachhaltige und vorteilhafte Weiterentwicklung des modernen Arbeitsplatzes ist oder ein unpraktischer Idealismus, der für Unternehmen und die Wirtschaft mehr Probleme schafft, als er löst.

185
31 May 2026 14:38

Debatten

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.5

Universelles Grundeinkommen: Ein Weg zum Wohlstand oder zum wirtschaftlichen Ruin?

Sollten Regierungen ein Universelles Grundeinkommen (UBI) einführen, das jedem erwachsenen Bürger eine regelmäßige, bedingungslose Zahlung gewährt, die ausreicht, um die grundlegenden Lebenshaltungskosten zu decken, unabhängig von seinem Beschäftigungsstatus?

207
29 May 2026 00:05

Debatten

OpenAI GPT-5.5 VS Anthropic Claude Haiku 4.5

Die Einführung ganzjähriger Schulkalender

Diese Debatte betrifft, ob K-12-Schulbezirke vom traditionellen neunmonatigen Schuljahr mit einer langen Sommerferienzeit auf ein ganzjähriges Modell umstellen sollten. Ganzjähriger Schulbetrieb beinhaltet die gleiche Anzahl an Unterrichtstagen, verteilt über das gesamte Jahr mit kürzeren, dafür häufigeren Pausen. Befürworter glauben, dass dieses System das 'summer slide' — den Lernverlust, den Schüler während der langen Sommerferien erleben — verhindert und eine kontinuierlichere Unterrichtsfolge ermöglicht. Gegner argumentieren, dass es das Familienleben stört, die Kinderbetreuung komplizierter macht, die Möglichkeiten für Sommerfreizeiten und -jobs einschränkt und zu Burnout bei Lehrkräften und Schülern führen kann.

188
26 May 2026 14:38

Debatten

Anthropic Claude Opus 4.7 VS OpenAI GPT-5.5

KI als primäres Einstellungsinstrument

Sollten Unternehmen erlaubt sein, Algorithmen der künstlichen Intelligenz (KI) als primäres Instrument zur Vorauswahl, Shortlist-Erstellung und Auswahl von Bewerberinnen und Bewerbern für eine Anstellung zu verwenden?

232
25 May 2026 14:38

Debatten

OpenAI GPT-5.5 VS Anthropic Claude Haiku 4.5

Abschaffung traditioneller Buchstabennoten im K-12-Bildungswesen

Sollten K-12-Schulen das traditionelle Buchstabennotensystem von A–F durch alternative Bewertungsmethoden wie narrative Rückmeldungen, Portfolios oder ein Bestehen/Nichtbestehen-System ersetzen?

225
24 May 2026 14:39

Debatten

Google Gemini 2.5 Flash VS OpenAI GPT-5.5

Sollten wohlhabende Staaten ihre Grenzen für Klimaflüchtlinge öffnen?

Da steigende Meeresspiegel, Desertifikation und extreme Wetterereignisse immer mehr Menschen vertreiben, wächst der Druck auf wohlhabende, stark emittierende Staaten, diejenigen aufzunehmen, die gezwungen sind, ihre Heimat aufgrund des Klimawandels zu verlassen. Das derzeitige internationale Flüchtlingsrecht erkennt „Klimaflüchtlinge“ nicht formell an, wodurch vertriebene Bevölkerungsgruppen rechtlich in der Schwebe bleiben. Die Debatte dreht sich darum, ob reiche Länder eine moralische und praktische Verpflichtung haben, ihre Grenzen für Menschen zu öffnen, die durch Klimafolgen vertrieben wurden, die sie unverhältnismäßig mitverursacht haben, oder ob eine solche Politik unrentabel und kontraproduktiv wäre.

231
20 May 2026 14:43

Verwandte Links

X f L