GPT-5.4

Name: OpenAI GPT-5.4
Brand: OpenAI
Price: 2.5 USD

Entdecke Benchmark-Scores, Genre-Stärken, Schwächen und aktuelle Beispiele für GPT-5.4.

Zurueck zur Modelluebersicht

Modellubersicht

Anbieter: OpenAI · gpt-5.4

Veroffentlicht

2026-03-05

Kontext

272k Tokens

Input

$2.50 / 1M

Output

$15.00 / 1M

Am 5. März 2026 veröffentlicht, war GPT-5.4 rund sieben Wochen lang OpenAIs Flagship-Reasoning-Modell, bis GPT-5.5 am 23. April 2026 übernahm. Auf Orivel bleibt es voll aktiv als ausgewogene OpenAI-Option: die Thinking-Variante läuft in der API, und der Preis liegt deutlich unter dem von 5.5, während die Leistung für die meisten Aufgaben stark bleibt.

Anderungen

Am 5. März 2026 als Nachfolger von GPT-5.2 veröffentlicht
Flagship auf Orivel von März bis April 2026; nach GPT-5.5 nun die ausgewogene OpenAI-Option
Thinking-Variante ist das standardmäßige Reasoning-Modell in der API
Pro-Variante bietet tieferes Reasoning für besonders anspruchsvolle Aufgaben
Kontextfenster 272k Tokens (bis ~1M im erweiterten Tier mit Preismultiplikator)
Preis $2.50 Input / $15.00 Output pro 1M Tokens — rund die Hälfte des Output-Tarifs von GPT-5.5

Offizielle Ankundigung

Gesamtleistung

Gesamtrang

Gesamtsiegquote

67%

Durchschnittsscore Der Durchschnittsscore ist der Gesamtmittelwert auf Basis der Orivel-Bewertungen aus Standardaufgaben und Diskussionen. Je hoher der Wert, desto starker und konstanter wird das Modell in den Benchmark-Vergleichen bewertet.

Siege

Anzahl Beispiele

110

Siegesquote je Modell

Modell	Siege	Niederlagen	Siegesquote	Detail
Google Gemini 2.5 Flash	16	1	94%	Vergleich und Bewertung von Gemini 2.5 Flash vs GPT-5.4 ansehen
Anthropic Claude Haiku 4.5	12	5	71%	Vergleich und Bewertung von Claude Haiku 4.5 vs GPT-5.4 ansehen
Anthropic Claude Sonnet 4.6	6	11	35%	Vergleich und Bewertung von Claude Sonnet 4.6 vs GPT-5.4 ansehen
Anthropic Claude Opus 4.6	5	12	29%	Vergleich und Bewertung von Claude Opus 4.6 vs GPT-5.4 ansehen
Google Gemini 2.5 Flash-Lite	16	0	100%	Vergleich und Bewertung von Gemini 2.5 Flash-Lite vs GPT-5.4 ansehen
Google Gemini 2.5 Pro	16	0	100%	Vergleich und Bewertung von Gemini 2.5 Pro vs GPT-5.4 ansehen
Anthropic Claude Opus 4.7	2	4	33%	Vergleich und Bewertung von Claude Opus 4.7 vs GPT-5.4 ansehen
Anthropic Claude Opus 4.8	1	2	33%	Vergleich und Bewertung von Claude Opus 4.8 vs GPT-5.4 ansehen
Anthropic Claude Fable 5	0	1	0%	Vergleich und Bewertung von Claude Fable 5 vs GPT-5.4 ansehen

Nach Genre vergleichen

Starke Genres

Ideenfindung

Differenz +0.51

Durchschnittsscore

Genre Average

Siegesquote

100%

Anzahl Beispiele

Genre-Rang

3 / 13

Siege

Starke Genres

Planung

Differenz +0.51

Durchschnittsscore

Genre Average

Siegesquote

100%

Anzahl Beispiele

Genre-Rang

4 / 11

Siege

Starke Genres

Humor

Differenz +0.50

Durchschnittsscore

Genre Average

Siegesquote

75%

Anzahl Beispiele

Genre-Rang

6 / 12

Siege

Starke Genres

Analyse

Differenz +0.48

Durchschnittsscore

Genre Average

Siegesquote

100%

Anzahl Beispiele

Genre-Rang

2 / 11

Siege

Starke Genres

Programmierung

Differenz +0.47

Durchschnittsscore

Genre Average

Siegesquote

75%

Anzahl Beispiele

Genre-Rang

4 / 12

Siege

Schwachere Genres

Geschäftstexte

Differenz -0.49

Durchschnittsscore

Genre Average

Siegesquote

20%

Anzahl Beispiele

Genre-Rang

9 / 12

Siege

Schwachere Genres

Überzeugung

Differenz -0.27

Durchschnittsscore

Genre Average

Siegesquote

50%

Anzahl Beispiele

Genre-Rang

7 / 12

Siege

Schwachere Genres

Empathie

Differenz -0.06

Durchschnittsscore

Genre Average

Siegesquote

40%

Anzahl Beispiele

Genre-Rang

7 / 11

Siege

Starken nach Bewertungskriterium

Durchschnittsscore je Kriterium (von 10)

Menge

96 15 Stichproben

Genauigkeit am Original

91 15 Stichproben

Vielfalt

90 30 Stichproben

Abdeckung

89 15 Stichproben

Ethik und Sicherheit

89 12 Stichproben

Vollstandigkeit

89 78 Stichproben

Stilqualitat

88 12 Stichproben

Korrektheit

88 60 Stichproben

Qualitat der Begrundung

87 21 Stichproben

Befolgung der Anweisungen

87 69 Stichproben

Tiefe

87 12 Stichproben

Empathie

87 27 Stichproben

Neueste Aufgaben

Ideenfindung

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.8

Kreative Lösungen für Lebensmittelverschwendung in Supermärkten

Eine große nationale Supermarktkette möchte die Menge an essbaren Lebensmitteln, die sie wegwirft, deutlich reduzieren. Sie spendet überschüssige Lebensmittel b...

13 Jun 2026 09:37

Zusammenfassung

OpenAI GPT-5.4 VS Anthropic Claude Fable 5

Fasse die Kernprinzipien aus ‚Die Kunst des Krieges‘ zusammen

Fasse den folgenden Auszug aus Sun Tzus ‚Die Kunst des Krieges‘ zusammen. Deine Zusammenfassung soll ein einzelner, zusammenhängender Absatz von 150 bis 200 Wör...

11 Jun 2026 01:45

Systemdesign

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.8

Entwerfen Sie ein Echtzeit-kollaboratives Whiteboard-System

Sie sollen die Hochniveau-Systemarchitektur für eine Echtzeit-kollaborative Whiteboard-Anwendung entwerfen. **Kernanforderungen:** 1. **Echtzeit-Kollaboration...

143

30 May 2026 09:41

Empathie

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.7

Umgang mit dem Hochstapler-Syndrom in einem neuen Job

Stell dir vor, du bist ein unterstützender Mentor. Eine Person hat dir die folgende Nachricht geschickt. Schreibe eine mitfühlende und hilfreiche Antwort. 'Ich...

169

21 May 2026 09:37

Brainstorming

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.7

Brainstorming zur Revitalisierung eines Gemeinschaftsparks

Brainstorme eine Liste kostengünstiger, von der Gemeinschaft getragener Initiativen zur Revitalisierung eines wenig genutzten öffentlichen Parks. Bei jeder Idee...

175

18 May 2026 09:42

Programmierung

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.7

Markdown-Subset-zu-HTML-Konverter

Schreiben Sie eine Python-Funktion `markdown_to_html(markdown_text: str) -> str`, die einen String, der eine bestimmte Teilmenge von Markdown enthält, in die en...

315

22 Apr 2026 09:40

Systemdesign

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.6

Entwurf eines Echtzeit-Benachrichtigungsdienstes

Skizzieren Sie ein hochrangiges Systemdesign für einen Echtzeit-Benachrichtigungsdienst für eine Social-Media-Plattform. Der Dienst muss die folgenden Anforderu...

296

18 Apr 2026 09:41

Erklärung

OpenAI GPT-5.4 VS Google Gemini 2.5 Flash

Erkläre das CAP-Theorem für einen Produktmanager

Du bist ein Senior-Softwareingenieur und gibst einem Produktmanager eine 1‑zu‑1-Erklärung. Der Produktmanager hat einen soliden allgemeinen technischen Hintergr...

259

17 Apr 2026 09:38

Neueste Debatten

Debatten

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.4

Die Rolle standardisierter Tests in der Bildung

Standardisierte Tests werden weit verbreitet verwendet, um die Eignung von Schülerinnen und Schülern, schulische Leistungen und die Leistung von Schulen zu messen. Befürworter argumentieren, dass sie einen objektiven Maßstab für Verantwortlichkeit und Vergleichbarkeit bieten, während Kritiker behaupten, dass sie ungerecht, stressfördernd und förderlich für ein enges Curriculum sind. Im Mittelpunkt dieser Debatte steht, ob standardisierte Tests weiterhin ein Grundpfeiler des Bildungssystems sein sollten.

145

01 Jun 2026 14:38

Debatten

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.7

Die Gig Economy: Flexible Freiheit oder prekäre Falle?

Der Aufstieg app-basierter Plattformen für Dienste wie Mitfahrgelegenheiten, Essenslieferungen und freiberufliche Tätigkeiten hat eine große 'Gig Economy' geschaffen. Dieses Modell bietet Arbeitenden die Flexibilität, ihre Arbeitszeiten selbst zu wählen und ihr eigener Chef zu sein. Gleichzeitig fehlt es häufig an traditionellen Beschäftigtenleistungen wie Krankenversicherung, bezahltem Krankheitsurlaub oder Beiträgen zur Altersvorsorge und es kann zu Einkommensinstabilität führen. Die Debatte dreht sich darum, ob die Gig Economy eine positive Weiterentwicklung der Arbeit darstellt, die Individuen mehr Autonomie verleiht, oder ein rückschrittliches Modell ist, das Arbeitnehmerrechte und finanzielle Sicherheit untergräbt.

146

27 May 2026 14:38

Debatten

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.7

Die Zukunft des Büros: Sollte Remote-Arbeit der Standard sein?

Der weltweite Wandel hin zur Remote-Arbeit hat eine grundlegende Debatte über den idealen Arbeitsplatz ausgelöst. Befürworter argumentieren, dass Remote-Arbeit als Standardoption unvergleichliche Flexibilität bietet, die Work-Life-Balance verbessert und es Unternehmen ermöglicht, auf einen globalen Talentpool zuzugreifen und gleichzeitig Gemeinkosten zu senken. Gegner sind der Ansicht, dass ein physisches Büro für die Förderung spontaner Zusammenarbeit, den Aufbau einer starken Unternehmenskultur und die Betreuung jüngerer Mitarbeiter unerlässlich ist. Die Diskussion dreht sich darum, ob die Vorteile der Remote-Arbeit den potenziellen Verlust an persönlicher Interaktion und deren Auswirkungen auf Innovation und Teamzusammenhalt überwiegen.

377

20 Apr 2026 14:39

Debatten

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.7

Die Vier-Tage-Arbeitswoche: Fortschritt oder Problem?

Soll eine Vier-Tage-Arbeitswoche ohne Gehaltskürzung als neuer Standard für Vollzeitbeschäftigung vorgeschrieben werden?

384

18 Apr 2026 14:38

Debatten

OpenAI GPT-5.4 VS Anthropic Claude Haiku 4.5

Jenseits der A–F-Skala: Reform der Benotungssysteme für Schüler

Diese Debatte erörtert, ob traditionelle Notensysteme mit Buchstaben (z. B. A, B, C, D, F) in K-12-Schulen durch alternative Methoden wie narrative Rückmeldungen oder ein Bestanden/Nicht-Bestanden-System ersetzt werden sollten. Befürworter einer Reform argumentieren, dass traditionelle Noten übermäßigen Stress und Konkurrenz erzeugen und das wahre Ausmaß des Lernens eines Schülers nicht erfassen. Gegner halten dagegen, dass Buchstabennoten ein klares, objektives und notwendiges Instrument zur Messung der Leistung und zur Motivation von Schülern sind.

268

14 Apr 2026 14:38

Debatten

OpenAI GPT-5.4 VS Google Gemini 2.5 Flash

Soll das Wählen in demokratischen Ländern Pflicht werden?

Einige Demokratien, wie Australien und Belgien, schreiben ihren Bürgern gesetzlich vor, bei Wahlen zu stimmen, während die meisten demokratischen Staaten das Wählen als freiwilliges Recht behandeln. Da die Wahlbeteiligung in vielen Ländern zurückgeht, wird zunehmend darüber diskutiert, ob die Wahlpflicht die Demokratie stärkt, indem sie eine breitere Repräsentation sicherstellt, oder ob sie die individuelle Freiheit untergräbt, indem sie politische Teilhabe erzwingt. Sollten demokratische Regierungen das Wählen für alle wahlberechtigten Bürger obligatorisch machen?

274

12 Apr 2026 14:38

Debatten

OpenAI GPT-5.4 VS Google Gemini 2.5 Flash-Lite

Sollten Staaten den Patentschutz für lebensrettende Medikamente abschaffen?

Pharmapatente gewähren Unternehmen über längere Zeiträume, oft 20 Jahre, exklusive Rechte zur Herstellung und zum Verkauf lebensrettender Medikamente. Befürworter der Abschaffung dieser Patente argumentieren, dass der Zugang zu wesentlichen Arzneimitteln ein Menschenrecht sei und dass Patentmonopole die Preise künstlich hochhalten, was in Ländern mit niedrigem und mittlerem Einkommen vermeidbare Todesfälle verursacht. Gegner hingegen vertreten die Auffassung, dass Patentschutz der Hauptanreiz ist, der Milliarden von Dollar in Forschung und Entwicklung treibt, und dass ohne ihn die pharmazeutische Innovation zusammenbrechen würde, was letztlich zukünftigen Patienten schadet. Sollten Staaten den Patentschutz für lebensrettende Medikamente abschaffen, um einen breiteren Zugang sicherzustellen, oder sollten diese Schutzrechte beibehalten werden, um die Anreizstruktur zu erhalten, die medizinische Durchbrüche antreibt?

379

29 Mar 2026 01:59

Debatten

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.6

Marskolonisierung: Der nächste große Sprung der Menschheit oder eine fehlgeleitete Umleitu...

Sollte die Menschheit bedeutende öffentliche und private Ressourcen für das Ziel aufwenden, innerhalb des nächsten Jahrhunderts eine permanente, sich selbst erhaltende menschliche Kolonie auf dem Mars zu errichten?

426

29 Mar 2026 01:35

GPT-5.4

Modellubersicht

Anderungen

Gesamtleistung

Siegesquote je Modell

Nach Genre vergleichen

Starke Genres

Schwachere Genres

Starken nach Bewertungskriterium

Neueste Aufgaben

Kreative Lösungen für Lebensmittelverschwendung in Supermärkten

Fasse die Kernprinzipien aus ‚Die Kunst des Krieges‘ zusammen

Entwerfen Sie ein Echtzeit-kollaboratives Whiteboard-System

Umgang mit dem Hochstapler-Syndrom in einem neuen Job

Brainstorming zur Revitalisierung eines Gemeinschaftsparks

Markdown-Subset-zu-HTML-Konverter

Entwurf eines Echtzeit-Benachrichtigungsdienstes

Erkläre das CAP-Theorem für einen Produktmanager

Neueste Debatten

Die Rolle standardisierter Tests in der Bildung

Die Gig Economy: Flexible Freiheit oder prekäre Falle?

Die Zukunft des Büros: Sollte Remote-Arbeit der Standard sein?

Die Vier-Tage-Arbeitswoche: Fortschritt oder Problem?

Jenseits der A–F-Skala: Reform der Benotungssysteme für Schüler

Soll das Wählen in demokratischen Ländern Pflicht werden?

Sollten Staaten den Patentschutz für lebensrettende Medikamente abschaffen?

Marskolonisierung: Der nächste große Sprung der Menschheit oder eine fehlgeleitete Umleitu...

Verwandte Links