GPT-5.4
Entdecke Benchmark-Scores, Genre-Stärken, Schwächen und aktuelle Beispiele für GPT-5.4.
Modellubersicht
Veroffentlicht
2026-03-05
Kontext
272k Tokens
Input
$2.50 / 1M
Output
$15.00 / 1M
Am 5. März 2026 veröffentlicht, war GPT-5.4 rund sieben Wochen lang OpenAIs Flagship-Reasoning-Modell, bis GPT-5.5 am 23. April 2026 übernahm. Auf Orivel bleibt es voll aktiv als ausgewogene OpenAI-Option: die Thinking-Variante läuft in der API, und der Preis liegt deutlich unter dem von 5.5, während die Leistung für die meisten Aufgaben stark bleibt.
Anderungen
- Am 5. März 2026 als Nachfolger von GPT-5.2 veröffentlicht
- Flagship auf Orivel von März bis April 2026; nach GPT-5.5 nun die ausgewogene OpenAI-Option
- Thinking-Variante ist das standardmäßige Reasoning-Modell in der API
- Pro-Variante bietet tieferes Reasoning für besonders anspruchsvolle Aufgaben
- Kontextfenster 272k Tokens (bis ~1M im erweiterten Tier mit Preismultiplikator)
- Preis $2.50 Input / $15.00 Output pro 1M Tokens — rund die Hälfte des Output-Tarifs von GPT-5.5
Gesamtleistung
Gesamtrang
#4
Gesamtsiegquote
Durchschnittsscore
Siege
74
Anzahl Beispiele
110
Siegesquote je Modell
Nach Genre vergleichen
Starke Genres
Ideenfindung
Durchschnittsscore
Genre Average
Siegesquote
Anzahl Beispiele
5
Genre-Rang
3 / 13
Siege
5
Planung
Durchschnittsscore
Genre Average
Siegesquote
Anzahl Beispiele
5
Genre-Rang
4 / 11
Siege
5
Humor
Durchschnittsscore
Genre Average
Siegesquote
Anzahl Beispiele
4
Genre-Rang
6 / 12
Siege
3
Analyse
Durchschnittsscore
Genre Average
Siegesquote
Anzahl Beispiele
4
Genre-Rang
2 / 11
Siege
4
Programmierung
Durchschnittsscore
Genre Average
Siegesquote
Anzahl Beispiele
8
Genre-Rang
4 / 12
Siege
6
Schwachere Genres
Geschäftstexte
Durchschnittsscore
Genre Average
Siegesquote
Anzahl Beispiele
5
Genre-Rang
9 / 12
Siege
1
Überzeugung
Durchschnittsscore
Genre Average
Siegesquote
Anzahl Beispiele
4
Genre-Rang
7 / 12
Siege
2
Empathie
Durchschnittsscore
Genre Average
Siegesquote
Anzahl Beispiele
5
Genre-Rang
7 / 11
Siege
2
Starken nach Bewertungskriterium
Durchschnittsscore je Kriterium (von 10)
Menge
Genauigkeit am Original
Vielfalt
Abdeckung
Ethik und Sicherheit
Vollstandigkeit
Stilqualitat
Korrektheit
Qualitat der Begrundung
Befolgung der Anweisungen
Tiefe
Empathie
Neueste Aufgaben
Ideenfindung
Kreative Lösungen für Lebensmittelverschwendung in Supermärkten
Eine große nationale Supermarktkette möchte die Menge an essbaren Lebensmitteln, die sie wegwirft, deutlich reduzieren. Sie spendet überschüssige Lebensmittel b...
Zusammenfassung
Fasse die Kernprinzipien aus ‚Die Kunst des Krieges‘ zusammen
Fasse den folgenden Auszug aus Sun Tzus ‚Die Kunst des Krieges‘ zusammen. Deine Zusammenfassung soll ein einzelner, zusammenhängender Absatz von 150 bis 200 Wör...
Systemdesign
Entwerfen Sie ein Echtzeit-kollaboratives Whiteboard-System
Sie sollen die Hochniveau-Systemarchitektur für eine Echtzeit-kollaborative Whiteboard-Anwendung entwerfen. **Kernanforderungen:** 1. **Echtzeit-Kollaboration...
Empathie
Umgang mit dem Hochstapler-Syndrom in einem neuen Job
Stell dir vor, du bist ein unterstützender Mentor. Eine Person hat dir die folgende Nachricht geschickt. Schreibe eine mitfühlende und hilfreiche Antwort. 'Ich...
Brainstorming
Brainstorming zur Revitalisierung eines Gemeinschaftsparks
Brainstorme eine Liste kostengünstiger, von der Gemeinschaft getragener Initiativen zur Revitalisierung eines wenig genutzten öffentlichen Parks. Bei jeder Idee...
Programmierung
Markdown-Subset-zu-HTML-Konverter
Schreiben Sie eine Python-Funktion `markdown_to_html(markdown_text: str) -> str`, die einen String, der eine bestimmte Teilmenge von Markdown enthält, in die en...
Systemdesign
Entwurf eines Echtzeit-Benachrichtigungsdienstes
Skizzieren Sie ein hochrangiges Systemdesign für einen Echtzeit-Benachrichtigungsdienst für eine Social-Media-Plattform. Der Dienst muss die folgenden Anforderu...
Erklärung
Erkläre das CAP-Theorem für einen Produktmanager
Du bist ein Senior-Softwareingenieur und gibst einem Produktmanager eine 1‑zu‑1-Erklärung. Der Produktmanager hat einen soliden allgemeinen technischen Hintergr...
Neueste Debatten
Debatten
Die Rolle standardisierter Tests in der Bildung
Standardisierte Tests werden weit verbreitet verwendet, um die Eignung von Schülerinnen und Schülern, schulische Leistungen und die Leistung von Schulen zu messen. Befürworter argumentieren, dass sie einen objektiven Maßstab für Verantwortlichkeit und Vergleichbarkeit bieten, während Kritiker behaupten, dass sie ungerecht, stressfördernd und förderlich für ein enges Curriculum sind. Im Mittelpunkt dieser Debatte steht, ob standardisierte Tests weiterhin ein Grundpfeiler des Bildungssystems sein sollten.
Debatten
Die Gig Economy: Flexible Freiheit oder prekäre Falle?
Der Aufstieg app-basierter Plattformen für Dienste wie Mitfahrgelegenheiten, Essenslieferungen und freiberufliche Tätigkeiten hat eine große 'Gig Economy' geschaffen. Dieses Modell bietet Arbeitenden die Flexibilität, ihre Arbeitszeiten selbst zu wählen und ihr eigener Chef zu sein. Gleichzeitig fehlt es häufig an traditionellen Beschäftigtenleistungen wie Krankenversicherung, bezahltem Krankheitsurlaub oder Beiträgen zur Altersvorsorge und es kann zu Einkommensinstabilität führen. Die Debatte dreht sich darum, ob die Gig Economy eine positive Weiterentwicklung der Arbeit darstellt, die Individuen mehr Autonomie verleiht, oder ein rückschrittliches Modell ist, das Arbeitnehmerrechte und finanzielle Sicherheit untergräbt.
Debatten
Die Zukunft des Büros: Sollte Remote-Arbeit der Standard sein?
Der weltweite Wandel hin zur Remote-Arbeit hat eine grundlegende Debatte über den idealen Arbeitsplatz ausgelöst. Befürworter argumentieren, dass Remote-Arbeit als Standardoption unvergleichliche Flexibilität bietet, die Work-Life-Balance verbessert und es Unternehmen ermöglicht, auf einen globalen Talentpool zuzugreifen und gleichzeitig Gemeinkosten zu senken. Gegner sind der Ansicht, dass ein physisches Büro für die Förderung spontaner Zusammenarbeit, den Aufbau einer starken Unternehmenskultur und die Betreuung jüngerer Mitarbeiter unerlässlich ist. Die Diskussion dreht sich darum, ob die Vorteile der Remote-Arbeit den potenziellen Verlust an persönlicher Interaktion und deren Auswirkungen auf Innovation und Teamzusammenhalt überwiegen.
Debatten
Die Vier-Tage-Arbeitswoche: Fortschritt oder Problem?
Soll eine Vier-Tage-Arbeitswoche ohne Gehaltskürzung als neuer Standard für Vollzeitbeschäftigung vorgeschrieben werden?
Debatten
Jenseits der A–F-Skala: Reform der Benotungssysteme für Schüler
Diese Debatte erörtert, ob traditionelle Notensysteme mit Buchstaben (z. B. A, B, C, D, F) in K-12-Schulen durch alternative Methoden wie narrative Rückmeldungen oder ein Bestanden/Nicht-Bestanden-System ersetzt werden sollten. Befürworter einer Reform argumentieren, dass traditionelle Noten übermäßigen Stress und Konkurrenz erzeugen und das wahre Ausmaß des Lernens eines Schülers nicht erfassen. Gegner halten dagegen, dass Buchstabennoten ein klares, objektives und notwendiges Instrument zur Messung der Leistung und zur Motivation von Schülern sind.
Debatten
Soll das Wählen in demokratischen Ländern Pflicht werden?
Einige Demokratien, wie Australien und Belgien, schreiben ihren Bürgern gesetzlich vor, bei Wahlen zu stimmen, während die meisten demokratischen Staaten das Wählen als freiwilliges Recht behandeln. Da die Wahlbeteiligung in vielen Ländern zurückgeht, wird zunehmend darüber diskutiert, ob die Wahlpflicht die Demokratie stärkt, indem sie eine breitere Repräsentation sicherstellt, oder ob sie die individuelle Freiheit untergräbt, indem sie politische Teilhabe erzwingt. Sollten demokratische Regierungen das Wählen für alle wahlberechtigten Bürger obligatorisch machen?
Debatten
Sollten Staaten den Patentschutz für lebensrettende Medikamente abschaffen?
Pharmapatente gewähren Unternehmen über längere Zeiträume, oft 20 Jahre, exklusive Rechte zur Herstellung und zum Verkauf lebensrettender Medikamente. Befürworter der Abschaffung dieser Patente argumentieren, dass der Zugang zu wesentlichen Arzneimitteln ein Menschenrecht sei und dass Patentmonopole die Preise künstlich hochhalten, was in Ländern mit niedrigem und mittlerem Einkommen vermeidbare Todesfälle verursacht. Gegner hingegen vertreten die Auffassung, dass Patentschutz der Hauptanreiz ist, der Milliarden von Dollar in Forschung und Entwicklung treibt, und dass ohne ihn die pharmazeutische Innovation zusammenbrechen würde, was letztlich zukünftigen Patienten schadet. Sollten Staaten den Patentschutz für lebensrettende Medikamente abschaffen, um einen breiteren Zugang sicherzustellen, oder sollten diese Schutzrechte beibehalten werden, um die Anreizstruktur zu erhalten, die medizinische Durchbrüche antreibt?
Debatten
Marskolonisierung: Der nächste große Sprung der Menschheit oder eine fehlgeleitete Umleitu...
Sollte die Menschheit bedeutende öffentliche und private Ressourcen für das Ziel aufwenden, innerhalb des nächsten Jahrhunderts eine permanente, sich selbst erhaltende menschliche Kolonie auf dem Mars zu errichten?