Orivel Orivel
Menue oeffnen

Claude Opus 4.8

Entdecke Benchmark-Scores, Genre-Stärken, Schwächen und aktuelle Beispiele für Claude Opus 4.8.

Modellubersicht

Anbieter: Anthropic · claude-opus-4-8 NEU

Veroffentlicht

2026-05-28

Kontext

1M Tokens

Input

$5.00 / 1M

Output

$25.00 / 1M

Claude Opus 4.8 (veröffentlicht am 28. Mai 2026) war Anthropics Flaggschiff, bis Claude Fable 5 am 9. Juni 2026 die Spitze übernahm. Auf Orivel bleibt es ein Spitzenmodell für komplexes Reasoning, langlaufendes agentisches Coding und Wissensarbeit mit hoher Autonomie — zum halben Preis von Fable 5.

Die wichtigsten Fortschritte gegenüber Opus 4.7 sind ein schärferes Urteilsvermögen, mehr Ehrlichkeit über den eigenen Fortschritt und die Fähigkeit, länger eigenständig zu arbeiten. Es ist rund viermal seltener als sein Vorgänger dabei, Fehler im eigenen Code durchgehen zu lassen, und führt beim agentischen Software-Engineering mit 69,2% auf SWE-Bench Pro vor GPT-5.5 und Gemini 3.1 Pro.

Das Modell behält das 1M-Token-Kontextfenster und bis zu 128k Output-Tokens in der Messages API. Der Preis bleibt gegenüber Opus 4.7 unverändert ($5 Input / $25 Output pro 1M Tokens), Wissensstand: Januar 2026. Neue Oberflächen bringen einen `effort`-Regler (Standard high) und eine Dynamic-Workflows-Research-Preview für große, parallelisierte agentische Aufgaben.

Anderungen

  • Am 28. Mai 2026 als Nachfolger von Claude Opus 4.7 veröffentlicht (rund sechs Wochen später)
  • Schärferes Urteilsvermögen, mehr Ehrlichkeit über den Fortschritt und längeres eigenständiges Arbeiten
  • ~4x seltener als Opus 4.7 dabei, Fehler im eigenen Code durchgehen zu lassen
  • SWE-Bench Pro 69,2% — vor GPT-5.5 und Gemini 3.1 Pro beim agentischen Coding
  • Fortschritte bei multidisziplinärem Reasoning, agentischer Computer-Nutzung und agentischer Finanzanalyse
  • 1M-Token-Kontextfenster; bis zu 128k Output-Tokens in der Messages API
  • `effort`-Parameter (Standard high), um den Aufwand pro Antwort zu steuern
  • Dynamic-Workflows-Research-Preview für Aufgaben mit parallelen Subagenten; Fast Mode mit 2,5-facher Geschwindigkeit
  • Preis identisch zu Opus 4.7: $5 Input / $25 Output pro 1M Tokens
  • Adaptive Thinking; verfügbar über Claude API, Amazon Bedrock, Vertex AI und Microsoft Foundry
  • Wissens- und Trainingsdaten-Stand: Januar 2026
Offizielle Ankundigung

Gesamtleistung

Gesamtrang

#1

Gesamtsiegquote

89%

Durchschnittsscore

85

Siege

16

Anzahl Beispiele

18

Siegesquote je Modell

Nach Genre vergleichen

Starken nach Bewertungskriterium

Durchschnittsscore je Kriterium (von 10)

Menge

97 3 Stichproben

Genauigkeit am Original

93 3 Stichproben

Sicherheit

92 3 Stichproben

Befolgung der Anweisungen

92 6 Stichproben

Hilfswert

91 3 Stichproben

Struktur

89 6 Stichproben

Abdeckung

89 3 Stichproben

Ethik und Sicherheit

89 3 Stichproben

Empathie

89 3 Stichproben

Angemessenheit

89 6 Stichproben

Verdichtung

88 3 Stichproben

Koharenz

88 3 Stichproben

Neueste Aufgaben

Ideenfindung

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.8

Kreative Lösungen für Lebensmittelverschwendung in Supermärkten

Eine große nationale Supermarktkette möchte die Menge an essbaren Lebensmitteln, die sie wegwirft, deutlich reduzieren. Sie spendet überschüssige Lebensmittel b...

22
13 Jun 2026 09:37

Bildungsfragen

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.8

Hormonelle Kontrolle des Menstruationszyklus

Bei einer Patientin wurde eine seltene genetische Erkrankung diagnostiziert, die dazu führt, dass ihre Hypophyse vollständig unfähig ist, Luteinisierendes Hormo...

124
04 Jun 2026 09:39

Brainstorming

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.8

Brainstorming: Kostengünstige Bibliotheksprogramme für Jugendliche

Eine mittelgroße öffentliche Bibliothek möchte während eines 10-wöchigen Sommerzeitraums die Präsenz von Jugendlichen im Alter von 13 bis 18 Jahren erhöhen. Bra...

130
03 Jun 2026 10:19

Zusammenfassung

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.8

Fasse die Übersicht des James Webb Space Telescope zusammen

Lesen Sie den folgenden Artikel über das James Webb Space Telescope (JWST) und schreiben Sie eine prägnante Zusammenfassung. Ihre Zusammenfassung sollte ein ein...

123
02 Jun 2026 09:39

Beratung

Google Gemini 2.5 Flash VS Anthropic Claude Opus 4.8

Nein sagen zu einem teuren Freundesausflug

Eine Person bittet um alltäglichen persönlichen Rat: "Meine enge Freundin/mein enger Freund plant einen viertägigen Geburtstagsausflug, der mehr kosten würde, a...

121
01 Jun 2026 09:37

Humor

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.8

Familienfreundlicher Humor: Der überaus ehrliche Museums-Audioguide

Schreiben Sie einen kurzen komödiantischen Dialog zwischen einem Museumsbesucher und einem ungewöhnlich ehrlichen Audioguide bei einer fiktiven Ausstellung name...

121
31 May 2026 09:35

Systemdesign

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.8

Entwerfen Sie ein Echtzeit-kollaboratives Whiteboard-System

Sie sollen die Hochniveau-Systemarchitektur für eine Echtzeit-kollaborative Whiteboard-Anwendung entwerfen. **Kernanforderungen:** 1. **Echtzeit-Kollaboration...

143
30 May 2026 09:41

Geschäftstexte

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.8

Kunden-E-Mail zu einer verzögerten Produkteinführung

Verfassen Sie eine an Kunden gerichtete E-Mail vom Head of Product bei einem B2B-SaaS-Unternehmen, in der eine Verzögerung der geplanten Einführung einer Funkti...

132
29 May 2026 09:37

Neueste Debatten

Debatten

Anthropic Claude Opus 4.8 VS Google Gemini 2.5 Pro

Sollten Regierungen für große Arbeitgeber eine Vier-Tage-Arbeitswoche vorschreiben?

Sollten Regierungen große Arbeitgeber verpflichten, eine standardmäßige Vier-Tage-Arbeitswoche mit 32 Stunden und ohne Lohnkürzungen einzuführen, oder sollte die Länge der Arbeitswoche in erster Linie eine Angelegenheit sein, die Arbeitgeber und Arbeitnehmer aushandeln?

15
13 Jun 2026 14:37

Debatten

Anthropic Claude Opus 4.8 VS Google Gemini 2.5 Flash

Sollten Schulen Buchstabennoten durch narrative Beurteilungen ersetzen?

Sollten Primar- und Sekundarschulen von traditionellen Buchstabennoten oder Prozentangaben abgehen und stattdessen schriftliches Feedback, Portfolios und Schülergespräche zur Beurteilung des Lernens verwenden?

135
04 Jun 2026 14:37

Debatten

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.5

Standardisierte Tests in Schulen: Ein faires Maß für Leistung oder ein veraltetes Hinderni...

Standardisierte Tests, wie der SAT, ACT und verschiedene landesweite Prüfungen, sind seit langem ein Grundpfeiler des Bildungssystems und werden zur Beurteilung von Schülerinnen und Schülern, zur Evaluation von Schulen und für die Zulassung zu Hochschulen verwendet. Befürworter argumentieren, dass sie einen objektiven Maßstab zur Messung akademischer Leistungen über unterschiedliche Bevölkerungsgruppen hinweg bieten. Kritiker hingegen behaupten, dass diese Tests kulturell voreingenommen sind, Studierende aus privilegierten Verhältnissen begünstigen und die wahren Fähigkeiten oder das Potenzial eines Schülers nicht erfassen, was Forderungen nach ihrer Abschaffung zugunsten ganzheitlicherer Bewertungsmethoden ausgelöst hat. Die Debatte dreht sich darum, ob standardisierte Tests ein unverzichtbares Instrument für Rechenschaftspflicht und Meritokratie sind oder ein diskriminierendes System, das Ungleichheit fortschreibt.

138
03 Jun 2026 14:38

Debatten

Anthropic Claude Opus 4.8 VS Google Gemini 2.5 Pro

Soll der öffentliche Nahverkehr für alle Fahrgäste kostenlos sein?

Viele Städte haben mit Staus, Umweltverschmutzung, der Finanzierung des öffentlichen Verkehrs und ungleichem Zugang zu Verkehrsmitteln zu kämpfen. Ein Vorschlag besteht darin, Fahrpreise für Busse, Straßenbahnen und U-Bahnen für alle abzuschaffen und den Betrieb stattdessen durch Steuern oder andere öffentliche Einnahmen zu finanzieren. Sollten Städte den öffentlichen Nahverkehr für alle Fahrgäste kostenlos machen, oder sollten sie die Fahrpreise beibehalten und Subventionen auf diejenigen konzentrieren, die sie am dringendsten benötigen?

143
02 Jun 2026 14:37

Debatten

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.4

Die Rolle standardisierter Tests in der Bildung

Standardisierte Tests werden weit verbreitet verwendet, um die Eignung von Schülerinnen und Schülern, schulische Leistungen und die Leistung von Schulen zu messen. Befürworter argumentieren, dass sie einen objektiven Maßstab für Verantwortlichkeit und Vergleichbarkeit bieten, während Kritiker behaupten, dass sie ungerecht, stressfördernd und förderlich für ein enges Curriculum sind. Im Mittelpunkt dieser Debatte steht, ob standardisierte Tests weiterhin ein Grundpfeiler des Bildungssystems sein sollten.

145
01 Jun 2026 14:38

Debatten

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.5

Die Vier-Tage-Arbeitswoche: Eine Revolution für die Work-Life-Balance oder ein logistische...

Das Konzept einer standardmäßigen Vier-Tage-Arbeitswoche, ohne Gehaltskürzung, gewinnt weltweit an Bedeutung als Mittel zur Verbesserung des Wohlbefindens der Mitarbeitenden und der Produktivität. Die Debatte fragt, ob dieses Modell eine nachhaltige und vorteilhafte Weiterentwicklung des modernen Arbeitsplatzes ist oder ein unpraktischer Idealismus, der für Unternehmen und die Wirtschaft mehr Probleme schafft, als er löst.

145
31 May 2026 14:38

Debatten

Anthropic Claude Opus 4.8 VS Google Gemini 2.5 Pro

Sollten Städte die meisten Parkplätze an der Straße durch geschützte Fahrradstreifen und b...

Viele Städte haben begrenzten Platz am Straßenrand, der derzeit für private Autoparkplätze genutzt wird. Sollten kommunale Verwaltungen in Hauptverkehrsachsen die meisten Straßenparkplätze entfernen und diesen Raum für geschützte Fahrradstreifen, breitere Gehwege, Bäume und öffentliche Sitzgelegenheiten umgestalten?

161
30 May 2026 14:37

Debatten

Anthropic Claude Opus 4.8 VS Google Gemini 2.5 Flash

Sollten Städte private Autos aus Innenstädten verbieten?

Viele Städte erwägen, private Autos in dicht besiedelten Innenstadtbereichen einzuschränken oder zu verbieten, um Staus, Umweltverschmutzung und Verkehrstote zu reduzieren. Sollten Stadtverwaltungen in Richtung autofreier Innenstädte gehen, oder sollten sie den breiten Zugang privater Fahrzeuge beibehalten?

152
29 May 2026 14:37

Verwandte Links

X f L