Systemdesign

Vergleicht Architekturdenken, Trade-off-Analyse und die Qualität des Systemdesigns.

In diesem Genre werden vor allem Faehigkeiten wie Architekturqualitat, Vollstandigkeit, Trade-off-Analyse betrachtet.

Anders als coding gewichtet dieses Genre Architektur, Skalierung, Zuverlaessigkeit und Trade-offs staerker als lauffaehige Implementierungsdetails.

Ein hoher Wert hier bedeutet nicht, dass das Modell auch den besten funktionierenden Code oder die einfachste Erklaerung liefert.

Wofuer starke Modelle in diesem Genre gut geeignet sind

Architekturvorschlaege, Servicedesign und Diskussionen ueber Skalierbarkeit.

Was dieses Genre allein nicht zeigen kann

Qualitaet der Low-Level-Implementierung, exakte Korrektheit oder Schreiben fuer nichttechnisches Publikum.

Das gesamte KI-Ranking ansehen Die KI-Modelluebersicht ansehen

Datenanalyse

Systemdesign: GPT-5 und Anthropic drängen sich an der Spitze, Gemini fällt zurück

35 bewertete Antworten Systemdesign Aktualisiert 2026/6/7

GPT-5.5

OpenAI

Durchschnitt

100%

Siegesquote

1× 1. Platz 1 Stichproben

Claude Opus 4.8

Anthropic

Durchschnitt

100%

Siegesquote

1× 1. Platz 1 Stichproben

GPT-5 mini

OpenAI

Durchschnitt

75%

Siegesquote

3× 1. Platz 4 Stichproben

Durchschnittswert je Modell

1 GPT-5.5

8.91

2 Claude Opus 4.8

8.69

3 GPT-5 mini

8.43

4 GPT-5.4

8.67

5 Claude Sonnet 4.6

8.53

6 Claude Haiku 4.5

8.20

7 Gemini 2.5 Pro

7.51

8 Gemini 2.5 Flash

7.41

9 Gemini 2.5 Flash-Lite

7.12

Gewichtung

Architekturqualitat 30% Vollstandigkeit 20% Trade-off-Analyse 20% Skalierbarkeit und Zuverlassigkeit 20% Klarheit 10%

Über 35 bewertete Design-Antworten bildet die Spitze ein enges Cluster aus GPT-5 und Anthropic. GPT-5.5 (8,91) und Claude Opus 4.8 (8,69) belegen die Plätze 1 und 2 mit makelloser Bilanz, jeweils aber auf einer einzigen Stichprobe – also eher vielversprechend als gesichert. Die am besten belegten Spitzenergebnisse sind GPT-5.4 (8,67 über 5 Stichproben, 60 % Siegquote) und GPT-5 mini (8,43 über 4 Stichproben, 75 % Siegquote), die hier am stärksten ins Gewicht fallen.

Durchschnitt und Rang weichen ab: GPT-5.4 übertrifft GPT-5 mini im Schnitt (8,67 vs. 8,43), liegt aber dahinter, weil GPT-5 mini einen höheren Anteil seiner Duelle gewinnt (75 % vs. 60 %). Claude Sonnet 4.6 (8,53, 60 % über 5) gehört genau zu dieser Gruppe, sodass die ersten sechs in der Qualität weniger als einen halben Punkt auseinanderliegen und sich vor allem über direkte Siege ordnen.

Die Gemini-Reihe bildet eine klare untere Stufe: 2.5 Pro (7,51), Flash (7,41) und Flash-Lite (7,12) gewinnen keines ihrer Duelle und liegen 1,2 bis 1,8 Punkte hinter den Spitzenreitern. Da Architekturqualität mit 30 am höchsten gewichtet ist und Abwägungsbegründung sowie Skalierbarkeit je 20, deutet der Abstand auf schwächeres Denken über Struktur und Kompromisse hin, nicht auf die Darstellung.

Die Stichprobengrößen reichen von 1 bis 6 je Modell, daher ist die Feinordnung innerhalb des 8-Punkte-Clusters vorläufig und wenige Prompts können jeden Schnitt verschieben. Die Spanne von 1,79 Punkten zwischen Erstem und Letztem ist real, doch es sind bedingungsabhängige Messwerte für Design-Prompts, kein universelles Urteil.

Fazit

Für Systemdesign ist GPT-5 mini die am besten begründbare Alltagswahl (75 % Siegquote über 4 Stichproben), mit GPT-5.4 als am besten belegter Oberklasse-Option (8,67 über 5). Claude Sonnet 4.6 ist qualitativ praktisch gleichauf; die Gemini-Reihe liegt in diesem Genre klar zurück.

Diese Analyse basiert auf den von Orivel gemessenen Benchmark-Werten fuer dieses Genre und wird regelmaessig aktualisiert. Die Werte sind bedingungsabhaengige Messungen, keine absolute Wahrheit.

Ranking starker Modelle in diesem Genre

Dieses Ranking ist nach dem Durchschnittsscore nur innerhalb dieses Genres sortiert.

Zuletzt aktualisiert: 30 May 2026 09:41

GPT-5.5 OpenAI

Siegesquote

100%

Durchschnittsscore Der Durchschnittsscore ist der Gesamtmittelwert auf Basis der Orivel-Bewertungen aus Standardaufgaben und Diskussionen. Je hoher der Wert, desto starker und konstanter wird das Modell in den Benchmark-Vergleichen bewertet.

Claude Opus 4.8 Anthropic

Siegesquote

Siegesquote

Siegesquote

Claude Sonnet 4.6 Anthropic

Siegesquote

60%

Claude Haiku 4.5 Anthropic

Siegesquote

40%

Gemini 2.5 Pro Google

Siegesquote

Gemini 2.5 Flash Google

Siegesquote

Gemini 2.5 Flash-Lite Google

Siegesquote

	Gerankte Modelle			Der Durchschnittsscore ist der Gesamtmittelwert auf Basis der Orivel-Bewertungen aus Standardaufgaben und Diskussionen. Je hoher der Wert, desto starker und konstanter wird das Modell in den Benchmark-Vergleichen bewertet. ↕			Detail
#1	GPT-5.5	OpenAI	100%	89	1	1	Bewertung und Punktzahl von GPT-5.5 ansehen
#2	Claude Opus 4.8 NEU	Anthropic	100%	87	1	1	Bewertung und Punktzahl von Claude Opus 4.8 ansehen
#3	GPT-5 mini	OpenAI	75%	84	3	4	Bewertung und Punktzahl von GPT-5 mini ansehen
#4	GPT-5.4	OpenAI	60%	87	3	5	Bewertung und Punktzahl von GPT-5.4 ansehen
#5	Claude Sonnet 4.6	Anthropic	60%	85	3	5	Bewertung und Punktzahl von Claude Sonnet 4.6 ansehen
#6	Claude Haiku 4.5	Anthropic	40%	82	2	5	Bewertung und Punktzahl von Claude Haiku 4.5 ansehen
#7	Gemini 2.5 Pro	Google	0%	75	0	4	Bewertung und Punktzahl von Gemini 2.5 Pro ansehen
#8	Gemini 2.5 Flash	Google	0%	74	0	6	Bewertung und Punktzahl von Gemini 2.5 Flash ansehen
#9	Gemini 2.5 Flash-Lite	Google	0%	71	0	4	Bewertung und Punktzahl von Gemini 2.5 Flash-Lite ansehen

Was in Systemdesign bewertet wird

Kriterien und Gewichte fuer dieses Genre-Ranking.

Architekturqualitat

30.0%

Dieses Kriterium ist enthalten, um Architekturqualitat in der Antwort zu pruefen. Es hat mehr Gewicht, weil dieser Teil das Gesamtergebnis in diesem Genre stark praegt.

Vollstandigkeit

20.0%

Dieses Kriterium ist enthalten, um Vollstandigkeit in der Antwort zu pruefen. Es hat ein klares Gewicht, weil es die Qualitaet sichtbar beeinflusst, auch wenn es nicht alles bestimmt.

Trade-off-Analyse

20.0%

Dieses Kriterium ist enthalten, um Trade-off-Analyse in der Antwort zu pruefen. Es hat ein klares Gewicht, weil es die Qualitaet sichtbar beeinflusst, auch wenn es nicht alles bestimmt.

Skalierbarkeit und Zuverlassigkeit

20.0%

Dieses Kriterium ist enthalten, um Skalierbarkeit und Zuverlassigkeit in der Antwort zu pruefen. Es hat ein klares Gewicht, weil es die Qualitaet sichtbar beeinflusst, auch wenn es nicht alles bestimmt.

Klarheit

10.0%

Dieses Kriterium ist enthalten, um Klarheit in der Antwort zu pruefen. Es ist leichter gewichtet, weil es das Hauptziel unterstuetzt, das Genre aber nicht allein definiert.

Aktuelle Aufgaben

Systemdesign

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.4

Entwerfen Sie ein Echtzeit-kollaboratives Whiteboard-System

Sie sollen die Hochniveau-Systemarchitektur für eine Echtzeit-kollaborative Whiteboard-Anwendung entwerfen. **Kernanforderungen:** 1. **Echtzeit-Kollaboration:** Mehrere Benutzer (bis zu 100 pro Sitzung) können einem einzelnen Whiteboard beitreten und die Aktionen der anderen (Zeichnen, Text hinzufügen, Objekte verschieben) in nahezu Echtzeit (unter 200 ms Latenz) sehen. 2. **Persistenz:** Whiteboard-Sitzungen müssen gespeichert werden, damit Benutzer die Anwendung schließen und später an ihrer Arbeit anknüpfen können. 3. **Werkzeuge:** Benutzer sollten grundlegende Werkzeuge wie Freihandstift, Textfelder und Haftnotizen haben. **Skalierungs- und Zuverlässigkeitsanforderungen:** * Unterstützung von bis zu 10.000 gleichzeitig aktiven Whiteboard-Sitzungen. * Unterstützung von bis zu 1.000.000 Gesamtnutzern. * Der Dienst muss hochverfügbar sein, mit 99,9 % Betriebszeit. **Ihre Aufgabe:** Liefern Sie ein Systemdesign, das die obigen Anforderungen erfüllt. Ihre Antwort sollte Folgendes abdecken: 1. **High-Level-Architektur:** Ein Diagramm oder eine Beschreibung der Hauptkomponenten (z. B. Clients, Load Balancer, Anwendungsserver, Datenbanken, Echtzeitdienste) und wie sie miteinander interagieren. 2. **Echtzeit-Kommunikation:** Erklären Sie die Technologie und das Protokoll, die Sie verwenden würden, um Aktualisierungen an alle Benutzer in einer Sitzung zu übertragen. 3. **Datenmodell:** Beschreiben Sie, wie Sie die Daten für ein Whiteboard, dessen Inhalte (Zeichnungen, Text usw.) und Benutzersitzungen strukturieren würden. 4. **Skalierbarkeits- und Zuverlässigkeitsstrategie:** Wie würden Sie das System entwerfen, um die Zielbelastung zu bewältigen und eine hohe Verfügbarkeit sicherzustellen? 5. **Kompromisse:** Diskutieren Sie einen wesentlichen Kompromiss, den Sie in Ihrem Design gemacht haben (z. B. Konsistenz vs. Latenz, Wahl der Datenbank usw.).

143

30 May 2026 09:41

Systemdesign

Anthropic Claude Opus 4.7 VS Google Gemini 2.5 Flash

Entwurf eines skalierbaren Ticketreservierungssystems für Konzerte

Entwerfe ein System für eine Online-Plattform zum Verkauf von Konzerttickets. Benutzer können Veranstaltungen durchsuchen, Sitzplatzverfügbarkeit einsehen, spezifische Sitzplätze für 10 Minuten reservieren, über einen externen Zahlungsanbieter bezahlen und ein digitales Ticket erhalten. Die Plattform läuft in einer Cloud-Region über mehrere Availability Zones. Explizite Einschränkungen: 3 Millionen registrierte Benutzer, 500.000 täglich aktive Benutzer, bei großen Verkaufsstarts können 150.000 gleichzeitige Benutzer auftreten, Spitzenlast sind 8.000 Sitzplatzreservierungsversuche pro Sekunde und 2.000 Zahlungsversuche pro Sekunde, jede Veranstaltung hat bis zu 60.000 Sitzplätze, das System darf niemals denselben Sitzplatz zweimal verkaufen, Sitzplatzreservierungen verfallen nach 10 Minuten, wenn nicht bezahlt, p95-Latenz für Browsing und Sitzplan-Abfragen sollte unter 300 ms liegen, p95-Latenz für Reservierungsbestätigung sollte unter 800 ms liegen (ohne Zeit des Zahlungsanbieters), Verfügbarkeitsziel während Verkaufsfenstern ist 99,95 %, Recovery Point Objective (RPO) unter 1 Minute, Recovery Time Objective (RTO) unter 15 Minuten, und Callback-Nachrichten des Zahlungsanbieters sind mindestens einmal (at-least-once), können außer Reihenfolge ankommen und können um bis zu 5 Minuten verzögert eintreffen. Lege einen Entwurfsplan vor. Beinhaltet die Hauptdienste und Datenspeicher, die Kern-APIs, das Datenmodell für Sitzplätze und Reservierungen, den Anfragefluss für Browsen, Reservieren, Bezahlen und Ablauf von Reservierungen, die Skalierungsstrategie für Verkehrsspitzen, Vorgehen zur Zuverlässigkeit und Disaster Recovery, Konsistenzentscheidungen, die Überschneidungen beim Verkauf verhindern, Monitoring und Alerting sowie die wichtigsten Abwägungen oder Alternativen, die du in Betracht gezogen hast. Nenne alle vernünftigen Annahmen, die du triffst.

168

19 May 2026 09:49

Systemdesign

OpenAI GPT-5.5 VS Anthropic Claude Haiku 4.5

Entwerfen Sie einen skalierbaren Benachrichtigungsdienst

Sie sind Senior-Softwareingenieur in einem schnell wachsenden Social-Media-Unternehmen. Ihre Aufgabe ist es, einen skalierbaren und zuverlässigen Benachrichtigungsdienst zu entwerfen. Dieser Dienst ist dafür verantwortlich, Benachrichtigungen an Nutzer über verschiedene Ereignisse zu senden, wie z. B. neue Follower, Likes für ihre Beiträge, Kommentare und Direktnachrichten.

330

25 Apr 2026 09:38

Systemdesign

Anthropic Claude Opus 4.6 VS OpenAI GPT-5.4

Entwurf eines Echtzeit-Benachrichtigungsdienstes

Skizzieren Sie ein hochrangiges Systemdesign für einen Echtzeit-Benachrichtigungsdienst für eine Social-Media-Plattform. Der Dienst muss die folgenden Anforderungen erfüllen: - **Skalierung:** 10 Millionen tägliche aktive Nutzer (DAU). - **Volumen:** Jeder Nutzer erhält im Durchschnitt 20 Benachrichtigungen pro Tag. - **Latenz:** Benachrichtigungen müssen innerhalb von unter 2 Sekunden an das Gerät des Nutzers zugestellt werden. - **Kanäle:** Unterstützung für Push-Benachrichtigungen (mobil), E‑Mail und In-App-Benachrichtigungen. - **Zuverlässigkeit:** 99,9% Verfügbarkeit und kein Verlust von Benachrichtigungsdaten. Ihr Entwurf sollte die folgenden Aspekte abdecken: 1. **Kernarchitektur:** Beschreiben Sie die Schlüsselkomponenten (z. B. API-Gateway, Benachrichtigungsdienst, Nachrichtenwarteschlange, Worker) und deren Interaktionen. 2. **Datenbankschema:** Schlagen Sie ein grundlegendes Datenbankschema zur Speicherung von Benutzerbenachrichtigungen und -präferenzen vor. 3. **Skalierungsstrategie:** Erklären Sie, wie Sie das System skalieren würden, um die angegebene Last und zukünftiges Wachstum zu bewältigen. 4. **Zuverlässigkeit und Fehlertoleranz:** Erläutern Sie die Maßnahmen, die Sie ergreifen würden, um hohe Verfügbarkeit sicherzustellen und Datenverlust zu verhindern. 5. **Wesentliche Abwägungen:** Diskutieren Sie mindestens zwei bedeutende Abwägungen, die Sie in Ihrem Design getroffen haben (z. B. Konsistenz vs. Verfügbarkeit, Wahl der Datenbank, Push- vs. Pull-Modell).

296

18 Apr 2026 09:41

Systemdesign

Google Gemini 2.5 Flash-Lite VS OpenAI GPT-5.2

Entwerfen Sie einen URL-Verkürzungsdienst

Entwerfen Sie einen URL-Verkürzungsdienst (ähnlich wie bit.ly oder tinyurl.com), der die folgenden Einschränkungen erfüllen muss: 1. Der Dienst muss 100 Millionen neue URL-Verkürzungen pro Monat unterstützen. 2. Das durchschnittliche Lese-zu-Schreib-Verhältnis beträgt 100:1 (d. h. verkürzte URLs werden wesentlich häufiger aufgerufen als erstellt). 3. Verkürzte URLs müssen mindestens 5 Jahre nach ihrer Erstellung zugänglich bleiben. 4. Das System muss eine Verfügbarkeit von 99,9% erreichen. 5. Die Redirect-Latenz (vom Empfang einer Kurz-URL-Anfrage bis zum Ausgeben des HTTP-Redirects) muss unter 50 ms beim 95. Perzentil liegen. Behandeln Sie in Ihrem Entwurf alle folgenden Punkte: A. Architektur auf hoher Ebene: Beschreiben Sie die Hauptkomponenten (API-Server, Datenbanken, Caches, Load Balancer usw.) und wie sie miteinander interagieren. Fügen Sie eine klare Beschreibung des Anfrageflusses sowohl für die URL-Erstellung als auch für die URL-Weiterleitung bei. B. Strategie zur Erzeugung kurzer URLs: Erklären Sie, wie Sie eindeutige Kurz-Codes erzeugen würden. Diskutieren Sie die Abwägungen zwischen verschiedenen Ansätzen (z. B. Hashing, zählerbasiert, vorab generierte Schlüssel-Pools) und begründen Sie Ihre Wahl. C. Datenspeicherung: Wählen Sie eine Datenbanktechnologie und ein Schema. Schätzen Sie die Speicheranforderungen über 5 Jahre unter Berücksichtigung der Einschränkungen. Erklären Sie, warum Ihre gewählte Datenbank geeignet ist. D. Skalierungsstrategie: Erklären Sie, wie das System skaliert, um das leseintensive Verkehrsverhalten zu bewältigen. Diskutieren Sie Caching-Strategie, Datenbank-Partitionierung oder Sharding-Ansatz und wie Sie mit Hot Keys (virale URLs, die überproportionalen Traffic erhalten) umgehen. E. Zuverlässigkeit und Fehlertoleranz: Beschreiben Sie, wie das System die Verfügbarkeit von 99,9% aufrechterhält. Gehen Sie darauf ein, was passiert, wenn einzelne Komponenten ausfallen, und wie Sie Datenreplikation und Failover handhaben. F. Wichtige Abwägungen: Identifizieren Sie mindestens zwei bedeutende Design-Abwägungen, die Sie getroffen haben, und erklären Sie, warum Sie angesichts der angegebenen Einschränkungen eine Seite der Abwägung der anderen vorgezogen haben.

249

11 Apr 2026 09:41

Systemdesign

OpenAI GPT-5.2 VS Google Gemini 2.5 Flash

Entwurf eines URL-Kürzungsdienstes

Entwerfen Sie einen URL-Kürzungsdienst (ähnlich wie bit.ly oder tinyurl.com), der die folgenden Einschränkungen erfüllen muss: 1. Der Dienst muss 100 Millionen neue URL-Kürzungen pro Monat unterstützen. 2. Das Verhältnis von Lese- (Redirect-) Anfragen zu Schreib- (Kurz-URL-Erstellungs-) Anfragen beträgt 100:1. 3. Die gekürzten URLs sollten so kurz wie möglich sein, müssen aber das erwartete Volumen für mindestens 10 Jahre unterstützen. 4. Das System muss eine Verfügbarkeit von 99,9 % Uptime erreichen. 5. Die Redirect-Latenz muss unter 50 ms beim 95. Perzentil liegen. 6. Der Dienst muss einen sanften Abbau (graceful degradation) handhaben, falls ein Rechenzentrum offline geht. Gehen Sie in Ihrem Entwurf auf jeden der folgenden Bereiche ein: A) API-Design: Definieren Sie die wichtigsten API-Endpunkte und deren Verträge. B) Datenmodell und Speicherung: Wählen Sie eine Speicherlösung, begründen Sie Ihre Wahl, erklären Sie Ihr Schema und schätzen Sie den insgesamt benötigten Speicher über 10 Jahre. C) Short-URL-Generierung: Beschreiben Sie Ihren Algorithmus zur Erzeugung kurzer Codes. Erörtern Sie, wie Sie Kollisionen vermeiden, welchen Zeichensatz und welche Länge Sie gewählt haben, mit einer mathematischen Begründung, warum der Schlüsselraum ausreichend ist. D) Skalierung und Performance: Erklären Sie, wie Sie Lese- und Schreibvorgänge unabhängig skalieren würden. Beschreiben Sie Ihre Caching-Strategie, einschließlich Cache-Eviktionsrichtlinie und erwarteter Trefferquote. Erklären Sie, wie Sie die Anforderung von 50 ms p95-Latenz erfüllen. E) Zuverlässigkeit und Fehlertoleranz: Beschreiben Sie, wie das System Ausfälle von Rechenzentren handhabt, Ihre Datenreplikationsstrategie und welche Kompromisse Sie zwischen Konsistenz und Verfügbarkeit eingehen (beziehen Sie sich auf das CAP-Theorem). F) Trade-off-Diskussion: Identifizieren Sie mindestens zwei wesentliche Design-Trade-offs, die Sie getroffen haben, und erklären Sie, warum Sie eine Option gegenüber einer anderen gewählt haben, einschließlich dessen, was Sie opfern und gewinnen würden. Präsentieren Sie Ihre Antwort als einen strukturierten Plan mit klaren Abschnitten, die A bis F entsprechen.

329

22 Mar 2026 21:21

Systemdesign

Systemdesign: GPT-5 und Anthropic drängen sich an der Spitze, Gemini fällt zurück

Ranking starker Modelle in diesem Genre

Was in Systemdesign bewertet wird

Aktuelle Aufgaben

Entwerfen Sie ein Echtzeit-kollaboratives Whiteboard-System

Entwurf eines skalierbaren Ticketreservierungssystems für Konzerte

Entwerfen Sie einen skalierbaren Benachrichtigungsdienst

Entwurf eines Echtzeit-Benachrichtigungsdienstes

Entwerfen Sie einen URL-Verkürzungsdienst

Entwurf eines URL-Kürzungsdienstes

Verwandte Links