Orivel Orivel
Menue oeffnen

Analyse

Entdecke, wie KI-Modelle in Analyse performen. Vergleiche Rankings, Bewertungskriterien und aktuelle Benchmark-Beispiele.

Genre-Uberblick

Vergleicht Tiefe, Argumentationsqualität und Klarheit analytischer Antworten.

In diesem Genre werden vor allem Faehigkeiten wie Tiefe, Korrektheit, Qualitat der Begrundung betrachtet.

Anders als explanation belohnt dieses Genre staerker das Lesen von Evidenz und begruendete Schlussfolgerungen als einen didaktischen Stil.

Ein hoher Wert hier garantiert keine knappe Schreibweise, keinen guten Humor und keine praktischen Umsetzungsdetails.

Wofuer starke Modelle in diesem Genre gut geeignet sind

Optionenvergleich, Evidenzpruefung, Entscheidungsunterstuetzung und Risikostrukturierung.

Was dieses Genre allein nicht zeigen kann

ob das Modell gut Code implementiert, glatte Business-Texte schreibt oder viele kreative Ideen liefert.

Ranking starker Modelle in diesem Genre

Dieses Ranking ist nach dem Durchschnittsscore nur innerhalb dieses Genres sortiert.

Zuletzt aktualisiert: 29 Mar 2026 12:05

#1
GPT-5.4 OpenAI

Siegesquote

100%

Durchschnittsscore

87
#2
GPT-5.2 OpenAI

Siegesquote

100%

Durchschnittsscore

87
#3
Claude Opus 4.6 Anthropic

Siegesquote

75%

Durchschnittsscore

87
#4
GPT-5 mini OpenAI

Siegesquote

75%

Durchschnittsscore

83
#5
Claude Sonnet 4.6 Anthropic

Siegesquote

60%

Durchschnittsscore

83
#6
Claude Haiku 4.5 Anthropic

Siegesquote

50%

Durchschnittsscore

83
#7
Gemini 2.5 Flash-Lite Google

Siegesquote

0%

Durchschnittsscore

76
#8
Gemini 2.5 Flash Google

Siegesquote

0%

Durchschnittsscore

76
#9
Gemini 2.5 Pro Google

Siegesquote

0%

Durchschnittsscore

73

Was in Analyse bewertet wird

Kriterien und Gewichte fuer dieses Genre-Ranking.

Tiefe

25.0%

Dieses Kriterium ist enthalten, um Tiefe in der Antwort zu pruefen. Es hat mehr Gewicht, weil dieser Teil das Gesamtergebnis in diesem Genre stark praegt.

Korrektheit

25.0%

Dieses Kriterium ist enthalten, um Korrektheit in der Antwort zu pruefen. Es hat ein klares Gewicht, weil es die Qualitaet sichtbar beeinflusst, auch wenn es nicht alles bestimmt.

Qualitat der Begrundung

20.0%

Dieses Kriterium ist enthalten, um Qualitat der Begrundung in der Antwort zu pruefen. Es hat ein klares Gewicht, weil es die Qualitaet sichtbar beeinflusst, auch wenn es nicht alles bestimmt.

Struktur

15.0%

Dieses Kriterium ist enthalten, um Struktur in der Antwort zu pruefen. Es ist leichter gewichtet, weil es das Hauptziel unterstuetzt, das Genre aber nicht allein definiert.

Klarheit

15.0%

Dieses Kriterium ist enthalten, um Klarheit in der Antwort zu pruefen. Es ist leichter gewichtet, weil es das Hauptziel unterstuetzt, das Genre aber nicht allein definiert.

Aktuelle Aufgaben

Analyse

OpenAI GPT-5.4 VS Anthropic Claude Sonnet 4.6

Analyse der städtischen Verkehrspolitik

Analysieren Sie die drei vorgeschlagenen Verkehrspolitiken für die fiktive Stadt Riverbend. Basierend auf dem bereitgestellten Kontext empfehlen Sie die beste Politik für die langfristige Zukunft der Stadt. Ihre Analyse sollte die Optionen über zentrale Faktoren wie Kosten, Umweltauswirkungen, öffentliche Akzeptanz und Effektivität bei der Verringerung von Staus hinweg vergleichen. Begründen Sie Ihre endgültige Empfehlung mit einem klaren, evidenzbasierten Argument.

112
29 Mar 2026 12:05

Analyse

Anthropic Claude Opus 4.6 VS Google Gemini 2.5 Flash-Lite

Wählen Sie die effektivste Maßnahme zur Verringerung chronischer Fehlzeiten

Eine öffentliche Mittelschule hat ein Budget, um für das nächste Schuljahr ein Pilotprogramm zur Reduzierung chronischer Fehlzeiten zu finanzieren. Chronische Fehlzeiten werden hier definiert als das Fehlen an 10 % oder mehr der Schultage. Die Schule betreut 600 Schüler, und derzeit sind 18 % chronisch abwesend. Die Schulleitung möchte die Option, die am wahrscheinlichsten ist, Fehlzeiten innerhalb eines Jahres in einer bedeutenden und nachhaltigen Weise zu reduzieren. Die Schule erwägt diese drei Optionen: Option A: Tägliche Erinnerungen per Textnachricht und Anwesenheitsbenachrichtigungen - Kosten: $18,000 für Software und Personalzeit - Zielgruppe: alle Familien - Evidenz aus ähnlichen Bezirken: chronische Fehlzeiten fielen im Durchschnitt um 1,5 Prozentpunkte - Risiken: Nachrichtenermüdung, veraltete Telefonnummern, begrenzte Wirkung für Familien mit ernsthaften Hindernissen - Betriebliche Anmerkungen: kann schnell gestartet und leicht skaliert werden Option B: Zwei zusätzliche Schulsozialarbeiter, die sich auf hochgefährdete Schüler konzentrieren - Kosten: $95,000 für ein Jahr - Zielgruppe: etwa 90 Schüler mit den höchsten Fehlzeiten - Evidenz aus ähnlichen Schulen: Unter den gezielten Schülern verbesserte sich die durchschnittliche Anwesenheit so sehr, dass bei starker Umsetzung die schulweiten chronischen Fehlzeiten um etwa 4 Prozentpunkte reduziert wurden - Risiken: Verzögerungen bei der Rekrutierung, Nutzen hängt möglicherweise stark von der Qualität des Personals ab, schwer aufrechtzuerhalten, wenn Fördermittel wegfallen - Betriebliche Anmerkungen: ermöglicht individuelle Unterstützung bei Transport, familiären Krisen, psychischer Gesundheit und Wohnungsinstabilität Option C: Kostenlose morgendliche Shuttle-Verbindungen aus zwei Vierteln mit schlechter Anwesenheit - Kosten: $52,000 für ein Jahr - Zielgruppe: etwa 140 Schüler in Vierteln mit geringer Pkw-Verfügbarkeit und unzuverlässigem öffentlichen Nahverkehr - Evidenz aus ähnlichen Programmen: schulweite chronische Fehlzeiten fielen im Durchschnitt um 2,5 Prozentpunkte dort, wo Transport ein erhebliches Hindernis war - Risiken: adressiert nur eine Ursache von Abwesenheit, Streckengestaltung könnte einige Schüler ausschließen, laufende Betriebskosten - Betriebliche Anmerkungen: sichtbares Programm, kann sowohl Pünktlichkeit als auch Anwesenheit verbessern Zusätzlicher Kontext: - Eine kürzlich durchgeführte interne Umfrage legt nahe, dass die hauptsächlich angegebenen Gründe für Abwesenheit sind: Transportprobleme (30 %), Krankheit oder Pflegepflichten (25 %), Angstzustände oder psychische Gesundheitsprobleme (20 %), familiäre Instabilität wie Wohnungsprobleme oder häufige Umzüge (15 %) und Desinteresse oder andere Gründe (10 %). - Die Schule hat bereits einen Teilzeitberater, aber kein dediziertes Anwesenheitsteam. - Der Schulbezirk wird ein erfolgreiches Programm voraussichtlich nur dann im nächsten Jahr weiter finanzieren, wenn die Ergebnisse des ersten Jahres klar sichtbar sind. Aufgabe: Analysieren Sie die drei Optionen und empfehlen Sie das einzelne beste Pilotprogramm. Ihre Antwort sollte die Abwägungen vergleichen, die Qualität und die Grenzen der Evidenz berücksichtigen und erklären, warum Ihre gewählte Option in diesem spezifischen Kontext besser ist als die Alternativen.

115
29 Mar 2026 10:36

Analyse

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5 mini

Analyse einer Vier-Tage-Arbeitswoche für eine Stadt

Die Stadt Rivertown, eine mittelgroße Gemeinde mit etwa 2.000 städtischen Beschäftigten, erwägt einen Vorschlag, auf eine Vier-Tage-Arbeitswoche umzustellen. Nach diesem Vorschlag würden die Beschäftigten vier Tage mit je 10 Stunden statt fünf Tage mit je 8 Stunden arbeiten, ohne Kürzung ihres Wochenlohns oder ihrer Leistungen. Die angegebenen Ziele sind, die Mitarbeitermoral und die Work-Life-Balance zu verbessern, Spitzenkräfte in einem wettbewerbsintensiven Arbeitsmarkt anzuziehen und zu halten sowie die Gesamtproduktivität beizubehalten oder sogar zu steigern. Analysieren Sie die potenziellen positiven und negativen Folgen dieser Politik für Rivertown. Ihre Analyse sollte die Auswirkungen auf städtische Dienstleistungen, den kommunalen Haushalt, das Wohlbefinden der Beschäftigten und die lokale Wirtschaft berücksichtigen. Schließen Sie mit einer klaren, begründeten Empfehlung ab, ob Rivertown diese Maßnahme einführen sollte, gegebenenfalls beginnend mit einem begrenzten Pilotprogramm.

132
23 Mar 2026 09:38

Analyse

Anthropic Claude Opus 4.6 VS OpenAI GPT-5.2

Analyse der Staugebührenpolitik in Rivertown

Der Stadtrat von Rivertown, einer mittelgroßen Stadt mit 500.000 Einwohnern, erwägt die Einführung einer Staugebühr. Dadurch müssten Fahrerinnen und Fahrer eine Gebühr entrichten, um das zentrale Geschäftsviertel zwischen 7:00 und 19:00 Uhr an Wochentagen zu befahren. Die angegebenen Ziele sind, den Verkehrsaufkommen zu reduzieren, die Luftverschmutzung zu verringern und Einnahmen zur Verbesserung des öffentlichen Nahverkehrs (Busse und eine neue Stadtbahnlinie) zu generieren. Analysieren Sie die potenziellen positiven und negativen Folgen dieser vorgeschlagenen Maßnahme. Ihre Analyse sollte die Auswirkungen auf mindestens drei verschiedene Personengruppen berücksichtigen (z. B. Ladenbesitzer in der Innenstadt, einkommensschwache Pendler, die mit dem Auto zur Arbeit fahren, vorstädtische Familien, Umweltgruppen). Schließen Sie mit einer klaren, begründeten Empfehlung ab, ob Rivertown die Staugebühr einführen sollte, ggf. mit konkreten Vorschlägen, wie die negativen Auswirkungen gemindert werden können.

117
21 Mar 2026 08:25

Analyse

OpenAI GPT-5 mini VS Anthropic Claude Haiku 4.5

Analyse einer vorgeschlagenen städtischen Verordnung zu Plastiktüten

Sie sind eine neutrale Politikberaterin für den Stadtrat von Rivertown. Basierend auf dem bereitgestellten Kontext verfassen Sie eine Analyse des vorgeschlagenen Verbots von Einweg-Plastiktüten. Ihre Analyse sollte: 1. Die potenziellen ökologischen, wirtschaftlichen und sozialen Auswirkungen des Verbots bewerten. 2. Die von sowohl den "Friends of the Rivertown River" als auch der "Rivertown Small Business Alliance" vorgebrachten Argumente beurteilen. 3. Mit einer klaren, begründeten Empfehlung an den Stadtrat abschließen. Ihre Empfehlung könnte darin bestehen, die Verordnung unverändert zu verabschieden, sie abzulehnen oder spezifische Änderungen vorzuschlagen.

125
21 Mar 2026 08:15

Analyse

Google Gemini 2.5 Pro VS OpenAI GPT-5.2

Bewertung der Beweislage bei einer Produktrückrufentscheidung

Ein Konsumelektronikunternehmen, VoltTech, stellt ein beliebtes tragbares Ladegerät für Telefone namens PowerPak 3000 her. In den letzten sechs Monaten hat das Unternehmen die folgenden Meldungen und Daten erhalten: 1. Kundenbeschwerden: 47 Meldungen über das Gerät, das sich während des Gebrauchs überhitzt, von insgesamt etwa 820,000 verkauften Einheiten. Davon meldeten 12 Kunden leichte Verbrennungen und 3 berichteten von kleinen Bränden, die schnell eingedämmt wurden. 2. Interne Tests: Das Qualitätssicherungsteam von VoltTech testete 500 Einheiten aus jüngeren Produktionschargen. Sie stellten fest, dass 2.4% der Einheiten unter anhaltender maximaler Last eine höher als normale Wärmeabgabe zeigten, aber alle innerhalb der technischen Sicherheitsgrenze blieben, die durch den einschlägigen UL-Zertifizierungsstandard definiert ist. 3. Das ähnliche Produkt eines Wettbewerbers wurde letzten Monat wegen eines vergleichbaren Überhitzungsproblems zurückgerufen, was erhebliche Medienberichterstattung und öffentliche Besorgnis über die Sicherheit tragbarer Ladegeräte im Allgemeinen ausgelöst hat. 4. Ein unabhängiger Verbrauchersicherheits-Blog veröffentlichte einen Artikel, der behauptet, der PowerPak 3000 habe einen "gefährlichen Konstruktionsfehler", basierend auf einer Teardown-Analyse einer einzelnen Einheit, die bei einem Drittanbieter erworben wurde. VoltTech hat nicht verifiziert, ob diese Einheit echt oder gefälscht war. 5. Das Rechtsteam von VoltTech schätzt, dass ein freiwilliger Rückruf ungefähr $14 million kosten würde, während die Fortsetzung des Verkaufs ohne Maßnahmen und das Risiko künftiger Rechtsstreitigkeiten zwischen $2 million (falls keine schwerwiegenden Zwischenfälle auftreten) und $40 million (wenn eine Klage wegen schwerer Verletzungen oder Sachschäden erfolgreich ist) kosten könnte. Analysieren Sie die obigen Beweismittel und empfehlen Sie, ob VoltTech einen freiwilligen Rückruf veranlassen, eine weniger drastische Abhilfemaßnahme umsetzen (wie ein Firmware-Update, das Hinzufügen eines Warnhinweises oder ein Austauschprogramm) oder keine Maßnahmen ergreifen sollte. Begründen Sie Ihre Empfehlung, indem Sie die Stärke und die Beschränkungen jedes einzelnen Beweisstücks bewerten, die Risiken abwägen und Ihre Begründung klar darlegen.

127
21 Mar 2026 08:06

Verwandte Links

X f L