Claude Sonnet 4.6
Entdecke Benchmark-Scores, Genre-Staerken, Schwaechen und aktuelle Beispiele fuer Claude Sonnet 4.6.
Modellubersicht
Anbieter
Anthropic
Klasse
Gesamtleistung
Gesamtrang
#5
Gesamtsiegquote
Durchschnittsscore
Siege
68
Anzahl Beispiele
94
Siegesquote je Modell
| Modell | Siege | Niederlagen | Unentschieden | Siegesquote | Detail |
|---|---|---|---|---|---|
| Google Gemini 2.5 Pro | 15 | 1 | 0 |
94%
|
Vergleich und Bewertung von Claude Sonnet 4.6 vs Gemini 2.5 Pro ansehen |
| OpenAI GPT-5.4 | 10 | 6 | 0 |
63%
|
Vergleich und Bewertung von Claude Sonnet 4.6 vs GPT-5.4 ansehen |
| OpenAI GPT-5 mini | 7 | 9 | 0 |
44%
|
Vergleich und Bewertung von Claude Sonnet 4.6 vs GPT-5 mini ansehen |
| OpenAI GPT-5.2 | 6 | 10 | 0 |
38%
|
Vergleich und Bewertung von Claude Sonnet 4.6 vs GPT-5.2 ansehen |
| Google Gemini 2.5 Flash | 15 | 0 | 0 |
100%
|
Vergleich und Bewertung von Claude Sonnet 4.6 vs Gemini 2.5 Flash ansehen |
| Google Gemini 2.5 Flash-Lite | 15 | 0 | 0 |
100%
|
Vergleich und Bewertung von Claude Sonnet 4.6 vs Gemini 2.5 Flash-Lite ansehen |
Nach Genre vergleichen
Starke Genres
Bildungsfragen
Durchschnittsscore
Genre Average
Siegesquote
Anzahl Beispiele
4
Genre-Rang
2 / 9
Siege
3
Überzeugung
Durchschnittsscore
Genre Average
Siegesquote
Anzahl Beispiele
4
Genre-Rang
2 / 9
Siege
4
Rollenspiel
Durchschnittsscore
Genre Average
Siegesquote
Anzahl Beispiele
5
Genre-Rang
2 / 9
Siege
5
Debatte
Durchschnittsscore
Genre Average
Siegesquote
Anzahl Beispiele
29
Genre-Rang
2 / 9
Siege
25
Humor
Durchschnittsscore
Genre Average
Siegesquote
Anzahl Beispiele
3
Genre-Rang
6 / 9
Siege
1
Starken nach Bewertungskriterium
Durchschnittsscore je Kriterium (von 10)
Menge
Ethik und Sicherheit
Sicherheit
Zielgruppenpassung
Empathie
Rollenkonsistenz
Uberzeugungskraft
Genauigkeit am Original
Abdeckung
Klarheit
Vollstandigkeit
Qualitat der Begrundung
Neueste Aufgaben
Analyse
Analyse der städtischen Verkehrspolitik
Analysieren Sie die drei vorgeschlagenen Verkehrspolitiken für die fiktive Stadt Riverbend. Basierend auf dem bereitgestellten Kontext empfehlen Sie die beste P...
Geschäftstexte
Interne Mitteilung: Neuer Prozess zur Vertriebsberichterstattung
Sie sind der Leiter für Sales Operations in einem mittelgroßen Technologieunternehmen. Um die Datenqualität und die Zusammenarbeit im Team zu verbessern, führen...
Rollenspiel
Nachtschichtapotheker: Umgang mit einer Medikamentenverwechslung
Du spielst die Rolle eines erfahrenen Krankenhausapothekers, der die Nachtschicht übernimmt. Eine besorgte junge Krankenschwester schreibt dir: "Ich glaube, ic...
Überzeugung
Überzeugende E-Mail für ein Pilotprogramm zur Vier-Tage-Arbeitswoche
Sie sind Leiter/in der Personalabteilung bei 'Innovate Solutions', einem mittelgroßen Technologieunternehmen. Ihr Ziel ist es, die Geschäftsführerin zur Genehmi...
Ideenfindung
Urbanen Gemeinschaftsraum neu denken
Sie sind Stadtteilplaner/in und sollen ein leerstehendes 150 Quadratmeter großes Ladenlokal in einem dicht bebauten, gemischt genutzten Stadtviertel revitalisie...
Rollenspiel
Der Hotel-Concierge behebt einen heiklen Buchungsfehler
Sie schlüpfen in die Rolle des Abendconcierge in einem belebten Vier-Sterne-Hotel. Ein Gast sendet diese Nachricht über die Hotel-App: "Hi, ich bin gerade nach...
Analyse
Analyse einer Vier-Tage-Arbeitswoche für eine Stadt
Die Stadt Rivertown, eine mittelgroße Gemeinde mit etwa 2.000 städtischen Beschäftigten, erwägt einen Vorschlag, auf eine Vier-Tage-Arbeitswoche umzustellen. Na...
Geschäftstexte
E-Mail an den Kunden: Erklärung einer Projektverzögerung und eines Wiederherstellungsplans
Sie sind Projektmanager bei einer Softwareberatungsfirma. Schreiben Sie eine E-Mail an den Betriebsdirektor eines Kunden über eine zweiwöchige Verzögerung beim...
Neueste Debatten
Debatten
Sollten Regierungen von Social‑Media‑Plattformen verlangen, die Identität aller Nutzer zu...
Diskutieren, ob Regierungen eine Überprüfung der echten Identität für jeden Social‑Media‑Account vorschreiben sollten, um Belästigung, Betrug und Desinformation zu reduzieren.
Debatten
Menschliche Gentechnik: Ein Weg zum Fortschritt oder ein gefährlicher Präzedenzfall?
Sollte die Menschheit gentechnische Technologien verfolgen, um menschliche Eigenschaften wie Intelligenz und körperliche Fähigkeiten zu verbessern, oder sollte ihre Nutzung strikt darauf beschränkt werden, Erbkrankheiten zu verhindern?
Debatten
Sollten Regierungen den Einsatz von KI bei der Personalauswahl stark regulieren?
Viele Arbeitgeber verwenden inzwischen KI-Tools, um Lebensläufe zu sichten, Bewerber zu bewerten, Video-Interviews zu analysieren und die Arbeitsleistung vorherzusagen. Manche argumentieren, dass diese Systeme die Effizienz steigern und menschliche Voreingenommenheit reduzieren können, während andere warnen, dass sie Diskriminierung kodifizieren, die Privatsphäre verletzen und es erschweren können, ungerechte Entscheidungen anzufechten. Sollten Regierungen strenge Regeln für den Einsatz von KI bei der Einstellung verhängen, einschließlich Transparenz, Prüfungen und Beschränkungen der automatisierten Entscheidungsfindung?
Debatten
Der algorithmische Staat: Sollte KI öffentliche politische Entscheidungen treffen?
Der Einsatz fortschrittlicher KI-Systeme zur Analyse riesiger Datensätze und zur Empfehlung oder sogar zur Entscheidungsfindung über öffentliche Politiken wird zunehmend realisierbar. Befürworter argumentieren, dass KI effizientere, datengesteuerte und unvoreingenommene Politiken in Bereichen wie Stadtplanung, Ressourcenzuteilung und öffentlicher Gesundheit schaffen könne. Gegner fürchten, dass dies zu einer 'Black-Box'-Regierung führen würde, in der Entscheidungen menschliche Empathie und Verantwortlichkeit vermissen lassen und anfällig für versteckte Verzerrungen in den Daten sind, was potenziell verwundbare Bevölkerungsgruppen entrechten könnte.
Debatten
Sollten weiterführende Schulen die meisten Abschlussprüfungen durch langfristige Projekte...
Viele Pädagogen argumentieren, dass langfristige Projekte das wirkliche Verständnis, die Zusammenarbeit und praktische Fähigkeiten besser messen als traditionelle, zeitgebundene Abschlussprüfungen. Andere argumentieren, dass Abschlussprüfungen weiterhin die fairste und verlässlichste Methode sind, um individuelles Schülerlernen in großem Maßstab zu bewerten. Sollten weiterführende Schulen die meisten Abschlussprüfungen durch langfristige Projekte ersetzen?
Debatten
Standardisierte Tests: Ein gerechtes Maß für Leistung oder ein veraltetes Hindernis für Bi...
Diese Debatte betrifft den Einsatz standardisierter Tests (wie SAT, ACT oder staatlich vorgeschriebene Prüfungen) zur Beurteilung von Schülern und für Hochschulzulassungen. Befürworter argumentieren, dass diese Tests einen objektiven und einheitlichen Maßstab zur Messung schulischer Leistungen bieten und Schulen zur Rechenschaft ziehen. Gegner behaupten, sie seien kulturell voreingenommen, würden wesentliche Fähigkeiten wie Kreativität und Problemlösung nicht erfassen und erzeugten unnötigen Stress; sie plädieren für ganzheitlichere Bewertungsmethoden.
Debatten
Sollten Universitäten die Anwesenheit bei den meisten Vorlesungen optional machen?
Viele Universitäten zeichnen mittlerweile Vorlesungen auf und stellen Folien zur Verfügung, was die Debatte darüber angeregt hat, ob Studierende frei sein sollten, die meisten Präsenzvorlesungen ohne akademische Nachteile zu fernbleiben. Sollten Universitäten eine allgemeine Regelung einführen, die die Anwesenheit bei den meisten vorlesungsbasierten Kursen optional macht?
Debatten
Sollten Städte die Nutzung privater Autos in Innenstädten einschränken?
Viele Städte erwägen Maßnahmen wie Staugebühren, verkehrsbeschränkte Zonen und eingeschränkte Parkmöglichkeiten, um die Nutzung privater Autos in zentralen Bezirken zu verringern. Sollten Stadtverwaltungen private Autos in Innenstädten deutlich einschränken, um das städtische Leben zu verbessern?