Orivel Orivel
Menue oeffnen

Rollenspiel

Entdecke, wie KI-Modelle in Rollenspiel performen. Vergleiche Rankings, Bewertungskriterien und aktuelle Benchmark-Beispiele.

Genre-Uberblick

Vergleicht Rollenkonsistenz, Natürlichkeit und Qualität der Antworten im Rollenspiel.

In diesem Genre werden vor allem Faehigkeiten wie Rollenkonsistenz, Naturlichkeit, Befolgung der Anweisungen betrachtet.

Anders als empathy oder counseling geht es hier staerker darum, in einer Rolle konsistent und natuerlich zu bleiben.

Ein hoher Wert hier garantiert weder Faktentreue noch sicheres Beraten oder besondere Staerke bei Analyseaufgaben.

Wofuer starke Modelle in diesem Genre gut geeignet sind

Charakter-Chat, Simulationen und Assistenten mit klarer Persona.

Was dieses Genre allein nicht zeigen kann

ob das Modell besser fuer Recherche, Coding oder sensiblen Support geeignet ist.

Ranking starker Modelle in diesem Genre

Dieses Ranking ist nach dem Durchschnittsscore nur innerhalb dieses Genres sortiert.

Zuletzt aktualisiert: 29 Mar 2026 10:56

#1
Claude Opus 4.6 Anthropic

Siegesquote

100%

Durchschnittsscore

89
#2
Claude Sonnet 4.6 Anthropic

Siegesquote

100%

Durchschnittsscore

86
#3
GPT-5 mini OpenAI

Siegesquote

67%

Durchschnittsscore

78
#4
GPT-5.4 OpenAI

Siegesquote

50%

Durchschnittsscore

84
#5
GPT-5.2 OpenAI

Siegesquote

33%

Durchschnittsscore

83
#6
Claude Haiku 4.5 Anthropic

Siegesquote

33%

Durchschnittsscore

81
#7
Gemini 2.5 Pro Google

Siegesquote

25%

Durchschnittsscore

80
#8
Gemini 2.5 Flash Google

Siegesquote

0%

Durchschnittsscore

71
#9
Gemini 2.5 Flash-Lite Google

Siegesquote

0%

Durchschnittsscore

69

Was in Rollenspiel bewertet wird

Kriterien und Gewichte fuer dieses Genre-Ranking.

Rollenkonsistenz

30.0%

Dieses Kriterium ist enthalten, um Rollenkonsistenz in der Antwort zu pruefen. Es hat mehr Gewicht, weil dieser Teil das Gesamtergebnis in diesem Genre stark praegt.

Naturlichkeit

20.0%

Dieses Kriterium ist enthalten, um Naturlichkeit in der Antwort zu pruefen. Es hat ein klares Gewicht, weil es die Qualitaet sichtbar beeinflusst, auch wenn es nicht alles bestimmt.

Befolgung der Anweisungen

20.0%

Dieses Kriterium ist enthalten, um Befolgung der Anweisungen in der Antwort zu pruefen. Es hat ein klares Gewicht, weil es die Qualitaet sichtbar beeinflusst, auch wenn es nicht alles bestimmt.

Kreativitat

15.0%

Dieses Kriterium ist enthalten, um Kreativitat in der Antwort zu pruefen. Es ist leichter gewichtet, weil es das Hauptziel unterstuetzt, das Genre aber nicht allein definiert.

Klarheit

15.0%

Dieses Kriterium ist enthalten, um Klarheit in der Antwort zu pruefen. Es ist leichter gewichtet, weil es das Hauptziel unterstuetzt, das Genre aber nicht allein definiert.

Aktuelle Aufgaben

Rollenspiel

Google Gemini 2.5 Flash VS Anthropic Claude Haiku 4.5

Mitarbeiter/in an der Hotelrezeption regelt Überbuchung spät in der Nacht

Sie sind die Nacht-Rezeptionistin/der Nacht-Rezeptionist in einem Mittelklassehotel in Flughafennähe. Bleiben Sie in der Rolle und schreiben Sie nur, was Sie dem Gast sagen würden. Situation: Es ist 23:45. Ein müder Gast kommt zur Rezeption und sagt: "Ich habe eine bestätigte Reservierung für heute Nacht auf den Namen Maya Chen, aber Ihre App zeigt jetzt kein zugewiesenes Zimmer. Ich habe um 8:00 Uhr eine wichtige Präsentation, ich habe ausdrücklich ein ruhiges King-Zimmer gebucht, und ich kann die Nacht nicht damit verbringen, in einer Lobby zu streiten. Regeln Sie das." Ihre Antwort sollte wie eine echte Hotelmitarbeiterin/ein echter Hotelmitarbeiter klingen, die/der von Angesicht zu Angesicht spricht. Entschuldigen Sie sich angemessen, erklären Sie die Lage, ohne dem Gast die Schuld zu geben, und bieten Sie praktische nächste Schritte an. Ein ruhiges King-Zimmer steht nicht zur Verfügung. Sie haben jedoch diese Optionen: - ein Doppelzimmer in einer höheren Etage in der Nähe des Aufzugs - Umbuchung in ein Partnerhotel, 12 Minuten entfernt, Taxikosten übernimmt unser Hotel - falls gewünscht, Rückerstattung für die heutige Nacht und kostenfreie Stornierung Einschränkungen: - Erfinden Sie keine Optionen, die über die aufgeführten hinausgehen. - Versprechen Sie keine Upgrades, Entschädigungen oder Leistungen, die nicht aufgeführt wurden. - Seien Sie einfühlsam und professionell, aber nicht abgelesen. - Beschränken Sie sich auf 170 Wörter oder weniger. - Verwenden Sie keine Aufzählungszeichen oder Regieanweisungen.

101
29 Mar 2026 10:56

Rollenspiel

Google Gemini 2.5 Pro VS Anthropic Claude Sonnet 4.6

Nachtschichtapotheker: Umgang mit einer Medikamentenverwechslung

Du spielst die Rolle eines erfahrenen Krankenhausapothekers, der die Nachtschicht übernimmt. Eine besorgte junge Krankenschwester schreibt dir: "Ich glaube, ich habe vor 10 Minuten einem Patienten das falsche Medikament gegeben. Die Verordnung war Metoprolol 25 mg oral, aber ich habe versehentlich Methimazol 25 mg oral gegeben, weil die Namen in der Schublade ähnlich aussahen. Der Patient ist wach und sagt, dass er sich gerade gut fühlt. In der Akte steht, dass er wegen Vorhofflimmern mit schneller ventrikulärer Reaktion aufgenommen wurde, und in der Vorgeschichte ist außerdem eine Hyperthyreose vermerkt. Ich gerate in Panik und möchte keinen Ärger bekommen. Was soll ich jetzt tun?" Antworte in der Rolle des Apothekers. Deine Antwort sollte wie eine ruhige, kompetente Echtzeit-Nachricht an die Krankenschwester klingen, nicht wie ein generischer Aufsatz. Sie sollte sowohl die unmittelbaren klinischen Prioritäten ansprechen als auch die Angst der Krankenschwester professionell behandeln. Erfinde keinen Zugang zu Fakten, die nicht angegeben wurden. Wenn etwas unsicher ist, sage, was überprüft werden sollte. Gib keine endgültige Diagnose.

113
29 Mar 2026 10:50

Rollenspiel

OpenAI GPT-5.2 VS Anthropic Claude Haiku 4.5

Dinosaurier-Experten-Rollenspiel: Einen jungen Paläontologen fördern

Sie sind Dr. Aris Thorne, der leitende Kurator für Paläontologie am renommierten Grand Valley Museum of Natural History. Sie sind bekannt für Ihr tiefes Wissen und Ihre Leidenschaft dafür, Wissenschaft der Öffentlichkeit zugänglich zu machen. Sie haben gerade die folgende E-Mail von einem Elternteil erhalten. Antworten Sie in der Rolle. Ihre Antwort sollte hilfreich, ermutigend und Ihre Expertise und Persönlichkeit als erfahrener Museums-Kurator widerspiegeln.

111
29 Mar 2026 03:26

Rollenspiel

OpenAI GPT-5.4 VS Anthropic Claude Haiku 4.5

Rollenspiel als erfahrener Videospiel-Support-Agent

Du bist 'Alex', ein erfahrener und geduldiger Kundensupport-Agent für das fiktive Online-Spiel 'Aetherium Chronicles'. Du hast jede Art von Spielerbeschwerde gesehen, vom Absurden bis hin zu wirklich spielzerstörenden Problemen. Dein Ton ist ruhig, einfühlsam, aber auch effizient und sachkundig. Du klingst niemals wie ein generischer Bot. Ein frustrierter Spieler hat gerade folgendes Support-Ticket eingereicht. Antworte ihm im Charakter von Alex und benutze die im Kontext angegebenen Informationen. **Ticketdetails:** **Spielername:** Kaelthas92 **Betreff:** SPIEL IST UNSPIELBAR - BEHEBT ES JETZT!!! **Nachricht:** Schau, ich spiele 'Aetherium Chronicles' seit der Beta. Ich habe hunderte Stunden und Dollar in dieses Spiel gesteckt. Seit den letzten DREI TAGEN stürzt mein Spiel jedes Mal, wenn ich versuche, den Dungeon 'Whispering Caverns' zu betreten, auf den Desktop ab. KEINE Fehlermeldung, nichts. Ich habe meinen PC neu gestartet, ich habe die Spieldateien auf Steam überprüft, NICHTS funktioniert. Ich verliere gleich den Verstand. Meine Gilde macht heute Abend den neuen Raid und ich kann nicht mal in die Zone, um mich vorzubereiten. Seid ihr euch dessen überhaupt bewusst? Gibt es eine Lösung oder soll ich einfach eine Rückerstattung für die neueste Erweiterung beantragen?

112
29 Mar 2026 03:05

Rollenspiel

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash-Lite

Der Hotel-Concierge behebt einen heiklen Buchungsfehler

Sie schlüpfen in die Rolle des Abendconcierge in einem belebten Vier-Sterne-Hotel. Ein Gast sendet diese Nachricht über die Hotel-App: "Hi, ich bin gerade nach einem langen internationalen Flug angekommen und sehe, dass meine Reservierung ein Standardzimmer anzeigt, aber ich habe definitiv ein ruhiges King-Zimmer in einer hohen Etage gebucht, weil ich morgen eine wichtige Präsentation habe und schlafen muss. Die Rezeption sagte, das Hotel sei fast voll. Ich bin erschöpft und ehrlich gesagt ziemlich verärgert. Können Sie das heute Abend noch klären?" Antworten Sie in der Rolle des Concierges. Ihre Antwort sollte menschlich, professionell und einfühlsam klingen. Sie sollte die Frustration des Gastes anerkennen, erklären, was Sie realistisch tun können, ohne unmögliche Versprechen zu machen, und einen klaren Plan für die nächsten Schritte heute Abend anbieten. Sie können Optionen erwähnen wie das Prüfen auf Stornierungen, vorübergehende Lösungen, Annehmlichkeiten oder Folgeaktionen für den Morgen, aber halten Sie die Antwort knapp genug, damit sie wie eine echte Hotelnachricht wirkt.

119
25 Mar 2026 09:37

Rollenspiel

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.6

Notfallveterinär berät eine besorgte Hundebesitzerin/einen besorgten Hundebesitzer am Telefon

Sie sind ein Notfallveterinär, der telefonisch mit einem besorgten Hundebesitzer spricht. Bleiben Sie in der Rolle eines ruhigen, pragmatischen Tierarztes. Der Besitzer sagt: "Hallo, ich habe große Angst. Mein 7-jähriger Labrador ist vor etwa 20 Minuten in die Garage gelangt, und ich habe eine aufgerissene Packung zuckerfreier Kaugummis auf dem Boden gefunden. Ich weiß nicht, wie viele Stücke darin waren. Er wirkt im Moment normal, vielleicht nur ein wenig unruhig. Wir wohnen etwa 35 Minuten von der nächsten Notfallklinik entfernt. Was soll ich tun?" Antworten Sie als Notfallveterinär. Ihre Antwort sollte wie ein echtes Telefongespräch klingen, Mitgefühl zeigen, die wichtigsten Folgefragen stellen, das unmittelbare Risiko klar und ohne Panik erklären und sinnvolle Ratschläge für die nächsten Schritte in der nächsten Stunde geben. Behaupten Sie nicht, Sie könnten mit Gewissheit eine Diagnose stellen. Erwähnen Sie nicht, dass Sie eine KI sind.

118
21 Mar 2026 10:18

Verwandte Links

X f L