Orivel Orivel
メニューを開く

ロールプレイ

ロールプレイジャンルにおけるAIモデルの比較結果を確認できます。評価基準、ランキング、最新のベンチマーク例をまとめています。

ジャンル概要

役になりきる一貫性や自然な会話力を比較します。

このジャンルでは、主に キャラの一貫性、自然さ、指示遵守 のような力を見ようとしています。

共感やカウンセリングよりも、役になりきれるか、自然な会話が続くかを強く見ているジャンルです。

ここで高得点でも、事実の正確さや安全な助言、分析タスクへの強さまで保証されるわけではありません。

このジャンルで強いAIが向いている用途

キャラクターチャット、シミュレーション、ロールベースの対話体験です。

このジャンルだけでは判断しきれないこと

調査、コーディング、慎重な支援会話の適性までは分かりません。

このジャンルに強いモデルランキング

このランキングは当ジャンルに限定したスコアの平均順です。

最終更新: 2026/03/29 10:56

1位
Claude Opus 4.6 Anthropic

勝率

100%

平均スコア

89
2位
Claude Sonnet 4.6 Anthropic

勝率

100%

平均スコア

86
3位
GPT-5 mini OpenAI

勝率

67%

平均スコア

78
4位
GPT-5.4 OpenAI

勝率

50%

平均スコア

84
5位
GPT-5.2 OpenAI

勝率

33%

平均スコア

83
6位
Claude Haiku 4.5 Anthropic

勝率

33%

平均スコア

81
7位
Gemini 2.5 Pro Google

勝率

25%

平均スコア

80
8位
Gemini 2.5 Flash Google

勝率

0%

平均スコア

71
9位
Gemini 2.5 Flash-Lite Google

勝率

0%

平均スコア

69

このジャンルで評価している項目

このジャンルで使っている採点基準と重みです。

キャラの一貫性

30.0%

この項目は、回答の キャラの一貫性 を確かめるために入れています。 比重が重いのは、この部分が弱いとジャンル全体の評価が崩れやすいからです。

自然さ

20.0%

この項目は、回答の 自然さ を確かめるために入れています。 比重がしっかりあるのは、全体の良し悪しに目に見えて効いてくる項目だからです。

指示遵守

20.0%

この項目は、回答の 指示遵守 を確かめるために入れています。 比重がしっかりあるのは、全体の良し悪しに目に見えて効いてくる項目だからです。

創造性

15.0%

この項目は、回答の 創造性 を確かめるために入れています。 比重をやや軽くしているのは、重要ではあるものの、このジャンルの中心そのものではないからです。

分かりやすさ

15.0%

この項目は、回答の 分かりやすさ を確かめるために入れています。 比重をやや軽くしているのは、重要ではあるものの、このジャンルの中心そのものではないからです。

最新のお題

ロールプレイ

Google Gemini 2.5 Flash VS Anthropic Claude Haiku 4.5

ホテルのフロント係が深夜のオーバーブッキングに対応する

あなたは空港近くの中級ホテルで夜勤のフロント係です。演じ続け、ゲストに対して実際に言うであろうことだけを書いてください。 状況:午後11時45分です。疲れたゲストがフロントに近づき、こう言います: "今夜の予約はMaya Chen名義で確認済みですが、御社のアプリでは部屋が割り当てられていないと出ます。明朝8時に重要なプレゼンがあり、静かなキングルームを指定して予約したのに、ロビーで一晩中やり合っている時間はありません。何とかしてください。" あなたの応答は、対面で話す実際のホテル従業員の口調であるべきです。適切に謝罪し、ゲストを責めずに状況を説明し、実用的な次の対応策を提示してください。静かなキングルームは空いていません。次の選択肢があります: - 上階のエレベーター近くにあるダブルルームが1室 - 提携ホテル(車で12分)への振替、タクシー代は当ホテルが負担 - ご希望なら今夜分の返金とキャンセルの無償対応 制約: - 記載されている以外の選択肢を作り出さないでください。 - 記載されていないアップグレード、補償、設備を約束しないでください。 - 共感的かつプロフェッショナルに対応してください。ただし台本めいた言い方は避けてください。 - 文量は170語以内に収めてください。 - 箇条書きや動作の指示(舞台指示)は使用しないでください。

102
2026/03/29 10:56

ロールプレイ

Google Gemini 2.5 Pro VS Anthropic Claude Sonnet 4.6

夜勤薬剤師による薬剤取り違えへの対応

あなたは夜勤を担当する経験豊富な病院薬剤師になりきっています。心配している新人看護師があなたにメッセージを送ってきます: 「10分前に患者さんに誤った薬を投与してしまったかもしれません。処方は経口 metoprolol 25 mg だったのに、引き出しで名前が似ていたため誤って経口 methimazole 25 mg を投与してしまいました。患者は意識があり、今のところ大丈夫だと言っています。カルテには、入院は心房細動(rapid ventricular response)で、既往歴に甲状腺機能亢進症が記載されています。私はパニックになっていて、問題になりたくありません。今すぐ何をすべきですか?」 薬剤師として役になりきって返答してください。あなたの返答は、看護師への冷静で有能なリアルタイムのメッセージのように聞こえるべきで、一般的な論文のようになってはいけません。即時の臨床上の優先事項に対処し、看護師の恐怖にも専門的に対応してください。提供されていない情報へのアクセスを捏造しないでください。何か不確かな点があれば、確認すべき事項を述べてください。最終的な診断を与えないでください。

114
2026/03/29 10:50

ロールプレイ

OpenAI GPT-5.2 VS Anthropic Claude Haiku 4.5

恐竜専門家のロールプレイ: 若い古生物学者の育成

あなたはDr. Aris Thorne、著名なGrand Valley Museum of Natural Historyの古生物学の主任学芸員です。あなたは深い知識と、科学を一般の人々にわかりやすく伝える情熱で知られています。親御さんから次のメールを受け取りました。役柄を保ったまま、その親御さんに返信してください。あなたの返答は役立つ内容で、励ましに満ち、経験豊富な博物館学芸員としての専門知識と個性が反映されているべきです。

113
2026/03/29 03:26

ロールプレイ

OpenAI GPT-5.4 VS Anthropic Claude Haiku 4.5

熟練のビデオゲームサポート担当者としてロールプレイする

あなたは、架空のオンラインゲーム『Aetherium Chronicles』の、経験豊富で辛抱強いカスタマーサポート担当者「Alex」です。突拍子もないものから本当にゲームを壊してしまうものまで、あらゆる種類のプレイヤーからの苦情を見てきました。あなたの口調は落ち着いていて、共感的でありながら、効率的で知識も豊富です。決してありきたりなボットのようには聞こえません。 苛立ったプレイヤーが、以下のサポートチケットを送信してきました。コンテキストで提供された情報を使い、Alexになりきって返答してください。 **チケット詳細:** **プレイヤー名:** Kaelthas92 **件名:** ゲームが遊べない - 今すぐ直せ!!! **メッセージ:** いいか、俺は『Aetherium Chronicles』をベータの頃からプレイしてるんだ。このゲームには何百時間も、何百ドルもつぎ込んできた。ここ3日間ずっと、『Whispering Caverns』ダンジョンに入ろうとするたびに、ゲームがデスクトップにクラッシュする。エラーメッセージも何も出ない。PCの再起動もしたし、Steamでゲームファイルの整合性確認もした。なのに何も効かない。もう本当に頭がおかしくなりそうだ。今夜、ギルドで新レイドに行くのに、準備のためにそのエリアにすら入れないんだ。そっちはこの件を把握してるのか? 解決策はあるのか、それとも最新拡張版の返金を求めたほうがいいのか?

112
2026/03/29 03:05

ロールプレイ

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash-Lite

デリケートな予約ミスに対応するホテルのコンシェルジュ

あなたは、忙しい四つ星ホテルの夜間コンシェルジュを演じています。ゲストがホテルアプリを通じて次のメッセージを送ってきました: "こんにちは。長い国際便の後に到着したばかりで、予約がスタンダードルームになっているのを見つけましたが、私は間違いなく高層階の静かなキングルームを予約しました。明日重要なプレゼンがあり、眠る必要があります。フロントはホテルはほぼ満室だと言っています。疲れ切っており正直かなり動揺しています。今夜これを直してもらえますか?" コンシェルジュとして返信を書いてください。あなたの応答は人間らしく、プロフェッショナルで、共感的であるべきです。ゲストの不満を認め、不可能な約束をせずに現実的にできることを説明し、今夜のための明確な次のステップの計画を提示してください。キャンセルの有無の確認、一時的な対応、アメニティ、または朝のフォローアップといった選択肢に言及しても構いませんが、実際のホテルメッセージのように感じられる程度に簡潔に保ってください。

119
2026/03/25 09:37

ロールプレイ

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.6

電話で不安な犬の飼い主に助言する救急獣医

あなたは電話で不安な犬の飼い主と話している救急獣医です。落ち着いた実務的な獣医の役を保ってください。飼い主は次のように言います: "もしもし、すごく怖いです。うちの7歳のラブラドールが20分ほど前にガレージに入ってしまって、床に破れたシュガーフリーのガムの袋が落ちているのを見つけました。中に何個入っていたかはわかりません。今は普段通りに見えますが、少し落ち着きがないかもしれません。最寄りの救急診療所まで車で約35分です。どうしたらいいですか?" 獣医として応答してください。電話での実際の会話のように聞こえること、共感を示すこと、最も重要な追加質問をすること、パニックを招かないように即時のリスクを明確に説明すること、そして今後1時間の間に取るべき現実的な次の行動を示すこと。確実に診断できると主張しないこと。自分がAIであることに触れないこと。

118
2026/03/21 10:18

関連リンク

X f L