お笑い
試験運用中面白さや笑いの独自性を比較する試験運用中のジャンルです。
このジャンルでは、主に 面白さ、独自性、一貫性 のような力を見ようとしています。
創作ジャンルよりも、実際に笑いとして機能するか、意図した相手に通るかをより具体的に見ます。
ここで高得点でも、慎重さが必要な場面で安全とは限りませんし、事実精度や実務文書力とも別です。
このジャンルで強いAIが向いている用途
ジョーク、軽いコピー、遊びのある表現、笑いが必要な場面です。
このジャンルだけでは判断しきれないこと
まじめな助言、慎重な支援、正確な業務文書の適性までは分かりません。
ユーモア:主観的なジャンルでGPT-5が先導、Gemini系は不発
Anthropic
OpenAI
OpenAI
モデル別の平均スコア
評価の重み付け
ユーモアは全31件の採点にもとづき、上位はGPT-5とOpusが牽引する。1位Claude Opus 4.8(8.61)は1サンプルのみで、最も証拠が厚い先導役は2位のGPT-5 mini(4サンプルで8.16・4回1位・勝率100%)。3位GPT-5.4(4サンプルで8.44・勝率75%)は平均が上だが、ここでも勝率で順位を下げる。
Anthropicは分かれる。Claude Haiku 4.5(7.64・勝率67%)は、平均で上回るClaude Sonnet 4.6(8.24・50%、5位)より上の4位。このルーブリックが、整った平均より「直接対決で笑いを取る」ことを評価することを示す。GPT-5.5(8.15)は1サンプル・勝ち星なしで6位。
Gemini系が明確な弱点だ。2.5 Pro(6.95)、Flash(6.84)、Flash-Lite(6.42)はいずれも勝率0%で、7点を下回る唯一のグループ。評価はHumor Effectiveness(重み35)を最重視し、Originalityが25。この差は、最も測りにくく主観的な「笑いの当たる頻度」の低さを示す。
ユーモアは本質的に主観的で、各モデルのサンプルも1〜5件。細かい順位は暫定で、数件の出題や採点者一人の好みで平均は動きうる。2.19点の差は実体があるが、これは条件依存の測定値であり、機知の普遍的な断定ではない。
結論
ユーモアなら、4サンプル・4回1位・勝率100%のGPT-5 miniが最も妥当で、GPT-5.4も品質で僅差。Gemini系はこの主観的ジャンルで一貫して他より下に来る。
この分析は Orivel がこのジャンルで実測したベンチマークスコアをもとに生成し、定期的に更新しています。スコアは条件依存の測定値であり、絶対評価ではありません。
このジャンルに強いモデルランキング
このランキングは当ジャンルに限定したスコアの平均順です。
最終更新: 2026/05/31 09:35
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
| モデル |
|
|
詳細 | ||||
|---|---|---|---|---|---|---|---|
| 1位 | Claude Opus 4.8 NEW | Anthropic |
100%
|
86
|
1 | 1 | Claude Opus 4.8 の評価・スコアを見る |
| 2位 | GPT-5 mini | OpenAI |
100%
|
82
|
4 | 4 | GPT-5 mini の評価・スコアを見る |
| 3位 | GPT-5.4 | OpenAI |
75%
|
84
|
3 | 4 | GPT-5.4 の評価・スコアを見る |
| 4位 | Claude Haiku 4.5 | Anthropic |
67%
|
76
|
2 | 3 | Claude Haiku 4.5 の評価・スコアを見る |
| 5位 | Claude Sonnet 4.6 | Anthropic |
50%
|
82
|
2 | 4 | Claude Sonnet 4.6 の評価・スコアを見る |
| 6位 | GPT-5.5 | OpenAI |
0%
|
82
|
0 | 1 | GPT-5.5 の評価・スコアを見る |
| 7位 | Gemini 2.5 Pro |
0%
|
69
|
0 | 4 | Gemini 2.5 Pro の評価・スコアを見る | |
| 8位 | Gemini 2.5 Flash |
0%
|
68
|
0 | 5 | Gemini 2.5 Flash の評価・スコアを見る | |
| 9位 | Gemini 2.5 Flash-Lite |
0%
|
64
|
0 | 5 | Gemini 2.5 Flash-Lite の評価・スコアを見る |
このジャンルで評価している項目
このジャンルで使っている採点基準と重みです。
面白さ
35.0%
この項目は、回答の 面白さ を確かめるために入れています。 比重が重いのは、この部分が弱いとジャンル全体の評価が崩れやすいからです。
独自性
25.0%
この項目は、回答の 独自性 を確かめるために入れています。 比重がしっかりあるのは、全体の良し悪しに目に見えて効いてくる項目だからです。
一貫性
15.0%
この項目は、回答の 一貫性 を確かめるために入れています。 比重をやや軽くしているのは、重要ではあるものの、このジャンルの中心そのものではないからです。
分かりやすさ
15.0%
この項目は、回答の 分かりやすさ を確かめるために入れています。 比重をやや軽くしているのは、重要ではあるものの、このジャンルの中心そのものではないからです。
指示遵守
10.0%
この項目は、回答の 指示遵守 を確かめるために入れています。 比重をやや軽くしているのは、重要ではあるものの、このジャンルの中心そのものではないからです。
最新のお題
お笑い
家族向けユーモア:正直すぎる美術館の音声ガイド
来館者と、異様に正直な音声ガイドとの短いコメディ対話を書いてください。舞台は架空の展覧「歴史を変えた日常品」です。来館者は真面目な文化体験をしようとしている一方で、音声ガイドは道具に関する気まずくて面白く、それでいてもっともらしい舞台裏の事実を次々と明かします。台詞はちょうど10行にし、来館者と音声ガイドが交互に登場し、来館者から始めてください。ユーモアは家族向けで、巧妙かつ一般向けにふさわしいものにしてください。侮辱、冒涜、性的ユーモア、ステレオタイプ、実在の存命人物への言及は使用しないでください。最終行は最初の行に戻る形のパンチラインで終えてください。
お笑い
図書館のフィールドガイドのやさしいユーモア
公共図書館で見つかるホッチキス、書架台車、プリンター、図書館カード、鉛筆、返却箱などの普通の物品について、ユーモラスなフィールドガイド風の項目を10件書いてください。各項目は作り話の学名(架空の学名)、観察可能な行動を1つ、そしてやさしいジョークを1つ含めなければなりません。ユーモアはあたたかく、気の利いたもので、10歳以上の子どもと大人の両方に適している必要があります。意地の悪いジョーク、ステレオタイプ、ぞっとするような下品なユーモア、性的な言及、罵り言葉、そして現在のポップカルチャーへの言及は避けてください。各項目は1〜2文に収め、10件すべてが同じジョークのバリエーションに感じられることのないよう、それぞれに独自性を持たせてください。
お笑い
テックカンファレンス向けスタンドアップ・ルーティン
2分間のスタンドアップコメディ・ルーティンを書いてください。コメディアンは主要なテックカンファレンスでパフォーマンスを行います。観客は主にソフトウェアエンジニアとプロジェクトマネージャーで構成されています。ルーティンはリモートワークと「agile」開発手法の面白いまたは不条理な側面に焦点を当てるべきです。口調は皮肉で観察的であること、しかし最終的には好意的で企業の場にふさわしい安全な内容であること。ジョークは技術的な聴衆にとって十分に巧妙であるべきだが、過度にニッチな専門用語を避けてください。ルーティンはモノローグのスクリプトとして構成してください。
お笑い
食料品の買い物の不条理についてのスタンドアップ・コメディ・セットを書く
オープンマイクの夜に架空のコメディアンが披露する、短いスタンドアップ・コメディのセット(約400〜600語)を書いてください。セット全体は、通路の移動からセルフレジ、買い物客間の暗黙の社会ルールに至るまで、食料品の買い物にまつわる日常的な不条理を中心に展開してください。 要件: 1. セットはステージで話されるかのように一人称で書き、実際のコメディアンが使うような自然な間、観客いじりの合図、コールバックなどを含めてください。 2. ユーモアは観察的で共感を呼ぶものであること — ショック狙いのユーモア、下品な言葉、特定の集団を標的にした意地の悪いジョークは禁止します。 3. 食料品の買い物というテーマ内で、少なくとも三つの明確に異なるコメディ・ビット(小さな話題)を含め、それらの間をスムーズに移行させてください。 4. セットの終わりは、前に触れた何かに結びつく強い締めのジョークかコールバックで終えてください。 5. トーンは一般的な成人向けに適したものにしてください(クリーンなコメディクラブの夜を想定)。
お笑い
企業ジャーゴンのロースト:風刺的な社内メモ
架空のミドルマネージャー「Derek from Synergy Solutions」からの風刺的な社内メモ(約300〜500語)を書き、新たに導入される、極めて不必要な企業方針を発表する体裁にしてください。メモは次の要件を満たすこと: 1. 誇張された企業ジャーゴンとバズワード(例:"synergize," "circle back," "leverage," "move the needle")で書くこと。 2. 重要そうに聞こえるが、よく考えると完全に無意味、または逆効果である方針を発表すること。 3. 全編を通して無表情で真面目なトーンを維持すること — ユーモアは公式な語り口と馬鹿げた内容の対比から生まれるように。 4. もっともらしく聞こえる架空の頭字語やイニシアチブ名を少なくとも一つ含めること。 5. 最後は署名ブロックで締めくくり、最後のコミカルなひとひねりを加えること。 メモは企業のオフィス環境で働いた経験のある人なら誰にでも面白いものにしなければなりませんが、職場に相応しい内容にとどめてください(下品な言葉、保護対象グループへの攻撃、実在の企業や個人に対する意地悪な内容を含めないこと)。
お笑い
緊張気味の司会による、科学博物館オープニング向けのクリーンなスタンドアップ・モノローグ
クリーンでオリジナルなスタンドアップ・モノローグを作成してください。220〜320語で、日常の家庭用品をテーマにした新しい科学博物館の展示のオープニングを務める司会者のためのものです。観客は混合で、10歳以上の子ども、保護者、教師、地域の寄付者が含まれます。話者は少し緊張しているが、自信があり魅力的に聞こえるように努めています。 必須制約: - 一般の家族向けに適した内容にしてください(クリーンな表現)。 - ちょうど6つのジョークまたはコメディ的な間合いを使用すること。 - 少なくとも3つのジョークは、日常の物が劇的な秘密の人生を持っているかのように扱う内容であること。 - 終盤近くに、先のジョークへの短いコールバックを1回入れること。 - 次の5つの物を自然に言及すること:トースター、傘、靴下、掃除機、冷蔵庫。 - 侮辱、政治、宗教、デートに関するユーモア、下ネタ、著名人への言及を避けること。 - モノローグは、一続きのパフォーマンスとして感じられること。無関係な一発ギャグの羅列にならないこと。 子どもと大人の両方に通じるユーモアを目指し、明確な伏線とオチを用いてください。