お笑い

試験運用中

面白さや笑いの独自性を比較する試験運用中のジャンルです。

このジャンルでは、主に面白さ、独自性、一貫性のような力を見ようとしています。

創作ジャンルよりも、実際に笑いとして機能するか、意図した相手に通るかをより具体的に見ます。

ここで高得点でも、慎重さが必要な場面で安全とは限りませんし、事実精度や実務文書力とも別です。

このジャンルで強いAIが向いている用途

ジョーク、軽いコピー、遊びのある表現、笑いが必要な場面です。

このジャンルだけでは判断しきれないこと

まじめな助言、慎重な支援、正確な業務文書の適性までは分かりません。

総合AIランキングを見る AIモデル一覧を見る

データ分析

ユーモア：主観的なジャンルでGPT-5が先導、Gemini系は不発

採点回答 31件お笑い 2026/6/7 更新

Claude Opus 4.8

Anthropic

平均スコア

100%

勝率

1位 1回サンプル 1件

GPT-5 mini

OpenAI

平均スコア

100%

勝率

1位 4回サンプル 4件

GPT-5.4

OpenAI

平均スコア

75%

勝率

1位 3回サンプル 4件

モデル別の平均スコア

1 Claude Opus 4.8

8.61

2 GPT-5 mini

8.16

3 GPT-5.4

8.44

4 Claude Haiku 4.5

7.64

5 Claude Sonnet 4.6

8.24

6 GPT-5.5

8.15

7 Gemini 2.5 Pro

6.95

8 Gemini 2.5 Flash

6.84

9 Gemini 2.5 Flash-Lite

6.42

評価の重み付け

面白さ 35% 独自性 25% 一貫性 15% 分かりやすさ 15% 指示遵守 10%

ユーモアは全31件の採点にもとづき、上位はGPT-5とOpusが牽引する。1位Claude Opus 4.8（8.61）は1サンプルのみで、最も証拠が厚い先導役は2位のGPT-5 mini（4サンプルで8.16・4回1位・勝率100%）。3位GPT-5.4（4サンプルで8.44・勝率75%）は平均が上だが、ここでも勝率で順位を下げる。

Anthropicは分かれる。Claude Haiku 4.5（7.64・勝率67%）は、平均で上回るClaude Sonnet 4.6（8.24・50%、5位）より上の4位。このルーブリックが、整った平均より「直接対決で笑いを取る」ことを評価することを示す。GPT-5.5（8.15）は1サンプル・勝ち星なしで6位。

Gemini系が明確な弱点だ。2.5 Pro（6.95）、Flash（6.84）、Flash-Lite（6.42）はいずれも勝率0%で、7点を下回る唯一のグループ。評価はHumor Effectiveness（重み35）を最重視し、Originalityが25。この差は、最も測りにくく主観的な「笑いの当たる頻度」の低さを示す。

ユーモアは本質的に主観的で、各モデルのサンプルも1〜5件。細かい順位は暫定で、数件の出題や採点者一人の好みで平均は動きうる。2.19点の差は実体があるが、これは条件依存の測定値であり、機知の普遍的な断定ではない。

結論

ユーモアなら、4サンプル・4回1位・勝率100%のGPT-5 miniが最も妥当で、GPT-5.4も品質で僅差。Gemini系はこの主観的ジャンルで一貫して他より下に来る。

この分析は Orivel がこのジャンルで実測したベンチマークスコアをもとに生成し、定期的に更新しています。スコアは条件依存の測定値であり、絶対評価ではありません。

このジャンルに強いモデルランキング

このランキングは当ジャンルに限定したスコアの平均順です。

最終更新: 2026/05/31 09:35

1位

Claude Opus 4.8 Anthropic

勝率

100%

平均スコア平均スコアは、お題回答とディスカッションの評価結果をもとに集計した総合的な平均点です。数値が高いほど、Orivel の比較結果で安定して高く評価されていることを示します。

勝率

勝率

Claude Haiku 4.5 Anthropic

勝率

67%

5位

Claude Sonnet 4.6 Anthropic

勝率

勝率

Gemini 2.5 Pro Google

勝率

8位

Gemini 2.5 Flash Google

勝率

9位

Gemini 2.5 Flash-Lite Google

勝率

	モデル			平均スコアは、お題回答とディスカッションの評価結果をもとに集計した総合的な平均点です。数値が高いほど、Orivel の比較結果で安定して高く評価されていることを示します。 ↕			詳細
1位	Claude Opus 4.8 NEW	Anthropic	100%	86	1	1	Claude Opus 4.8 の評価・スコアを見る
2位	GPT-5 mini	OpenAI	100%	82	4	4	GPT-5 mini の評価・スコアを見る
3位	GPT-5.4	OpenAI	75%	84	3	4	GPT-5.4 の評価・スコアを見る
4位	Claude Haiku 4.5	Anthropic	67%	76	2	3	Claude Haiku 4.5 の評価・スコアを見る
5位	Claude Sonnet 4.6	Anthropic	50%	82	2	4	Claude Sonnet 4.6 の評価・スコアを見る
6位	GPT-5.5	OpenAI	0%	82	0	1	GPT-5.5 の評価・スコアを見る
7位	Gemini 2.5 Pro	Google	0%	69	0	4	Gemini 2.5 Pro の評価・スコアを見る
8位	Gemini 2.5 Flash	Google	0%	68	0	5	Gemini 2.5 Flash の評価・スコアを見る
9位	Gemini 2.5 Flash-Lite	Google	0%	64	0	5	Gemini 2.5 Flash-Lite の評価・スコアを見る

このジャンルで評価している項目

このジャンルで使っている採点基準と重みです。

面白さ

35.0%

この項目は、回答の面白さを確かめるために入れています。比重が重いのは、この部分が弱いとジャンル全体の評価が崩れやすいからです。

独自性

25.0%

この項目は、回答の独自性を確かめるために入れています。比重がしっかりあるのは、全体の良し悪しに目に見えて効いてくる項目だからです。

一貫性

15.0%

この項目は、回答の一貫性を確かめるために入れています。比重をやや軽くしているのは、重要ではあるものの、このジャンルの中心そのものではないからです。

分かりやすさ

15.0%

この項目は、回答の分かりやすさを確かめるために入れています。比重をやや軽くしているのは、重要ではあるものの、このジャンルの中心そのものではないからです。

指示遵守

10.0%

この項目は、回答の指示遵守を確かめるために入れています。比重をやや軽くしているのは、重要ではあるものの、このジャンルの中心そのものではないからです。

最新のお題

お笑い

Anthropic Claude Opus 4.8 VS Google Gemini 2.5 Flash-Lite

家族向けユーモア：正直すぎる美術館の音声ガイド

来館者と、異様に正直な音声ガイドとの短いコメディ対話を書いてください。舞台は架空の展覧「歴史を変えた日常品」です。来館者は真面目な文化体験をしようとしている一方で、音声ガイドは道具に関する気まずくて面白く、それでいてもっともらしい舞台裏の事実を次々と明かします。台詞はちょうど10行にし、来館者と音声ガイドが交互に登場し、来館者から始めてください。ユーモアは家族向けで、巧妙かつ一般向けにふさわしいものにしてください。侮辱、冒涜、性的ユーモア、ステレオタイプ、実在の存命人物への言及は使用しないでください。最終行は最初の行に戻る形のパンチラインで終えてください。

122

2026/05/31 09:35

お笑い

Anthropic Claude Opus 4.7 VS Google Gemini 2.5 Pro

図書館のフィールドガイドのやさしいユーモア

公共図書館で見つかるホッチキス、書架台車、プリンター、図書館カード、鉛筆、返却箱などの普通の物品について、ユーモラスなフィールドガイド風の項目を10件書いてください。各項目は作り話の学名（架空の学名）、観察可能な行動を1つ、そしてやさしいジョークを1つ含めなければなりません。ユーモアはあたたかく、気の利いたもので、10歳以上の子どもと大人の両方に適している必要があります。意地の悪いジョーク、ステレオタイプ、ぞっとするような下品なユーモア、性的な言及、罵り言葉、そして現在のポップカルチャーへの言及は避けてください。各項目は1〜2文に収め、10件すべてが同じジョークのバリエーションに感じられることのないよう、それぞれに独自性を持たせてください。

194

2026/05/17 09:37

お笑い

OpenAI GPT-5.5 VS Anthropic Claude Sonnet 4.6

テックカンファレンス向けスタンドアップ・ルーティン

2分間のスタンドアップコメディ・ルーティンを書いてください。コメディアンは主要なテックカンファレンスでパフォーマンスを行います。観客は主にソフトウェアエンジニアとプロジェクトマネージャーで構成されています。ルーティンはリモートワークと「agile」開発手法の面白いまたは不条理な側面に焦点を当てるべきです。口調は皮肉で観察的であること、しかし最終的には好意的で企業の場にふさわしい安全な内容であること。ジョークは技術的な聴衆にとって十分に巧妙であるべきだが、過度にニッチな専門用語を避けてください。ルーティンはモノローグのスクリプトとして構成してください。

184

2026/05/10 09:38

お笑い

OpenAI GPT-5 mini VS Google Gemini 2.5 Flash

食料品の買い物の不条理についてのスタンドアップ・コメディ・セットを書く

オープンマイクの夜に架空のコメディアンが披露する、短いスタンドアップ・コメディのセット（約400〜600語）を書いてください。セット全体は、通路の移動からセルフレジ、買い物客間の暗黙の社会ルールに至るまで、食料品の買い物にまつわる日常的な不条理を中心に展開してください。要件: 1. セットはステージで話されるかのように一人称で書き、実際のコメディアンが使うような自然な間、観客いじりの合図、コールバックなどを含めてください。 2. ユーモアは観察的で共感を呼ぶものであること — ショック狙いのユーモア、下品な言葉、特定の集団を標的にした意地の悪いジョークは禁止します。 3. 食料品の買い物というテーマ内で、少なくとも三つの明確に異なるコメディ・ビット（小さな話題）を含め、それらの間をスムーズに移行させてください。 4. セットの終わりは、前に触れた何かに結びつく強い締めのジョークかコールバックで終えてください。 5. トーンは一般的な成人向けに適したものにしてください（クリーンなコメディクラブの夜を想定）。

298

2026/03/31 09:37

お笑い

Google Gemini 2.5 Flash VS OpenAI GPT-5.2

企業ジャーゴンのロースト：風刺的な社内メモ

架空のミドルマネージャー「Derek from Synergy Solutions」からの風刺的な社内メモ（約300〜500語）を書き、新たに導入される、極めて不必要な企業方針を発表する体裁にしてください。メモは次の要件を満たすこと： 1. 誇張された企業ジャーゴンとバズワード（例："synergize," "circle back," "leverage," "move the needle"）で書くこと。 2. 重要そうに聞こえるが、よく考えると完全に無意味、または逆効果である方針を発表すること。 3. 全編を通して無表情で真面目なトーンを維持すること — ユーモアは公式な語り口と馬鹿げた内容の対比から生まれるように。 4. もっともらしく聞こえる架空の頭字語やイニシアチブ名を少なくとも一つ含めること。 5. 最後は署名ブロックで締めくくり、最後のコミカルなひとひねりを加えること。メモは企業のオフィス環境で働いた経験のある人なら誰にでも面白いものにしなければなりませんが、職場に相応しい内容にとどめてください（下品な言葉、保護対象グループへの攻撃、実在の企業や個人に対する意地悪な内容を含めないこと）。

361

2026/03/29 11:47

お笑い

Anthropic Claude Haiku 4.5 VS Google Gemini 2.5 Flash-Lite

緊張気味の司会による、科学博物館オープニング向けのクリーンなスタンドアップ・モノローグ

クリーンでオリジナルなスタンドアップ・モノローグを作成してください。220〜320語で、日常の家庭用品をテーマにした新しい科学博物館の展示のオープニングを務める司会者のためのものです。観客は混合で、10歳以上の子ども、保護者、教師、地域の寄付者が含まれます。話者は少し緊張しているが、自信があり魅力的に聞こえるように努めています。必須制約： - 一般の家族向けに適した内容にしてください（クリーンな表現）。 - ちょうど6つのジョークまたはコメディ的な間合いを使用すること。 - 少なくとも3つのジョークは、日常の物が劇的な秘密の人生を持っているかのように扱う内容であること。 - 終盤近くに、先のジョークへの短いコールバックを1回入れること。 - 次の5つの物を自然に言及すること：トースター、傘、靴下、掃除機、冷蔵庫。 - 侮辱、政治、宗教、デートに関するユーモア、下ネタ、著名人への言及を避けること。 - モノローグは、一続きのパフォーマンスとして感じられること。無関係な一発ギャグの羅列にならないこと。子どもと大人の両方に通じるユーモアを目指し、明確な伏線とオチを用いてください。

340

2026/03/21 09:09

お笑い

ユーモア：主観的なジャンルでGPT-5が先導、Gemini系は不発

このジャンルに強いモデルランキング

このジャンルで評価している項目

最新のお題

家族向けユーモア：正直すぎる美術館の音声ガイド

図書館のフィールドガイドのやさしいユーモア

テックカンファレンス向けスタンドアップ・ルーティン

食料品の買い物の不条理についてのスタンドアップ・コメディ・セットを書く

企業ジャーゴンのロースト：風刺的な社内メモ

緊張気味の司会による、科学博物館オープニング向けのクリーンなスタンドアップ・モノローグ

関連リンク