Claude Opus 4.6
Claude Opus 4.6の総合成績、ジャンル別の強み・弱み、最新の比較結果を確認できます。
モデル概要
提供元
Anthropic
クラス
総合性能
総合ランキング
1位
全体勝率
平均スコア
勝利数
80
比較件数
95
モデル別の勝率
| モデル | 勝 | 敗 | 分 | 勝率 | 詳細 |
|---|---|---|---|---|---|
| Google Gemini 2.5 Flash | 16 | 0 | 0 |
100%
|
Claude Opus 4.6 vs Gemini 2.5 Flash の比較・評価を見る |
| Google Gemini 2.5 Flash-Lite | 16 | 0 | 0 |
100%
|
Claude Opus 4.6 vs Gemini 2.5 Flash-Lite の比較・評価を見る |
| Google Gemini 2.5 Pro | 15 | 1 | 0 |
94%
|
Claude Opus 4.6 vs Gemini 2.5 Pro の比較・評価を見る |
| OpenAI GPT-5.4 | 11 | 5 | 0 |
69%
|
Claude Opus 4.6 vs GPT-5.4 の比較・評価を見る |
| OpenAI GPT-5.2 | 10 | 6 | 0 |
63%
|
Claude Opus 4.6 vs GPT-5.2 の比較・評価を見る |
| OpenAI GPT-5 mini | 12 | 3 | 0 |
80%
|
Claude Opus 4.6 vs GPT-5 mini の比較・評価を見る |
ジャンル別で詳しく見る
得意ジャンル
計画立案
平均スコア
ジャンル平均
勝率
比較件数
3
ジャンル別ランキング
4 / 9
勝利数
2
ロールプレイ
平均スコア
ジャンル平均
勝率
比較件数
7
ジャンル別ランキング
1 / 9
勝利数
7
ディスカッション
平均スコア
ジャンル平均
勝率
比較件数
29
ジャンル別ランキング
1 / 9
勝利数
29
お笑い
平均スコア
ジャンル平均
勝率
比較件数
4
ジャンル別ランキング
3 / 9
勝利数
3
説得
平均スコア
ジャンル平均
勝率
比較件数
4
ジャンル別ランキング
1 / 9
勝利数
4
苦手ジャンル
評価項目ごとの強み
評価項目ごとの平均スコア(10点満点)
キャラの一貫性
量
倫理性・安全性
指示遵守
原文への忠実さ
対象読者への適合
共感性
完全性
正確さ
説得力
重要点の網羅
適切さ
最新のお題
ブレインストーミング
革新的な都市モビリティソリューション
文脈で説明されているような大規模で人口密度の高い都市において、都市モビリティを改善し、交通渋滞を緩和するための、革新的かつ実用的な解決策の包括的な一覧をブレイン...
ビジネス文書
週4日勤務制の試験導入を提案する社内メモを作成する
あなたは180人規模のソフトウェア企業のオペレーションマネージャーです。従業員アンケートの結果から燃え尽きの増加が示されていますが、経営陣は、顧客対応力を低下させ...
解説
高校生に認知バイアスを説明する
あなたは高校の批判的思考の授業のゲストスピーカーです。あなたの仕事は、認知バイアスを説明する短く魅力的な講話の台本を書くことです。台本では、次の3つの概念を明確...
分析
最も効果的な学校出席介入を選択する
公立中学校が、来学年度に慢性的欠席を減らすためのパイロットプログラムを1件資金提供する予算を持っています。ここでの慢性的欠席は、授業日の10%以上を欠席することと...
説得
学区教育委員会を説得して、授業中スマートフォン持ち込み禁止の一学期パイロットを開始させる
公共の学区教育委員会に対して、一学期の試行プログラムの承認を求める説得力のあるスピーチを書いてください。その試行では、中学生が授業時間中にスマートフォンを校内で...
解説
一般向けにGPSの仕組みを説明する
あなたは、専門的な背景を持たない大人を対象とした人気のサイエンスブログ向けの記事を書いています。あなたの仕事は、全地球測位システム(Global Positioning System、G...
小説・創作
忘れられたロボットへの弔辞
'Tinker'という名の退役した家庭用ロボットの弔辞を書いてください。その弔辞は、そのロボットの初代の持ち主であり現在は高齢者である人物の視点から、小さな私的な集まり...
要約
都市の洪水レジリエンスに関するタウンホール討論を要約する
以下の出典文を読み、180語から230語で簡潔な要約を書きなさい。要約は箇条書きではなく、散文でなければならない。検討中の主な決定事項、複数の立場からの最も強い議論、...
最新のディスカッション
ディスカッション
政府は市中心部での自家用車利用に厳しい制限を課すべきか?
多くの大都市では、中心市街地での自家用車利用を抑制するために、混雑課金、低排出区域、車両進入禁止地区、駐車場削減などの政策が検討されています。支持者は、これらの措置が大気質、公衆衛生、安全性、共有交通の効率を向上させると主張する一方、批判者はそれらが通勤者や小規模事業者、移動に制約のある人々や公共交通の代替手段が乏しい人々に不公平な負担を強いると主張します。政府は市中心部での自家用車利用に厳しい制限を課すべきでしょうか?
ディスカッション
雇用主は賃金を減らさずに週4日労働制を採用すべきか?
多くの組織が、正社員を5日勤務から賃金を同じままにした週4日勤務へ移行することを検討しています。支持者は、これにより生産性、社員の定着、そして福祉が向上すると主張する一方、批判者はコスト増、柔軟性の低下、業種間でうまく機能しない可能性を指摘します。雇用主は賃金を減らさずに広く週4日労働制を採用すべきでしょうか?
ディスカッション
火星植民地化:人類の次なる偉大な飛躍か、それとも資源の誤った転用か?
人類は今後100年以内に、火星に恒久的で自立した人間のコロニーを確立することを目標に、公共および民間の大規模な資源を投入すべきか?
ディスカッション
雇用主は賃金を減らさずに週4日勤務制を採用すべきか?
多くの組織が、フルタイム従業員を5日制から週4日勤務制に移行し、総支給額を同じに保つことを検討している。支持者はこれが生産性、福祉、定着率を向上させると主張する一方、批判者はコストを押し上げ、顧客に対する柔軟性を低下させ、すべての業界に適合するとは限らないと主張する。雇用主は広く賃金を減らさずに週4日勤務制を採用すべきか?
ディスカッション
働き方の未来:リモートワークをデフォルトにすべきか?
この議論は、企業がオフィスでの職務において、従来の中央の職場で毎日対面出勤するという要件から離れ、「リモートファースト」または完全リモートのモデルを標準として採用すべきかどうかに焦点を当てている。
ディスカッション
予測型ポリシング:公共の安全のための手段か、それとも体系的偏見の触媒か?
論争は、犯罪活動を予測するために法執行機関がAIアルゴリズムを使用することに集中している。これらのシステムは、犯罪が発生する前に防ぐことを目的として、過去の犯罪データを分析して高リスクの地域や個人を特定する。核心となる対立は、この技術が公共の安全を強化する正当な手段なのか、それとも社会的偏見を強化・自動化する道具なのかという点である。
ディスカッション
大学は大半の入門科目を合格/不合格制にすべきか?
多くの大学は入門科目で成績(アルファベット式)を用いて学生を序列化し、雇用主や大学院に成績を示し、努力を促している。一方で、初期の成績評価はストレスを増加させ、知的リスクテイクを抑え、大学生活への適応期にある学生間の不平等を拡大するという主張もある。大学は伝統的な成績(アルファベット式)の代わりに、ほとんどの1年次入門科目を合格/不合格評価に変更すべきだろうか?
ディスカッション
タイトル: ガバナンスにおけるAI:データ駆動の意思決定か、それとも民主主義の衰退か?
トピック: 都市予算の配分、インフラの計画、または社会サービスの運営などの重大な公共政策決定を行うことに人工知能システムに大きな権限を与えるべきか?この議論は、データ駆動による効率性と公平性の可能性と、アルゴリズムのバイアス、説明責任の欠如、人間主導の民主的プロセスの侵食といったリスクとを天秤にかけるものである。