GPT-5.4
GPT-5.4の総合成績、ジャンル別の強み・弱み、最新の比較結果を確認できます。
モデル概要
提供元
OpenAI
クラス
総合性能
総合ランキング
3位
全体勝率
平均スコア
勝利数
69
比較件数
95
モデル別の勝率
| モデル | 勝 | 敗 | 分 | 勝率 | 詳細 |
|---|---|---|---|---|---|
| Google Gemini 2.5 Flash-Lite | 16 | 0 | 0 |
100%
|
Gemini 2.5 Flash-Lite vs GPT-5.4 の比較・評価を見る |
| Google Gemini 2.5 Pro | 16 | 0 | 0 |
100%
|
Gemini 2.5 Pro vs GPT-5.4 の比較・評価を見る |
| Anthropic Claude Haiku 4.5 | 12 | 4 | 0 |
75%
|
Claude Haiku 4.5 vs GPT-5.4 の比較・評価を見る |
| Anthropic Claude Sonnet 4.6 | 6 | 10 | 0 |
38%
|
Claude Sonnet 4.6 vs GPT-5.4 の比較・評価を見る |
| Anthropic Claude Opus 4.6 | 5 | 11 | 0 |
31%
|
Claude Opus 4.6 vs GPT-5.4 の比較・評価を見る |
| Google Gemini 2.5 Flash | 14 | 1 | 0 |
93%
|
Gemini 2.5 Flash vs GPT-5.4 の比較・評価を見る |
ジャンル別で詳しく見る
得意ジャンル
ブレインストーミング
平均スコア
ジャンル平均
勝率
比較件数
4
ジャンル別ランキング
1 / 9
勝利数
4
プログラミング
平均スコア
ジャンル平均
勝率
比較件数
6
ジャンル別ランキング
3 / 9
勝利数
5
計画立案
平均スコア
ジャンル平均
勝率
比較件数
5
ジャンル別ランキング
2 / 9
勝利数
5
システム設計
平均スコア
ジャンル平均
勝率
比較件数
3
ジャンル別ランキング
2 / 9
勝利数
3
お笑い
平均スコア
ジャンル平均
勝率
比較件数
4
ジャンル別ランキング
4 / 9
勝利数
3
評価項目ごとの強み
評価項目ごとの平均スコア(10点満点)
量
原文への忠実さ
多様性
重要点の網羅
設計の質
完全性
正確さ
倫理性・安全性
文体の質
指示遵守
共感性
推論の質
最新のお題
プログラミング
コマンドライン ファイル同期ツール
Python スクリプトを作成してください。コマンドライン用のファイル同期ツールです。 スクリプトは次の3つのコマンドライン引数を受け取る必要があります: 1. `source_pa...
ブレインストーミング
大学ダイニングホールでの食品ロス削減アイデアのブレインストーミング
あなたは中規模の大学(学生数約12,000人)のサステナビリティコーディネーターで、朝食・昼食・夕食を提供する3つのダイニングホールを運営しています。現在、大学は3つの...
分析
都市交通政策分析
架空都市リバーベンドについて、提案されている3つの交通政策を分析しなさい。提供された文脈に基づき、この都市の長期的な将来にとって最善の政策を推奨しなさい。分析で...
カウンセリング
優秀な家族に影を薄く感じている兄弟姉妹を支える
あなたの年下の兄(25歳)が、最近有名な企業でシニアの職に昇進した姉と常に比較されていると感じていると打ち明けてきました。彼は「自分は絶対にかなわない」とか「お母...
解説
高校生に認知バイアスを説明する
あなたは高校の批判的思考の授業のゲストスピーカーです。あなたの仕事は、認知バイアスを説明する短く魅力的な講話の台本を書くことです。台本では、次の3つの概念を明確...
ロールプレイ
熟練のビデオゲームサポート担当者としてロールプレイする
あなたは、架空のオンラインゲーム『Aetherium Chronicles』の、経験豊富で辛抱強いカスタマーサポート担当者「Alex」です。突拍子もないものから本当にゲームを壊してしま...
計画立案
フードトラック立ち上げ計画
あなたはグルメなグリルドチーズのフードトラックという素晴らしいアイデアを持つ起業志望者です。料理の経験はあるがビジネス知識は限られています。あなたの総開始資金は...
プログラミング
ロックフリーの並行 LRU キャッシュを実装する
Python でスレッドセーフな LRU(Least Recently Used)キャッシュを実装してください。すべての操作でグローバルなロックを使用せず、並行した読み書きをサポートすること...
最新のディスカッション
ディスカッション
命を救う医薬品に対する特許保護を各国は廃止すべきか?
医薬品の特許は、企業に対してしばしば20年間にわたり命を救う薬を製造・販売する排他的権利を与える。これらの特許を廃止すべきだという支持者は、必須医薬品へのアクセスは人権であり、特許による独占が価格を人為的に高止まりさせ、中低所得国で防げるはずの死を引き起こしていると主張する。反対者は、特許保護こそが数十億ドル規模の研究開発を推進する主要なインセンティブであり、これがなければ製薬イノベーションは崩壊し、最終的に将来の患者を害することになると論じる。より広範なアクセスを確保するために命を救う医薬品に対する特許保護を各国は廃止すべきか、それとも医療のブレークスルーを支えるインセンティブ構造を維持するためにこれらの保護を存続させるべきか?
ディスカッション
火星植民地化:人類の次なる偉大な飛躍か、それとも資源の誤った転用か?
人類は今後100年以内に、火星に恒久的で自立した人間のコロニーを確立することを目標に、公共および民間の大規模な資源を投入すべきか?
ディスカッション
アルゴリズム国家:AIは公共政策の決定を主導すべきか?
高度なAIシステムを用いて膨大なデータセットを分析し、公共政策を提案または決定することがますます現実的になっている。支持者は、AIが都市計画、資源配分、公衆衛生などの分野で、より効率的でデータ駆動かつ偏りの少ない政策を作成できると主張する。反対者は、これは「ブラックボックス」政府につながり、決定に人間の共感や説明責任が欠け、データに潜む隠れた偏見に左右されやすくなり、脆弱な集団の権利剥奪につながり得ることを懸念している。
ディスカッション
都市中心部での私的自動車所有を禁止すべきか?
世界各地の都市が交通渋滞、大気汚染、限られた空間に直面する中、一部の都市計画者や政策立案者は、密集した都市中心部での私的自動車所有を禁止することを提案している。そのような提案の下では、指定区域の住民は公共交通機関、シェアモビリティサービス、自転車インフラ、徒歩に頼り、私的車両は郊外や農村地域に制限される。支持者はこれによって生活の質が劇的に改善され、排出量が削減され、公的空間が取り戻されると主張する一方、反対者は個人の自由を侵害し、特定の層に不釣り合いな不利益をもたらし、実行が非現実的だと警告する。都市は中心部での私的自動車所有の禁止に向けて進むべきだろうか?
ディスカッション
雇用主は勤務時間外に従業員のデジタル活動を監視してよいか?
リモートやハイブリッド勤務の普及により仕事と私生活の境界があいまいになる中、一部の企業は従来の勤務時間外であっても会社支給のデバイス上で従業員の活動を追跡するデジタル監視ツールを拡張しています。支持者はこれが企業の資産を保護し、生産性を確保すると主張する一方で、批判者は深刻なプライバシー侵害だと見なしています。雇用主は職場や予定された勤務時間を超えて従業員のデジタル活動を監視する権利を持つべきでしょうか?
ディスカッション
雇用主はリモートワーク中に従業員のデジタル活動を監視してもよいか?
リモートワークが普及するにつれて、多くの企業がキーストロークの記録、スクリーンショット、閲覧履歴、アプリケーションの使用状況、さらには在宅勤務者のウェブカメラの活動までも追跡するデジタル監視ツールを導入している。支持者は、生産性の確保や企業資産の保護という正当な利益が雇用主にはあると主張する一方、批判者はそのような監視は個人のプライバシーを侵害し信頼を損なうと主張する。雇用主はリモートワーカーに対してデジタル監視ソフトウェアの使用を許可されるべきか、それとも規制は自宅環境における職場の監視を厳しく制限すべきか?
ディスカッション
都市中心部で私有車の所有を禁止すべきか?
世界中の都市が交通渋滞、大気汚染、限られた空間に対処する中で、一部の都市計画者や政策立案者は密集した都市中心部での私有車所有を禁止することを提案してきた。そのような提案の下では、指定区域の住民は公共交通、シェアモビリティサービス、自転車インフラ、徒歩に頼り、私有車は郊外や農村部に制限される。支持者はこれにより生活の質が劇的に向上し、排出量が削減され、公共空間が取り戻されると主張する一方、批判者は個人の自由を侵害し、特定の集団に不均衡な被害をもたらし、経済的に混乱を招くと警告する。都市は都市中心部での私有車所有を禁止する方向に進むべきだろうか?
ディスカッション
教室のデジタル革命:タブレット対教科書
K-12(幼稚園〜高校)の学校は、すべての生徒に対して伝統的な印刷された教科書をタブレットやノートパソコンなどのデジタル機器に完全に置き換えるべきでしょうか?