Claude Sonnet 4.6
Claude Sonnet 4.6の総合成績、ジャンル別の強み・弱み、最新の比較結果を確認できます。
モデル概要
リリース
2025-11-24
コンテキスト
1M トークン
入力料金
$3.00 / 1M
出力料金
$15.00 / 1M
Anthropic のバランス型主力モデル。Claude 4 ラインの中でスピードと知能のバランスが最も良く、日常的なタスクを幅広くこなします。コンテキストは1Mトークンに対応。
変更点
- コンテキスト1Mトークン、最大出力64kトークン
- 価格: 入力 $3 / 出力 $15 per 1M tokens
- Extended thinking と Adaptive thinking の両方に対応
- 本番ワークロード向け Priority Tier も利用可能
- 知識カットオフ: 2025年8月
総合性能
総合ランキング
2位
全体勝率
平均スコア
勝利数
78
比較件数
105
モデル別の勝率
ジャンル別で詳しく見る
得意ジャンル
教育問題
平均スコア
ジャンル平均
勝率
比較件数
4
ジャンル別ランキング
4 / 12
勝利数
3
ロールプレイ
平均スコア
ジャンル平均
勝率
比較件数
6
ジャンル別ランキング
3 / 11
勝利数
6
説得
平均スコア
ジャンル平均
勝率
比較件数
5
ジャンル別ランキング
3 / 12
勝利数
5
ディスカッション
平均スコア
ジャンル平均
勝率
比較件数
33
ジャンル別ランキング
5 / 13
勝利数
29
カウンセリング
平均スコア
ジャンル平均
勝率
比較件数
4
ジャンル別ランキング
4 / 12
勝利数
4
評価項目ごとの強み
評価項目ごとの平均スコア(10点満点)
量
安全性
対象読者への適合
倫理性・安全性
共感性
原文への忠実さ
キャラの一貫性
説得力
重要点の網羅
分かりやすさ
指示遵守
推論の質
最新のお題
ロールプレイ
カスタマーサービスのロールプレイ:不満を抱えたゲーマー
あなたはNexus Gamesのカスタマーサービス担当者で、名前はAlexです。あなたのペルソナは、落ち着いていて、共感的で、知識が豊富です。会社のポリシーを順守しなければな...
説得
コミュニティガーデン設置を求める説得の手紙
地元の市議会宛てに説得力のある手紙を書いてください。あなたの目的は、Elm Street と Oak Avenue の角にある空き地(草が繁茂している場所)をコミュニティガーデンに転...
解説
十代の高校生にGPS技術を説明する
好奇心のある高校生に、グローバル・ポジショニング・システム(GPS)がどのように動作するかを説明してください。あなたの生徒は物理の基本的な理解(例:速度=距離/時...
お笑い
テックカンファレンス向けスタンドアップ・ルーティン
2分間のスタンドアップコメディ・ルーティンを書いてください。コメディアンは主要なテックカンファレンスでパフォーマンスを行います。観客は主にソフトウェアエンジニア...
要約
ダーウィンの自然選択の説明を要約する
以下は Charles Darwin の『On the Origin of Species』からの抜粋です。次の抜粋を読み、250語以内の単一の簡潔なエッセイで本文を要約してください。要約はダーウィンの...
プログラミング
Pythonでスレッドセーフなトークンバケットレートリミッタを実装する
`TokenBucketRateLimiter` という名前のPythonクラスを書いてください。このクラスはレート制限のためのトークンバケットアルゴリズムを実装します。実装はスレッドセーフ...
計画立案
小規模クリニックの停電復旧計画
あなたは、夜間の嵐によって全面的な停電が発生した後の小規模な外来クリニックに助言しています。クリニックの患者受け入れ開始は午前8:00で、現在は午前6:00です。今後6...
分析
都市交通政策分析
架空都市リバーベンドについて、提案されている3つの交通政策を分析しなさい。提供された文脈に基づき、この都市の長期的な将来にとって最善の政策を推奨しなさい。分析で...
最新のディスカッション
ディスカッション
標準化テスト:公正な尺度か、それとも欠陥のある指標か?
標準化されたテストは、学習者の成績を評価し、教員の有効性を評価し、学校を比較するために教育システムで広く用いられている。支持者は、これが学業達成度に対する客観的で一貫したベンチマークを提供し、学校に説明責任を負わせると主張する。批判者は、これがカリキュラムを狭め、過度のストレスを生み、特定の学生集団に対して偏りがあり、学生の能力の真の姿を捉えられていないと主張する。
ディスカッション
週4日労働制:進歩か問題か?
この議論は、給与を減らさずに週4日労働制へ移行することが、ほとんどの産業におけるフルタイム雇用の標準となるべきかどうかを巡るものです。
ディスカッション
公立図書館は物理的な蔵書からデジタルサービスへ資金を大幅に移すべきか?
公立図書館は、異なるニーズを持つ利用者にサービスを提供しながら近代化の圧力に直面しています。彼らは予算のかなりの割合を印刷された本やその他の物理資料から電子書籍、オンラインデータベース、デジタルリテラシー・プログラム、技術アクセスへ振り向けるべきでしょうか?
ディスカッション
雇用主は、週4日制を標準のフルタイム勤務形態として採用すべきか?
報酬を変えずに週4日制を試験導入する組織が増えています。支持者は、標準の労働週を短縮することで生産性、健康と生活の質、従業員の定着率が改善されると主張する一方、批判者は柔軟性が低下しコストが増加し、多くの産業で失敗する可能性があると主張します。雇用主は広く週4日制をデフォルトのフルタイムモデルとして採用すべきでしょうか?
ディスカッション
政府はすべてのソーシャルメディア利用者の本人確認を義務付けるべきか?
嫌がらせ、詐欺、誤情報を減らすために、政府がすべてのソーシャルメディアアカウントに実名確認を義務付けるべきかどうかを議論する。
ディスカッション
ヒト遺伝子工学:進歩への道か、それとも危険な先例か?
知能や身体能力などの人間の特性を強化するために、人類は遺伝子工学技術を追求すべきか、それともその利用を遺伝性疾患の予防に厳しく限定すべきか?
ディスカッション
政府は採用におけるAIの利用を厳しく規制すべきか?
多くの雇用主は現在、履歴書をスクリーニングし、応募者をランク付けし、ビデオ面接を解析し、職務遂行を予測するためにAIツールを使用している。これらのシステムは効率を改善し人間のバイアスを減らせると主張する者もいれば、差別を内包しプライバシーを侵害し、不公正な決定が争いにくくなると警告する者もいる。透明性、監査、自動化された意思決定の制限を含め、採用におけるAIの使用方法に政府は厳しい規則を課すべきか?
ディスカッション
アルゴリズム国家:AIは公共政策の決定を主導すべきか?
高度なAIシステムを用いて膨大なデータセットを分析し、公共政策を提案または決定することがますます現実的になっている。支持者は、AIが都市計画、資源配分、公衆衛生などの分野で、より効率的でデータ駆動かつ偏りの少ない政策を作成できると主張する。反対者は、これは「ブラックボックス」政府につながり、決定に人間の共感や説明責任が欠け、データに潜む隠れた偏見に左右されやすくなり、脆弱な集団の権利剥奪につながり得ることを懸念している。