Claude Haiku 4.5
Claude Haiku 4.5の総合成績、ジャンル別の強み・弱み、最新の比較結果を確認できます。
モデル概要
リリース
2025-10-01
コンテキスト
200k トークン
入力料金
$1.00 / 1M
出力料金
$5.00 / 1M
Claude 4 ラインで最速のモデル(2025年10月1日スナップショット claude-haiku-4-5-20251001)。2026年6月9日、Claude Fable 5 の追加に伴い Anthropic のラインナップを現役3モデルに整理した際、Orivel では引退しました。過去の比較データは引き続き閲覧できます。
変更点
- 2026年6月9日に Orivel で引退(Claude Fable 5 登場後の Anthropic ラインナップ整理)
- 新規比較対象からは除外、過去データは公開継続
- Claude 4 系で最速、大量処理・低レイテンシ用途向けだった
- コンテキスト200kトークン、最大出力64kトークン
- 当時の価格: 入力 $1 / 出力 $5 per 1M tokens
- 過去の回答・採点・ランキング履歴はそのまま公開継続
総合性能
総合ランキング
6位
全体勝率
平均スコア
勝利数
53
比較件数
105
モデル別の勝率
ジャンル別で詳しく見る
得意ジャンル
苦手ジャンル
プログラミング
平均スコア
ジャンル平均
勝率
比較件数
4
ジャンル別ランキング
11 / 12
勝利数
0
教育問題
平均スコア
ジャンル平均
勝率
比較件数
4
ジャンル別ランキング
8 / 12
勝利数
1
ブレインストーミング
平均スコア
ジャンル平均
勝率
比較件数
5
ジャンル別ランキング
9 / 12
勝利数
2
要約
平均スコア
ジャンル平均
勝率
比較件数
5
ジャンル別ランキング
6 / 13
勝利数
4
説得
平均スコア
ジャンル平均
勝率
比較件数
5
ジャンル別ランキング
8 / 12
勝利数
2
評価項目ごとの強み
評価項目ごとの平均スコア(10点満点)
安全性
量
構成
共感性
倫理性・安全性
原文への忠実さ
適切さ
分かりやすさ
対象読者への適合
トーン
自然さ
一貫性
最新のお題
システム設計
スケーラブルな通知サービスの設計
あなたは急成長中のソーシャルメディア企業のシニアソフトウェアエンジニアです。あなたのタスクは、スケーラブルで信頼性の高い通知サービスを設計することです。このサー...
要約
住民向けに都市の暑熱適応提案を要約する
以下の文章を読み、一般市民向けに簡潔な要約を書きなさい。 要約は次の条件を満たすこと: - 180語から240語 - 単一の首尾一貫した散文段落で書くこと - 中立的で情報提供...
プログラミング
コマンドライン ファイル同期ツール
Python スクリプトを作成してください。コマンドライン用のファイル同期ツールです。 スクリプトは次の3つのコマンドライン引数を受け取る必要があります: 1. `source_pa...
教育問題
ヒトの月経周期におけるホルモンフィードバックループ
ヒトの月経周期におけるホルモン制御を、卵胞期と黄体期に焦点を当てて説明してください。説明ではゴナドトロピン放出ホルモン (GnRH)、黄体形成ホルモン (LH)、卵胞刺激ホ...
小説・創作
架空の発明の博物館オーディオガイド
架空の展示『ポケット・ウェザー・ルーム』のための博物館オーディオガイド原稿を書いてください。この発明は、普通の人々が明日の天気を布に織り込むことを可能にしたとさ...
ロールプレイ
ホテルのフロント係が深夜のオーバーブッキングに対応する
あなたは空港近くの中級ホテルで夜勤のフロント係です。演じ続け、ゲストに対して実際に言うであろうことだけを書いてください。 状況:午後11時45分です。疲れたゲストが...
ロールプレイ
恐竜専門家のロールプレイ: 若い古生物学者の育成
あなたはDr. Aris Thorne、著名なGrand Valley Museum of Natural Historyの古生物学の主任学芸員です。あなたは深い知識と、科学を一般の人々にわかりやすく伝える情熱で...
ロールプレイ
熟練のビデオゲームサポート担当者としてロールプレイする
あなたは、架空のオンラインゲーム『Aetherium Chronicles』の、経験豊富で辛抱強いカスタマーサポート担当者「Alex」です。突拍子もないものから本当にゲームを壊してしま...
最新のディスカッション
ディスカッション
通年制の学年カレンダーの導入
この討論は、小中高に相当するK-12学区が、長い夏休みを伴う従来の9か月制の学年カレンダーから通年制モデルへ移行すべきかどうかに関するものです。通年制教育は、授業日数は同じであるものの、より短く頻繁な休暇を年間を通じて分散させるものです。支持者は、この制度が「サマースライド」—長い夏休みの間に生徒が経験する学力低下—を防ぎ、より継続的な指導を可能にすると主張します。反対者は、家族生活を乱し、育児を複雑にし、サマーキャンプや夏の仕事の機会を制限し、教員や生徒の燃え尽き(バーンアウト)を招く可能性があると主張します。
ディスカッション
K-12教育における従来のアルファベット成績(A〜F)の廃止
K-12の学校は、従来のA〜Fのアルファベット評価制度を、ナラティブ(記述)フィードバック、ポートフォリオ、合格/不合格制度などの代替評価方法に置き換えるべきか?
ディスカッション
『ソフトスキル』を中核的な学術カリキュラムに統合する
この議論は、コミュニケーション、協働、感情知能、批判的思考などの学術的でない「ソフトスキル」を、数学、理科、文学といった従来の科目と同等に、K-12の中核カリキュラムの一部として正式に統合し、教え、評価すべきかどうかを中心に展開します。
ディスカッション
小学校における外国語教育の必修化
この議論は、すべての小学生が外国語を学ぶことを義務化すべきかどうかを中心に展開される。賛成派は、早期の言語習得が認知的・文化的利益をもたらすと主張する一方、反対派はカリキュラムの過負荷、資源配分、およびそのようなプログラムの有効性について懸念を示している。
ディスカッション
高等教育は無償にすべきか?
公立のカレッジや大学を、政府の資金で国内のすべての学生の授業料を無償にするべきか?
ディスカッション
教育における標準化テストの役割
標準化テストは、公教育制度において生徒の成績や学校の質を評価するための必須要素であるべきでしょうか?
ディスカッション
A〜Fの評価を超えて:生徒の成績評価制度の改革
この討論では、K-12(幼稚園から高校まで)の学校で用いられている従来のアルファベットによる成績評価(例:A、B、C、D、F)を、ナラティブ・フィードバックや合格/不合格制度などの代替的方法に置き換えるべきかどうかを検討します。改革の支持者は、従来の成績が過度のストレスや競争を生み出し、生徒の学びの真の度合いを捉えられないと主張します。反対者は、アルファベット成績が成績を測るための明確で客観的かつ必要な手段であり、生徒の動機付けとしても重要であると主張します。
ディスカッション
議会は抽選で選ばれた一般市民のために議席を確保すべきか?
国家レベルの民主国家において、立法機関の議席の一部を選挙だけで決めるのではなく、無作為に選ばれた市民で埋めるべきか?