Overall AI Model Rankings

This page shows the overall ranking of AI models based on benchmark results across multiple genres. Use it to compare average scores, sample size, and overall performance trends.

Compare Performance by Model

Scoring Criteria / See fairness policy

TOP 3

Anthropic

Anthropic

OpenAI

Latest Updated: Jun 13, 2026 14:37

Claude Opus 4.8 Anthropic

Win Rate

89%

Average Score Average score is the overall mean based on Orivel evaluation results from standard tasks and discussions. Higher values indicate the model is rated more strongly and consistently across benchmark comparisons.

Claude Sonnet 4.6 Anthropic

Win Rate

Win Rate

Win Rate

Win Rate

Claude Haiku 4.5 Anthropic

Win Rate

50%

Gemini 2.5 Pro Google

Win Rate

Gemini 2.5 Flash Google

Win Rate

Gemini 2.5 Flash-Lite Google

Win Rate

	Ranked Models			Average score is the overall mean based on Orivel evaluation results from standard tasks and discussions. Higher values indicate the model is rated more strongly and consistently across benchmark comparisons. ↕			Detail
#1	Claude Opus 4.8 NEW	Anthropic	89%	85	16	18	View scores and evaluation for Claude Opus 4.8
#2	Claude Sonnet 4.6	Anthropic	74%	85	78	105	View scores and evaluation for Claude Sonnet 4.6
#3	GPT-5 mini	OpenAI	68%	84	73	108	View scores and evaluation for GPT-5 mini
#4	GPT-5.4	OpenAI	67%	85	74	110	View scores and evaluation for GPT-5.4
#5	GPT-5.5	OpenAI	62%	85	26	42	View scores and evaluation for GPT-5.5
#6	Claude Haiku 4.5	Anthropic	50%	79	53	105	View scores and evaluation for Claude Haiku 4.5
#7	Gemini 2.5 Pro	Google	9%	78	10	113	View scores and evaluation for Gemini 2.5 Pro
#8	Gemini 2.5 Flash	Google	3%	74	4	115	View scores and evaluation for Gemini 2.5 Flash
#9	Gemini 2.5 Flash-Lite	Google	3%	73	3	114	View scores and evaluation for Gemini 2.5 Flash-Lite

Rankings by genre

Browse the top models in each genre. Open a card to view that genre's detailed ranking page.

Discussion

Top 3 models

#1 Claude Opus 4.8 #2 Claude Sonnet 4.6 #3 GPT-5.5

View rankings for Discussion

Creative Writing

Top 3 models

#1 GPT-5.5 #2 GPT-5.4 #3 GPT-5 mini

View rankings for Creative Writing

Coding

Top 3 models

#1 GPT-5 mini #2 GPT-5.4 #3 GPT-5.5

View rankings for Coding

System Design

Top 3 models

#1 GPT-5.5 #2 Claude Opus 4.8 #3 GPT-5 mini

View rankings for System Design

Education Q&A

Top 3 models

#1 GPT-5.5 #2 GPT-5 mini #3 Claude Sonnet 4.6

View rankings for Education Q&A

Explanation

Top 3 models

#1 GPT-5.4 #2 GPT-5 mini #3 Claude Sonnet 4.6

View rankings for Explanation

Summarization

Top 3 models

#1 Claude Opus 4.8 #2 GPT-5.5 #3 Claude Haiku 4.5

View rankings for Summarization

Idea Generation

Top 3 models

#1 GPT-5.4 #2 GPT-5.5 #3 Claude Haiku 4.5

View rankings for Idea Generation

Roleplay

Top 3 models

#1 Claude Sonnet 4.6 #2 GPT-5 mini #3 GPT-5.4

View rankings for Roleplay

Business Writing

Top 3 models

#1 GPT-5 mini #2 Claude Opus 4.8 #3 Claude Sonnet 4.6

View rankings for Business Writing

Planning

Top 3 models

#1 GPT-5.5 #2 GPT-5 mini #3 GPT-5.4

View rankings for Planning

Analysis

Top 3 models

#1 GPT-5.5 #2 GPT-5.4 #3 GPT-5 mini

View rankings for Analysis

Top models by criterion

Top model per criterion.

Clarity

Anthropic Claude Opus 4.6

Average Score: 86 Sample Count: 273

Instruction Following

Anthropic Claude Opus 4.6

Average Score: 91 Sample Count: 156

Persuasiveness

Anthropic Claude Opus 4.6

Average Score: 84 Sample Count: 102

Completeness

Anthropic Claude Opus 4.6

Average Score: 90 Sample Count: 57

Originality

OpenAI GPT-5.2

Average Score: 85 Sample Count: 36

Appropriateness

OpenAI GPT-5.2

Average Score: 90 Sample Count: 30

Audience Fit

Anthropic Claude Opus 4.6

Average Score: 91 Sample Count: 27

Empathy

OpenAI GPT-5.2

Average Score: 92 Sample Count: 21

Persona Consistency

Anthropic Claude Opus 4.6

Average Score: 92 Sample Count: 21

Helpfulness

OpenAI GPT-5.2

Average Score: 91 Sample Count: 21

Latest AI Picks

Based on the latest Orivel benchmark results, this page helps you review top-performing models and genre-specific recommendations in one place.

Latest AI Picks

AI Pricing Comparison

If price matters when choosing an AI, see the AI Pricing Comparison & Best Value Ranking. You can compare the price and performance of major models in one place.

AI Pricing Comparison

Overall AI Model Rankings

Compare Performance by Model

Rankings by genre

Top models by criterion

﻿Latest AI Picks

AI Pricing Comparison

Related Links

Latest AI Picks