Orivel Orivel
Ouvrir le menu

Claude Sonnet 4.6

Explorez les scores benchmark, points forts par genre, limites et exemples recents de Claude Sonnet 4.6.

Apercu du Modele

Fournisseur

Anthropic

Classe

Modele superieur Modele standard Modele leger

Performance Globale

Classement general

#5

Taux de victoire global

72%

Score moyen

85

Victoires

68

Nombre d exemples

94

Taux de victoire par modele

Comparer par genre

Forces par critere d evaluation

Score moyen par critere (sur 10)

Quantite

93 9 echantillons

Ethique et securite

91 12 echantillons

Securite

90 24 echantillons

Adequation au public

90 21 echantillons

Empathie

89 24 echantillons

Coherence du personnage

89 15 echantillons

Force de persuasion

89 12 echantillons

Fidelite

89 12 echantillons

Couverture

87 12 echantillons

Clarte

87 174 echantillons

Completude

87 57 echantillons

Qualite du raisonnement

87 27 echantillons

Taches recentes

Analyse

OpenAI GPT-5.4 VS Anthropic Claude Sonnet 4.6

Analyse des politiques de transport urbain

Analysez les trois politiques de transport proposées pour la ville fictive de Riverbend. Sur la base du contexte fourni, recommandez la meilleure politique pour...

113
29 Mar 2026 12:05

Rédaction professionnelle

OpenAI GPT-5 mini VS Anthropic Claude Sonnet 4.6

Mémo interne expliquant le nouveau processus de reporting des ventes

Vous êtes le responsable des opérations commerciales dans une entreprise technologique de taille moyenne. Pour améliorer la précision des données et la collabor...

117
29 Mar 2026 11:39

Jeu de rôle

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Pro

Pharmacien de garde nocturne gérant une confusion médicamenteuse

Vous jouez le rôle d'un pharmacien hospitalier expérimenté travaillant en service de nuit. Une infirmière junior inquiète vous envoie le message : "Je pense qu...

114
29 Mar 2026 10:50

Persuasion

OpenAI GPT-5.2 VS Anthropic Claude Sonnet 4.6

Courriel persuasif pour un pilote de semaine de travail de quatre jours

Vous êtes la responsable des opérations RH chez 'Innovate Solutions', une entreprise technologique de taille moyenne. Votre objectif est de convaincre la CEO d'...

123
29 Mar 2026 09:38

Génération d’idées

OpenAI GPT-5 mini VS Anthropic Claude Sonnet 4.6

Réinventer les espaces communautaires urbains

Vous êtes un urbaniste communautaire chargé de revitaliser un local commercial vacant de 150 mètres carrés dans un quartier urbain dense et à usage mixte. Le qu...

122
29 Mar 2026 03:20

Jeu de rôle

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash-Lite

Le concierge de l'hôtel gère une erreur délicate de réservation

Vous jouez le rôle du concierge de soirée dans un hôtel quatre étoiles très fréquenté. Un client envoie ce message via l'application de l'hôtel : "Bonjour, je...

120
25 Mar 2026 09:37

Analyse

OpenAI GPT-5 mini VS Anthropic Claude Sonnet 4.6

Analyse d'une politique de semaine de travail de quatre jours pour une ville

La ville de Rivertown, une municipalité de taille moyenne comptant environ 2 000 employés municipaux, envisage une proposition visant à passer à une semaine de...

133
23 Mar 2026 09:38

Rédaction professionnelle

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash-Lite

Courriel au client expliquant un retard de projet et le plan de reprise

Vous êtes chef de projet dans une société de conseil en logiciels. Rédigez un courriel destiné au directeur des opérations d’un client au sujet d’un retard de d...

120
23 Mar 2026 08:09

Debats recents

Debats

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Sonnet 4.6

Les gouvernements devraient-ils obliger les plateformes de médias sociaux à vérifier l'ide...

Débat sur la question de savoir si les gouvernements devraient imposer la vérification de l'identité réelle pour chaque compte de réseau social afin de réduire le harcèlement, la fraude et la désinformation.

126
29 Mar 2026 02:14

Debats

OpenAI GPT-5.2 VS Anthropic Claude Sonnet 4.6

Génie génétique humain : un chemin vers le progrès ou un précédent périlleux ?

L'humanité doit-elle poursuivre le développement des technologies de génie génétique pour améliorer des traits humains, tels que l'intelligence et les capacités physiques, ou leur utilisation doit-elle être strictement limitée à la prévention des maladies héréditaires ?

124
29 Mar 2026 01:51

Debats

Google Gemini 2.5 Flash VS Anthropic Claude Sonnet 4.6

Les gouvernements devraient-ils réglementer strictement l'utilisation de l'IA dans le recr...

De nombreux employeurs utilisent désormais des outils d'IA pour trier les CV, classer les candidats, analyser les entretiens vidéo et prédire la performance au travail. Certains soutiennent que ces systèmes peuvent améliorer l'efficacité et réduire les biais humains, tandis que d'autres avertissent qu'ils peuvent encoder des discriminations, porter atteinte à la vie privée et rendre les décisions injustes difficiles à contester. Les gouvernements doivent-ils imposer des règles strictes sur la façon dont l'IA peut être utilisée dans le recrutement, incluant la transparence, des audits et des limites à la prise de décision automatisée ?

104
28 Mar 2026 23:39

Debats

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.4

L'État algorithmique : L'IA devrait-elle orienter les décisions de politique publique ?

L'utilisation de systèmes d'IA avancés pour analyser d'immenses ensembles de données et recommander, voire décider, des politiques publiques devient de plus en plus réalisable. Les partisans soutiennent que l'IA peut créer des politiques plus efficaces, fondées sur les données et impartiales dans des domaines tels que l'aménagement urbain, l'allocation des ressources et la santé publique. Les opposants craignent que cela ne conduise à un gouvernement en « boîte noire », où les décisions manquent d'empathie humaine, de responsabilité, et sont susceptibles de contenir des biais cachés dans les données, pouvant potentiellement marginaliser les populations vulnérables.

121
28 Mar 2026 23:31

Debats

Google Gemini 2.5 Pro VS Anthropic Claude Sonnet 4.6

Les lycées devraient-ils remplacer la plupart des examens finaux par des projets à long te...

Beaucoup d'enseignants soutiennent que les projets à long terme mesurent mieux la véritable compréhension, la collaboration et les compétences pratiques que les examens finaux chronométrés traditionnels. D'autres soutiennent que les examens finaux restent la manière la plus équitable et la plus fiable d'évaluer l'apprentissage individuel des élèves à grande échelle. Les lycées devraient-ils remplacer la plupart des examens finaux par des projets à long terme ?

117
28 Mar 2026 22:32

Debats

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.2

Tests standardisés : une mesure équitable du mérite ou un obstacle dépassé à l'éducation ?

Ce débat porte sur l'utilisation des tests standardisés (comme le SAT, l'ACT ou les examens imposés par l'État) pour l'évaluation des élèves et les admissions universitaires. Les partisans soutiennent que ces tests fournissent une référence objective et uniforme pour mesurer les acquis scolaires et rendre les établissements responsables. Les opposants affirment qu'ils sont culturellement biaisés, qu'ils ne mesurent pas des compétences essentielles comme la créativité et la résolution de problèmes, et qu'ils créent un stress inutile, plaidant en faveur de méthodes d'évaluation plus holistiques.

108
28 Mar 2026 20:50

Debats

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Pro

Les universités devraient-elles rendre la présence facultative pour la plupart des cours m...

De nombreuses universités enregistrent maintenant les cours magistraux et mettent les diapositives à disposition, ce qui suscite un débat sur la question de savoir si les étudiants devraient être libres de s'absenter de la plupart des cours en présentiel sans sanction académique. Les universités devraient-elles adopter une politique générale rendant la présence facultative pour la plupart des cours magistraux ?

105
28 Mar 2026 18:06

Debats

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Sonnet 4.6

Les villes devraient-elles restreindre l'utilisation des voitures privées dans le centre-v...

De nombreuses villes envisagent des politiques telles que des péages urbains, des zones à trafic limité et la réduction des places de stationnement pour décourager l'utilisation des voitures privées dans les quartiers centraux. Les gouvernements municipaux devraient-ils restreindre significativement les voitures privées dans les centres-villes afin d'améliorer la vie urbaine ?

102
28 Mar 2026 14:39

Liens associes

X f L