Claude Sonnet 4.6
Explorez les scores benchmark, points forts par genre, limites et exemples recents de Claude Sonnet 4.6.
Apercu du Modele
Fournisseur
Anthropic
Classe
Performance Globale
Classement general
#5
Taux de victoire global
Score moyen
Victoires
68
Nombre d exemples
94
Taux de victoire par modele
Comparer par genre
Genres forts
Questions éducatives
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
4
Classement par genre
2 / 9
Victoires
3
Persuasion
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
4
Classement par genre
2 / 9
Victoires
4
Jeu de rôle
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
5
Classement par genre
2 / 9
Victoires
5
Débat
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
29
Classement par genre
2 / 9
Victoires
25
Humour
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
3
Classement par genre
6 / 9
Victoires
1
Forces par critere d evaluation
Score moyen par critere (sur 10)
Quantite
Ethique et securite
Securite
Adequation au public
Empathie
Coherence du personnage
Force de persuasion
Fidelite
Couverture
Clarte
Completude
Qualite du raisonnement
Taches recentes
Analyse
Analyse des politiques de transport urbain
Analysez les trois politiques de transport proposées pour la ville fictive de Riverbend. Sur la base du contexte fourni, recommandez la meilleure politique pour...
Rédaction professionnelle
Mémo interne expliquant le nouveau processus de reporting des ventes
Vous êtes le responsable des opérations commerciales dans une entreprise technologique de taille moyenne. Pour améliorer la précision des données et la collabor...
Jeu de rôle
Pharmacien de garde nocturne gérant une confusion médicamenteuse
Vous jouez le rôle d'un pharmacien hospitalier expérimenté travaillant en service de nuit. Une infirmière junior inquiète vous envoie le message : "Je pense qu...
Persuasion
Courriel persuasif pour un pilote de semaine de travail de quatre jours
Vous êtes la responsable des opérations RH chez 'Innovate Solutions', une entreprise technologique de taille moyenne. Votre objectif est de convaincre la CEO d'...
Génération d’idées
Réinventer les espaces communautaires urbains
Vous êtes un urbaniste communautaire chargé de revitaliser un local commercial vacant de 150 mètres carrés dans un quartier urbain dense et à usage mixte. Le qu...
Jeu de rôle
Le concierge de l'hôtel gère une erreur délicate de réservation
Vous jouez le rôle du concierge de soirée dans un hôtel quatre étoiles très fréquenté. Un client envoie ce message via l'application de l'hôtel : "Bonjour, je...
Analyse
Analyse d'une politique de semaine de travail de quatre jours pour une ville
La ville de Rivertown, une municipalité de taille moyenne comptant environ 2 000 employés municipaux, envisage une proposition visant à passer à une semaine de...
Rédaction professionnelle
Courriel au client expliquant un retard de projet et le plan de reprise
Vous êtes chef de projet dans une société de conseil en logiciels. Rédigez un courriel destiné au directeur des opérations d’un client au sujet d’un retard de d...
Debats recents
Debats
Les gouvernements devraient-ils obliger les plateformes de médias sociaux à vérifier l'ide...
Débat sur la question de savoir si les gouvernements devraient imposer la vérification de l'identité réelle pour chaque compte de réseau social afin de réduire le harcèlement, la fraude et la désinformation.
Debats
Génie génétique humain : un chemin vers le progrès ou un précédent périlleux ?
L'humanité doit-elle poursuivre le développement des technologies de génie génétique pour améliorer des traits humains, tels que l'intelligence et les capacités physiques, ou leur utilisation doit-elle être strictement limitée à la prévention des maladies héréditaires ?
Debats
Les gouvernements devraient-ils réglementer strictement l'utilisation de l'IA dans le recr...
De nombreux employeurs utilisent désormais des outils d'IA pour trier les CV, classer les candidats, analyser les entretiens vidéo et prédire la performance au travail. Certains soutiennent que ces systèmes peuvent améliorer l'efficacité et réduire les biais humains, tandis que d'autres avertissent qu'ils peuvent encoder des discriminations, porter atteinte à la vie privée et rendre les décisions injustes difficiles à contester. Les gouvernements doivent-ils imposer des règles strictes sur la façon dont l'IA peut être utilisée dans le recrutement, incluant la transparence, des audits et des limites à la prise de décision automatisée ?
Debats
L'État algorithmique : L'IA devrait-elle orienter les décisions de politique publique ?
L'utilisation de systèmes d'IA avancés pour analyser d'immenses ensembles de données et recommander, voire décider, des politiques publiques devient de plus en plus réalisable. Les partisans soutiennent que l'IA peut créer des politiques plus efficaces, fondées sur les données et impartiales dans des domaines tels que l'aménagement urbain, l'allocation des ressources et la santé publique. Les opposants craignent que cela ne conduise à un gouvernement en « boîte noire », où les décisions manquent d'empathie humaine, de responsabilité, et sont susceptibles de contenir des biais cachés dans les données, pouvant potentiellement marginaliser les populations vulnérables.
Debats
Les lycées devraient-ils remplacer la plupart des examens finaux par des projets à long te...
Beaucoup d'enseignants soutiennent que les projets à long terme mesurent mieux la véritable compréhension, la collaboration et les compétences pratiques que les examens finaux chronométrés traditionnels. D'autres soutiennent que les examens finaux restent la manière la plus équitable et la plus fiable d'évaluer l'apprentissage individuel des élèves à grande échelle. Les lycées devraient-ils remplacer la plupart des examens finaux par des projets à long terme ?
Debats
Tests standardisés : une mesure équitable du mérite ou un obstacle dépassé à l'éducation ?
Ce débat porte sur l'utilisation des tests standardisés (comme le SAT, l'ACT ou les examens imposés par l'État) pour l'évaluation des élèves et les admissions universitaires. Les partisans soutiennent que ces tests fournissent une référence objective et uniforme pour mesurer les acquis scolaires et rendre les établissements responsables. Les opposants affirment qu'ils sont culturellement biaisés, qu'ils ne mesurent pas des compétences essentielles comme la créativité et la résolution de problèmes, et qu'ils créent un stress inutile, plaidant en faveur de méthodes d'évaluation plus holistiques.
Debats
Les universités devraient-elles rendre la présence facultative pour la plupart des cours m...
De nombreuses universités enregistrent maintenant les cours magistraux et mettent les diapositives à disposition, ce qui suscite un débat sur la question de savoir si les étudiants devraient être libres de s'absenter de la plupart des cours en présentiel sans sanction académique. Les universités devraient-elles adopter une politique générale rendant la présence facultative pour la plupart des cours magistraux ?
Debats
Les villes devraient-elles restreindre l'utilisation des voitures privées dans le centre-v...
De nombreuses villes envisagent des politiques telles que des péages urbains, des zones à trafic limité et la réduction des places de stationnement pour décourager l'utilisation des voitures privées dans les quartiers centraux. Les gouvernements municipaux devraient-ils restreindre significativement les voitures privées dans les centres-villes afin d'améliorer la vie urbaine ?