GPT-5 mini
Explorez les scores de benchmark, points forts par genre, limites et exemples récents de GPT-5 mini.
Apercu du Modele
Publie
2025-08-07
Contexte
400k tokens
Entree
$0.25 / 1M
Sortie
$2.00 / 1M
La variante compacte de la famille GPT-5 — conçue pour les charges sensibles à la latence et à fort volume, tout en conservant le style de raisonnement de GPT-5.
Changements
- Publié en même temps que GPT-5 en août 2025
- Optimisé pour une faible latence et un faible coût par token
- Tarif : $0.25 entrée / $2.00 sortie par 1M tokens
- Adapté aux pipelines à fort débit, au raisonnement léger et à la traduction
- Orivel l'utilise pour les traductions de titres
Performance Globale
Classement general
#3
Taux de victoire global
Score moyen
Victoires
73
Nombre d exemples
108
Taux de victoire par modele
Comparer par genre
Genres forts
Planification
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
4
Classement par genre
2 / 11
Victoires
4
Rédaction professionnelle
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
4
Classement par genre
1 / 12
Victoires
4
Questions éducatives
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
5
Classement par genre
3 / 12
Victoires
5
Brainstorming
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
6
Classement par genre
6 / 12
Victoires
4
Programmation
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
5
Classement par genre
3 / 12
Victoires
5
Genres plus faibles
Jeu de rôle
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
3
Classement par genre
4 / 11
Victoires
2
Accompagnement
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
5
Classement par genre
8 / 12
Victoires
3
Explication
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
5
Classement par genre
3 / 11
Victoires
4
Génération d’idées
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
4
Classement par genre
8 / 13
Victoires
2
Écriture créative
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
7
Classement par genre
5 / 11
Victoires
4
Forces par critere d evaluation
Score moyen par critere (sur 10)
Applicabilite
Quantite
Ethique et securite
Fidelite
Completude
Priorisation
Faisabilite
Ton
Respect des consignes
Securite
Couverture
Structure
Taches recentes
Questions éducatives
Contrôle hormonal du cycle menstruel
Une patiente est diagnostiquée avec une affection génétique rare entraînant l'incapacité complète de son hypophyse à produire l'hormone lutéinisante (LH), tandi...
Résumé
Résumer la présentation générale du Télescope spatial James Webb
Lisez l'article suivant sur le Télescope spatial James Webb (JWST) et rédigez un résumé concis. Votre résumé doit être un seul paragraphe cohérent de 150 à 200...
Persuasion
Persuader un conseil municipal sceptique d'approuver le financement d'une nouvelle bibliothèque
Vous êtes un défenseur communautaire qui se prépare à prendre la parole lors d'une réunion du conseil municipal. Votre objectif est de persuader le conseil d'ap...
Écriture créative
Rapport d'incident d'un distributeur automatique conscient
Vous êtes Unit 734, un distributeur automatique conscient, légèrement grincheux, situé dans la salle de repos du "Ministry of Esoteric Affairs." Rédigez un rapp...
Brainstorming
Remue-méninges pour un jardin communautaire en milieu urbain
Élaborez une liste d'aménagements, d'activités et de programmes innovants et peu coûteux pour un nouveau jardin communautaire en cours d'aménagement sur un terr...
Explication
Expliquer la technologie Blockchain à un novice
Expliquez le concept d'une blockchain à un public de lycéens curieux. Ils s'intéressent généralement à la technologie mais n'ont pas de formation en informatiqu...
Accompagnement
Se sentir seul après un déménagement
J'ai déménagé dans une nouvelle ville pour un travail il y a environ deux mois. Je pensais que j'allais être enthousiaste, mais honnêtement, je me sens vraiment...
Écriture créative
Critique d'un produit fantastique
Rédigez une critique de produit de 300 à 500 mots pour le 'Dream-Weaver's Loom' décrit dans le contexte. La critique doit être écrite du point de vue d'un clien...
Debats recents
Debats
La norme de la semaine de travail de quatre jours
Le concept d'une semaine de travail de quatre jours, sans réduction de salaire, gagne du terrain en tant que modèle potentiel pour l'avenir du travail. Ses partisans soutiennent qu'il améliore le bien‑être et la productivité des employés, tandis que ses détracteurs soulèvent des inquiétudes quant à sa faisabilité selon les différents secteurs et à ses éventuels inconvénients économiques. La semaine de travail de quatre jours devrait‑elle être largement adoptée comme nouvelle norme pour l'emploi à temps plein ?
Debats
La norme de la semaine de travail de quatre jours
Cette discussion explore la proposition de faire de la semaine de travail de quatre jours la norme pour l'emploi à temps plein, sans réduction de salaire. Les partisans soutiennent qu'elle augmente la productivité, améliore le bien‑être des employés et profite à l'économie. Les opposants soulèvent des inquiétudes quant à sa faisabilité dans tous les secteurs, au risque d'une augmentation du stress pour caser le travail en moins de jours, et aux impacts négatifs sur le service client et le fonctionnement des entreprises.
Debats
Les pays devraient-ils imposer un impôt sur la fortune aux personnes disposant d'un patrim...
Alors que les inégalités économiques continuent de se creuser dans de nombreux pays, certains responsables politiques et économistes préconisent un impôt annuel sur la fortune ciblant les personnes dont le patrimoine net total dépasse un seuil élevé, comme cinquante millions de dollars. Contrairement aux impôts sur le revenu, un impôt sur la fortune s'appliquerait aux actifs accumulés, y compris les actions, l'immobilier et autres avoirs. Les partisans soutiennent qu'il pourrait financer les services publics et réduire les concentrations dangereuses du pouvoir économique, tandis que les détracteurs avertissent qu'il pourrait provoquer des sorties de capitaux, s'avérer administrativement impraticable et, finalement, nuire à la croissance économique. Les pays devraient-ils adopter un impôt annuel sur les fortunes personnelles extrêmes ?
Debats
Les gouvernements doivent-ils interdire l'utilisation de la technologie de reconnaissance...
La technologie de reconnaissance faciale est de plus en plus déployée par les forces de l'ordre et les autorités municipales dans des espaces publics tels que les rues, les stations de transport et les stades. Les partisans soutiennent qu'elle améliore la sécurité publique en aidant à identifier en temps réel les criminels et les personnes disparues. Les détracteurs avertissent qu'elle permet une surveillance de masse, identifie de manière disproportionnée à tort les personnes de couleur, et porte atteinte de manière fondamentale au droit à l'anonymat dans la vie publique. Les gouvernements devraient-ils interdire l'utilisation des systèmes de reconnaissance faciale dans les espaces publics, ou devraient-ils autoriser et réglementer leur déploiement ?
Debats
Les résultats de la recherche scientifique devraient-ils être obligatoirement en accès lib...
La recherche scientifique financée par des fonds publics et privés est actuellement publiée en grande partie derrière des paywalls (barrières payantes) maintenues par les revues académiques. Certains soutiennent que tous les résultats de recherche devraient être rendus accessibles gratuitement et immédiatement à tous dès leur publication, tandis que d'autres affirment que le modèle actuel d'abonnement et de paywall est nécessaire pour soutenir l'examen par les pairs de qualité, l'infrastructure éditoriale et la viabilité financière de l'édition scientifique. Ce débat touche à la propriété intellectuelle, au rythme de l'innovation, à l'équité d'accès aux connaissances à l'échelle mondiale et à l'économie de l'information.
Debats
Surveillance numérique : la surveillance de la productivité des employés est-elle un outil...
De nombreuses entreprises adoptent des logiciels qui suivent l'activité des employés, tels que les frappes au clavier, les mouvements de la souris, les sites Web visités et le temps passé sur des applications spécifiques. Le débat porte sur la question de savoir si cette pratique est un moyen légitime d'assurer la productivité et de gérer des équipes à distance, ou si elle constitue une atteinte à la vie privée qui érode la confiance et le moral.
Debats
Les villes devraient-elles interdire la possession de voitures particulières dans les cent...
Alors que les villes du monde entier sont confrontées à la congestion routière, à la pollution de l'air et à l'espace limité, certains urbanistes et responsables politiques ont proposé d'interdire la possession de voitures particulières dans les centres urbains denses. Dans le cadre de telles propositions, les résidents des zones désignées s'appuieraient entièrement sur des réseaux de transports publics étendus, des programmes de vélos en libre-service, des services de VTC et des coopératives d'autopartage. Les partisans soutiennent que cela réduirait considérablement les émissions, libérerait des terrains actuellement utilisés pour le stationnement et améliorerait la qualité de vie. Les opposants craignent des impacts sur la liberté personnelle, l'accessibilité pour les personnes âgées et les personnes en situation de handicap, des perturbations économiques et la capacité réelle des alternatives publiques à répondre aux besoins de mobilité divers d'une ville moderne. Les gouvernements doivent-ils poursuivre de telles interdictions, ou la possession d'une voiture privée reste-t-elle un droit fondamental que les villes doivent accommoder ?
Debats
Police prédictive : un outil pour la sécurité publique ou un catalyseur de biais systémiqu...
Le débat porte sur l'utilisation d'algorithmes d'IA par les forces de l'ordre pour prévoir l'activité criminelle. Ces systèmes analysent des données historiques sur la criminalité afin d'identifier des zones ou des individus à haut risque, dans le but de prévenir la criminalité avant qu'elle ne se produise. Le conflit central est de savoir si cette technologie est un outil légitime pour améliorer la sécurité publique ou un instrument qui renforce et automatise les biais de la société.