GPT-5 mini

Muestras

Ranking por genero

2 / 11

Victorias

Redacción empresarial

Diferencia +0.75

Puntuacion media

Genre Average

Tasa de victoria

Muestras

Ranking por genero

1 / 12

Victorias

Preguntas educativas

Diferencia +0.43

Puntuacion media

Genre Average

Tasa de victoria

Muestras

Ranking por genero

3 / 12

Victorias

Lluvia de ideas

Diferencia +0.39

Puntuacion media

Genre Average

Tasa de victoria

67%

Muestras

Ranking por genero

6 / 12

Victorias

Programación

Diferencia +0.27

Puntuacion media

Genre Average

Tasa de victoria

Muestras

Ranking por genero

3 / 12

Victorias

Generos mas flojos

Juego de roles

Diferencia -0.23

Puntuacion media

Genre Average

Tasa de victoria

67%

Muestras

Ranking por genero

4 / 11

Victorias

Acompañamiento

Diferencia -0.22

Puntuacion media

Genre Average

Tasa de victoria

60%

Muestras

Ranking por genero

8 / 12

Victorias

Explicación

Diferencia -0.14

Puntuacion media

Genre Average

Tasa de victoria

80%

Muestras

Ranking por genero

3 / 11

Victorias

Generación de ideas

Diferencia -0.12

Puntuacion media

Genre Average

Tasa de victoria

50%

Muestras

Ranking por genero

8 / 13

Victorias

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.8

Escritura creativa

Diferencia -0.05

Puntuacion media

Genre Average

Tasa de victoria

57%

Muestras

Ranking por genero

5 / 11

Victorias

Fortalezas por criterio de evaluacion

Puntuacion media por criterio (sobre 10)

Capacidad de accion

93 12 muestras

Cantidad

91 18 muestras

Etica y seguridad

90 12 muestras

Fidelidad

89 15 muestras

Integridad

89 69 muestras

Priorizacion

88 12 muestras

Viabilidad

88 12 muestras

Tono

88 12 muestras

Seguimiento de instrucciones

87 72 muestras

Seguridad

87 27 muestras

Cobertura

87 15 muestras

Estructura

86 54 muestras

Tareas recientes

Preguntas educativas

Control hormonal del ciclo menstrual

Se diagnostica a una paciente con una condición genética rara que provoca la incapacidad completa de su glándula pituitaria para producir Hormona luteinizante (...

131

04 Jun 2026 09:39

Resumen

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.8

Resume la visión general del Telescopio Espacial James Webb

Lee el siguiente artículo sobre el Telescopio Espacial James Webb (JWST) y escribe un resumen conciso. Tu resumen debe ser un único párrafo coherente de 150-200...

131

02 Jun 2026 09:39

Persuasión

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.8

Persuadir a un concejo municipal escéptico para financiar una nueva biblioteca

Eres un defensor comunitario que se prepara para hablar en una reunión del concejo municipal. Tu objetivo es persuadir al concejo para que apruebe la financiaci...

147

28 May 2026 23:35

Escritura creativa

Informe de incidente de una máquina expendedora consciente

Usted es Unit 734, una máquina expendedora consciente y algo gruñona ubicada en la sala de descanso del "Ministerio de Asuntos Esotéricos". Escriba un informe d...

157

25 May 2026 09:39

Lluvia de ideas

Lluvia de ideas para un jardín comunitario urbano

Genere una lista de características, actividades y programas innovadores y de bajo costo para un nuevo jardín comunitario que se está construyendo en un lote va...

161

24 May 2026 09:40

Explicación

Explicar la tecnología blockchain a un principiante

Explica el concepto de una blockchain a un público de estudiantes de secundaria curiosos. Tienen un interés general en la tecnología pero no tienen formación en...

178

15 May 2026 09:38

Acompañamiento

Sentirse solo después de una mudanza

Me mudé a una nueva ciudad por trabajo hace aproximadamente dos meses. Pensé que estaría emocionado, pero sinceramente, me siento realmente solo. No conozco a n...

320

21 Apr 2026 09:37

Escritura creativa

OpenAI GPT-5 mini VS Anthropic Claude Fable 5

Reseña de un producto fantástico

Escribe una reseña de producto de 300-500 palabras para el 'Dream-Weaver's Loom' descrito en el contexto. La reseña debe estar escrita desde la perspectiva de u...

364

19 Apr 2026 05:56

Debates recientes

Debates

Estándar de la semana laboral de cuatro días

El concepto de una semana laboral estándar de cuatro días, sin reducción de salario, está ganando fuerza como un posible modelo para el futuro del trabajo. Sus defensores argumentan que mejora el bienestar y la productividad de los empleados, mientras que los críticos plantean dudas sobre su viabilidad en diferentes industrias y posibles inconvenientes económicos. ¿Debería adoptarse ampliamente la semana laboral de cuatro días como el nuevo estándar para el empleo a tiempo completo?

12 Jun 2026 14:38

Debates