Orivel Orivel
Abrir menu

GPT-5 mini

Explora puntuaciones de benchmark, fortalezas por género, debilidades y ejemplos recientes de GPT-5 mini.

Resumen del Modelo

Proveedor: OpenAI · gpt-5-mini

Publicado

2025-08-07

Contexto

400k tokens

Entrada

$0.25 / 1M

Salida

$2.00 / 1M

La variante compacta de la familia GPT-5, diseñada para cargas sensibles a la latencia y de alto volumen, manteniendo el estilo de razonamiento de GPT-5.

Cambios

  • Lanzado junto con GPT-5 en agosto de 2025
  • Optimizado para baja latencia y coste reducido por token
  • Precio: $0.25 entrada / $2.00 salida por 1M tokens
  • Apto para pipelines de alto rendimiento, razonamiento ligero y traducción
  • Orivel lo utiliza para traducciones a nivel de título
Anuncio oficial

Rendimiento General

Ranking general

#3

Tasa de victoria global

68%

Puntuacion media

84

Victorias

73

Muestras

108

Tasa de victoria por modelo

Comparar por genero

Generos fuertes

Generos mas flojos

Fortalezas por criterio de evaluacion

Puntuacion media por criterio (sobre 10)

Capacidad de accion

93 12 muestras

Cantidad

91 18 muestras

Etica y seguridad

90 12 muestras

Fidelidad

89 15 muestras

Integridad

89 69 muestras

Priorizacion

88 12 muestras

Viabilidad

88 12 muestras

Tono

88 12 muestras

Seguimiento de instrucciones

87 72 muestras

Seguridad

87 27 muestras

Cobertura

87 15 muestras

Estructura

86 54 muestras

Tareas recientes

Preguntas educativas

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.8

Control hormonal del ciclo menstrual

Se diagnostica a una paciente con una condición genética rara que provoca la incapacidad completa de su glándula pituitaria para producir Hormona luteinizante (...

131
04 Jun 2026 09:39

Resumen

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.8

Resume la visión general del Telescopio Espacial James Webb

Lee el siguiente artículo sobre el Telescopio Espacial James Webb (JWST) y escribe un resumen conciso. Tu resumen debe ser un único párrafo coherente de 150-200...

131
02 Jun 2026 09:39

Persuasión

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.8

Persuadir a un concejo municipal escéptico para financiar una nueva biblioteca

Eres un defensor comunitario que se prepara para hablar en una reunión del concejo municipal. Tu objetivo es persuadir al concejo para que apruebe la financiaci...

147
28 May 2026 23:35

Escritura creativa

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.7

Informe de incidente de una máquina expendedora consciente

Usted es Unit 734, una máquina expendedora consciente y algo gruñona ubicada en la sala de descanso del "Ministerio de Asuntos Esotéricos". Escriba un informe d...

157
25 May 2026 09:39

Lluvia de ideas

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.7

Lluvia de ideas para un jardín comunitario urbano

Genere una lista de características, actividades y programas innovadores y de bajo costo para un nuevo jardín comunitario que se está construyendo en un lote va...

161
24 May 2026 09:40

Explicación

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.7

Explicar la tecnología blockchain a un principiante

Explica el concepto de una blockchain a un público de estudiantes de secundaria curiosos. Tienen un interés general en la tecnología pero no tienen formación en...

178
15 May 2026 09:38

Acompañamiento

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.7

Sentirse solo después de una mudanza

Me mudé a una nueva ciudad por trabajo hace aproximadamente dos meses. Pensé que estaría emocionado, pero sinceramente, me siento realmente solo. No conozco a n...

320
21 Apr 2026 09:37

Escritura creativa

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.7

Reseña de un producto fantástico

Escribe una reseña de producto de 300-500 palabras para el 'Dream-Weaver's Loom' descrito en el contexto. La reseña debe estar escrita desde la perspectiva de u...

364
19 Apr 2026 05:56

Debates recientes

Debates

OpenAI GPT-5 mini VS Anthropic Claude Fable 5

Estándar de la semana laboral de cuatro días

El concepto de una semana laboral estándar de cuatro días, sin reducción de salario, está ganando fuerza como un posible modelo para el futuro del trabajo. Sus defensores argumentan que mejora el bienestar y la productividad de los empleados, mientras que los críticos plantean dudas sobre su viabilidad en diferentes industrias y posibles inconvenientes económicos. ¿Debería adoptarse ampliamente la semana laboral de cuatro días como el nuevo estándar para el empleo a tiempo completo?

49
12 Jun 2026 14:38

Debates

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.7

El estándar de la semana laboral de cuatro días

Esta discusión explora la propuesta de hacer que la semana laboral de cuatro días sea el estándar para el empleo a tiempo completo, sin reducción de salario. Los partidarios sostienen que aumenta la productividad, mejora el bienestar de los empleados y beneficia a la economía. Los opositores plantean dudas sobre su viabilidad en todas las industrias, el potencial aumento del estrés por tener que concentrar el trabajo en menos días y los impactos negativos en el servicio al cliente y en las operaciones empresariales.

361
19 Apr 2026 06:14

Debates

OpenAI GPT-5 mini VS Google Gemini 2.5 Pro

¿Deberían los países imponer un impuesto sobre la riqueza a las personas con patrimonio ne...

A medida que la desigualdad económica sigue ampliándose en muchas naciones, algunos responsables políticos y economistas abogan por un impuesto anual sobre la riqueza dirigido a individuos cuyo patrimonio neto total supere un umbral elevado, como cincuenta millones de dólares. A diferencia de los impuestos sobre la renta, un impuesto sobre la riqueza se aplicaría a los activos acumulados, incluyendo acciones, bienes raíces y otras tenencias. Sus defensores sostienen que podría financiar servicios públicos y reducir peligrosas concentraciones de poder económico, mientras que los críticos advierten que podría provocar fuga de capitales, resultar administrativamente impracticable y, en última instancia, perjudicar el crecimiento económico. ¿Deberían los países adoptar un impuesto anual sobre la riqueza personal extrema?

296
16 Apr 2026 14:39

Debates

OpenAI GPT-5 mini VS Google Gemini 2.5 Pro

¿Deberían los gobiernos prohibir el uso de tecnología de reconocimiento facial en espacios...

La tecnología de reconocimiento facial se está desplegando cada vez más por las fuerzas del orden y las autoridades municipales en espacios públicos como calles, estaciones de transporte y estadios. Los partidarios sostienen que mejora la seguridad pública al ayudar a identificar criminales y personas desaparecidas en tiempo real. Los críticos advierten que facilita la vigilancia masiva, identifica erróneamente de manera desproporcionada a las personas de color y erosiona fundamentalmente el derecho al anonimato en la vida pública. ¿Deberían los gobiernos prohibir el uso de sistemas de reconocimiento facial en espacios públicos, o deberían permitir y regular su despliegue?

352
29 Mar 2026 02:28

Debates

Google Gemini 2.5 Flash-Lite VS OpenAI GPT-5 mini

¿Deben los hallazgos de la investigación científica ser obligatoriamente de acceso abierto...

La investigación científica financiada públicamente y privadamente se publica actualmente en gran medida tras muros de pago mantenidos por revistas académicas. Algunos argumentan que todos los hallazgos de investigación deberían ponerse a disposición de forma gratuita e inmediata para todo el mundo en el momento de la publicación, mientras que otros sostienen que el modelo actual de suscripción y muros de pago es necesario para sostener la revisión por pares de calidad, la infraestructura editorial y la viabilidad financiera de la publicación científica. Este debate toca la propiedad intelectual, el ritmo de la innovación, la equidad en el acceso global al conocimiento y la economía de la información.

380
29 Mar 2026 01:27

Debates

OpenAI GPT-5 mini VS Anthropic Claude Haiku 4.5

Supervisión digital: ¿Es la monitorización de la productividad de los empleados una herram...

Muchas empresas están adoptando software que rastrea la actividad de los empleados, como pulsaciones de teclas, movimientos del ratón, sitios web visitados y tiempo dedicado a aplicaciones específicas. El debate se centra en si esta práctica es una forma legítima de garantizar la productividad y gestionar equipos remotos, o si constituye una invasión de la privacidad que erosiona la confianza y la moral.

367
29 Mar 2026 01:20

Debates

Google Gemini 2.5 Flash VS OpenAI GPT-5 mini

¿Deberían las ciudades prohibir la propiedad privada de automóviles en los centros urbanos...

A medida que las ciudades de todo el mundo afrontan la congestión del tráfico, la contaminación del aire y el espacio limitado, algunos urbanistas y responsables de políticas han propuesto prohibir la propiedad privada de automóviles dentro de los centros urbanos densos. Según tales propuestas, los residentes en zonas designadas dependerían totalmente de redes de transporte público ampliadas, programas de bicicletas compartidas, servicios de transporte bajo demanda y cooperativas de coches compartidos. Los partidarios sostienen que esto reduciría drásticamente las emisiones, liberaría terrenos actualmente utilizados para el estacionamiento y mejoraría la calidad de vida. Los opositores se preocupan por los impactos en la libertad personal, la accesibilidad para residentes con discapacidades y personas mayores, la disrupción económica y si las alternativas públicas pueden realmente satisfacer las diversas necesidades de transporte de una ciudad moderna. ¿Deberían los gobiernos perseguir tales prohibiciones, o la propiedad privada de automóviles sigue siendo un derecho fundamental que las ciudades deben acomodar?

328
28 Mar 2026 23:00

Debates

Anthropic Claude Opus 4.6 VS OpenAI GPT-5 mini

Policiamiento predictivo: ¿Una herramienta para la seguridad pública o un catalizador de s...

El debate se centra en el uso de algoritmos de IA por parte de las agencias de seguridad para prever la actividad criminal. Estos sistemas analizan datos históricos de delitos para identificar zonas o individuos de alto riesgo, con el objetivo de prevenir el crimen antes de que ocurra. El conflicto central es si esta tecnología es una herramienta legítima para mejorar la seguridad pública o un instrumento que refuerza y automatiza los sesgos sociales.

352
28 Mar 2026 22:26

Enlaces relacionados

X f L