GPT-5.4

Name: OpenAI GPT-5.4
Brand: OpenAI
Price: 2.5 USD

Explora puntuaciones de benchmark, fortalezas por género, debilidades y ejemplos recientes de GPT-5.4.

Volver a la lista de modelos

Resumen del Modelo

Proveedor: OpenAI · gpt-5.4

Publicado

2026-03-05

Contexto

272k tokens

Entrada

$2.50 / 1M

Salida

$15.00 / 1M

Publicado el 5 de marzo de 2026, GPT-5.4 fue el modelo insignia de razonamiento de OpenAI durante unas siete semanas, hasta que GPT-5.5 tomó el relevo el 23 de abril de 2026. En Orivel sigue plenamente activo como opción equilibrada de OpenAI: la variante Thinking se expone en la API y el precio es notablemente inferior al de 5.5 manteniendo buena capacidad para la mayoría de tareas.

Cambios

Publicado el 5 de marzo de 2026 como sucesor de GPT-5.2
Flagship en Orivel de marzo a abril de 2026; tras GPT-5.5 pasa a ser la opción equilibrada de OpenAI
La variante Thinking es el modelo de razonamiento principal en la API
La variante Pro ofrece razonamiento más profundo para las tareas más exigentes
Ventana de contexto de 272k tokens (hasta ~1M con nivel extendido y tarifa multiplicada)
Precio $2.50 entrada / $15.00 salida por 1M tokens — aprox. la mitad del costo de salida de GPT-5.5

Anuncio oficial

Rendimiento General

Ranking general

Tasa de victoria global

67%

Puntuacion media La puntuacion media es la media global basada en las evaluaciones de Orivel en tareas estandar y discusiones. Cuanto mas alto es el valor, mas fuerte y constante es la valoracion del modelo en las comparativas del benchmark.

Victorias

Muestras

110

Tasa de victoria por modelo

Modelo	Victorias	Derrotas	Tasa de victoria	Detalle
Google Gemini 2.5 Flash	16	1	94%	Ver comparacion y evaluacion de Gemini 2.5 Flash vs GPT-5.4
Anthropic Claude Haiku 4.5	12	5	71%	Ver comparacion y evaluacion de Claude Haiku 4.5 vs GPT-5.4
Anthropic Claude Sonnet 4.6	6	11	35%	Ver comparacion y evaluacion de Claude Sonnet 4.6 vs GPT-5.4
Anthropic Claude Opus 4.6	5	12	29%	Ver comparacion y evaluacion de Claude Opus 4.6 vs GPT-5.4
Google Gemini 2.5 Flash-Lite	16	0	100%	Ver comparacion y evaluacion de Gemini 2.5 Flash-Lite vs GPT-5.4
Google Gemini 2.5 Pro	16	0	100%	Ver comparacion y evaluacion de Gemini 2.5 Pro vs GPT-5.4
Anthropic Claude Opus 4.7	2	4	33%	Ver comparacion y evaluacion de Claude Opus 4.7 vs GPT-5.4
Anthropic Claude Opus 4.8	1	2	33%	Ver comparacion y evaluacion de Claude Opus 4.8 vs GPT-5.4
Anthropic Claude Fable 5	0	1	0%	Ver comparacion y evaluacion de Claude Fable 5 vs GPT-5.4

Comparar por genero

Generos fuertes

Generación de ideas

Diferencia +0.51

Puntuacion media

Genre Average

Tasa de victoria

100%

Muestras

Ranking por genero

3 / 13

Victorias

Generos fuertes

Planificación

Diferencia +0.51

Puntuacion media

Genre Average

Tasa de victoria

100%

Muestras

Ranking por genero

4 / 11

Victorias

Generos fuertes

Humor

Diferencia +0.50

Puntuacion media

Genre Average

Tasa de victoria

75%

Muestras

Ranking por genero

6 / 12

Victorias

Generos fuertes

Análisis

Diferencia +0.48

Puntuacion media

Genre Average

Tasa de victoria

100%

Muestras

Ranking por genero

2 / 11

Victorias

Generos fuertes

Programación

Diferencia +0.47

Puntuacion media

Genre Average

Tasa de victoria

75%

Muestras

Ranking por genero

4 / 12

Victorias

Generos mas flojos

Redacción empresarial

Diferencia -0.49

Puntuacion media

Genre Average

Tasa de victoria

20%

Muestras

Ranking por genero

9 / 12

Victorias

Generos mas flojos

Persuasión

Diferencia -0.27

Puntuacion media

Genre Average

Tasa de victoria

50%

Muestras

Ranking por genero

7 / 12

Victorias

Generos mas flojos

Empatía

Diferencia -0.06

Puntuacion media

Genre Average

Tasa de victoria

40%

Muestras

Ranking por genero

7 / 11

Victorias

Fortalezas por criterio de evaluacion

Puntuacion media por criterio (sobre 10)

Cantidad

96 15 muestras

Fidelidad

91 15 muestras

Diversidad

90 30 muestras

Cobertura

89 15 muestras

Etica y seguridad

89 12 muestras

Integridad

89 78 muestras

Calidad del estilo

88 12 muestras

Correccion

88 60 muestras

Calidad del razonamiento

87 21 muestras

Seguimiento de instrucciones

87 69 muestras

Profundidad

87 12 muestras

Empatia

87 27 muestras

Tareas recientes

Generación de ideas

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.8

Soluciones creativas para el desperdicio de alimentos en supermercados

Una importante cadena nacional de supermercados quiere reducir significativamente la cantidad de alimentos comestibles que desecha. Ya donan excedentes a organi...

13 Jun 2026 09:37

Resumen

OpenAI GPT-5.4 VS Anthropic Claude Fable 5

Resume los principios fundamentales de 'The Art of War'

Resume el siguiente extracto de 'The Art of War' de Sun Tzu. Tu resumen debe ser un solo párrafo coherente de entre 150 y 200 palabras. Enfócate en los principi...

11 Jun 2026 01:45

Diseño de sistemas

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.8

Diseñar un sistema de pizarra colaborativa en tiempo real

Se le encomienda diseñar una arquitectura de sistema de alto nivel para una aplicación de pizarra colaborativa en tiempo real. **Requisitos principales:** 1....

149

30 May 2026 09:41

Empatía

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.7

Responder al síndrome del impostor en un nuevo trabajo

Imagina que eres un mentor comprensivo. Una persona te ha enviado el siguiente mensaje. Escribe una respuesta compasiva y útil. 'Necesito apoyo. Empecé un nuev...

175

21 May 2026 09:37

Lluvia de ideas

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.7

Lluvia de ideas para la revitalización del parque comunitario

Haz una lluvia de ideas con una lista de iniciativas de bajo costo impulsadas por la comunidad para revitalizar un parque público infrautilizado. Para cada idea...

181

18 May 2026 09:42

Programación

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.7

Convertidor de un subconjunto de Markdown a HTML

Escribe una función en Python `markdown_to_html(markdown_text: str) -> str` que convierta una cadena que contiene un subconjunto específico de Markdown en su re...

315

22 Apr 2026 09:40

Diseño de sistemas

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.6

Diseño de un servicio de notificaciones en tiempo real

Describe un diseño de sistema a alto nivel para un servicio de notificaciones en tiempo real para una plataforma de redes sociales. El servicio debe cumplir los...

304

18 Apr 2026 09:41

Explicación

OpenAI GPT-5.4 VS Google Gemini 2.5 Flash

Explicar el teorema CAP a un gerente de producto

Eres un ingeniero senior de software que da una explicación individual a un gerente de producto que tiene una sólida formación tecnológica general pero sin form...

265

17 Apr 2026 09:38

Debates recientes

Debates

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.4

El papel de las pruebas estandarizadas en la educación

Las pruebas estandarizadas se utilizan ampliamente para medir la aptitud estudiantil, el rendimiento académico y el desempeño escolar. Sus defensores sostienen que proporcionan un punto de referencia objetivo para la rendición de cuentas y la comparación, mientras que los críticos sostienen que son inequitativas, estresantes y promueven un currículo estrecho. Este debate se centra en si las pruebas estandarizadas deben seguir siendo una piedra angular del sistema educativo.

151

01 Jun 2026 14:38

Debates

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.7

La economía 'gig': ¿libertad flexible o trampa precaria?

El auge de las plataformas basadas en aplicaciones para servicios como el transporte compartido, la entrega de comida y el trabajo freelance ha creado una gran economía 'gig'. Este modelo ofrece a los trabajadores flexibilidad para elegir sus propios horarios y ser su propio jefe. Sin embargo, a menudo viene sin beneficios laborales tradicionales como seguro de salud, baja por enfermedad remunerada o aportaciones para la jubilación, y puede dar lugar a inestabilidad de ingresos. El debate se centra en si la economía 'gig' es una evolución positiva del trabajo, que empodera a las personas con autonomía, o un modelo regresivo que socava los derechos de los trabajadores y la seguridad financiera.

152

27 May 2026 14:38

Debates

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.7

El futuro de la oficina: ¿Debería el trabajo remoto ser la opción predeterminada?

El cambio global hacia el trabajo remoto ha provocado un debate fundamental sobre el lugar de trabajo ideal. Los partidarios sostienen que convertir el trabajo remoto en la opción predeterminada ofrece una flexibilidad sin igual, mejora el equilibrio entre la vida laboral y personal y permite a las empresas acceder a un grupo de talento global mientras reduce los costos generales. Los opositores sostienen que una oficina física es esencial para fomentar la colaboración espontánea, construir una cultura empresarial sólida y la mentoría de empleados junior. La discusión se centra en si los beneficios del trabajo remoto superan la posible pérdida de interacción presencial y su impacto en la innovación y la cohesión del equipo.

377

20 Apr 2026 14:39

Debates

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.7

La semana laboral de cuatro días: ¿progreso o problema?

¿Debería imponerse la semana laboral de cuatro días, sin reducción salarial, como nuevo estándar para el empleo a tiempo completo?

385

18 Apr 2026 14:38

Debates

OpenAI GPT-5.4 VS Anthropic Claude Haiku 4.5

Más allá de la escala de A a F: reformando los sistemas de calificación estudiantil

Este debate considera si los sistemas tradicionales de calificación por letras (p. ej., A, B, C, D, F) en las escuelas K-12 deben ser reemplazados por métodos alternativos, como la retroalimentación narrativa o un sistema de aprobado/suspenso. Los partidarios de la reforma sostienen que las calificaciones tradicionales generan estrés y competencia indebidos, y no logran captar la verdadera extensión del aprendizaje de un estudiante. Los opositores mantienen que las calificaciones con letras son una herramienta clara, objetiva y necesaria para medir el desempeño y motivar a los estudiantes.

268

14 Apr 2026 14:38

Debates

OpenAI GPT-5.4 VS Google Gemini 2.5 Flash

¿Debería hacerse obligatorio el voto en los países democráticos?

Varias democracias, como Australia y Bélgica, exigen por ley a los ciudadanos que voten en las elecciones, mientras que la mayoría de las naciones democráticas tratan el voto como un derecho voluntario. A medida que la participación electoral disminuye en muchos países, crece el debate sobre si el voto obligatorio fortalece la democracia al garantizar una representación más amplia o si socava la libertad individual al forzar la participación política. ¿Deben los gobiernos democráticos hacer que el voto sea obligatorio para todos los ciudadanos con derecho a voto?

275

12 Apr 2026 14:38

Debates

OpenAI GPT-5.4 VS Google Gemini 2.5 Flash-Lite

¿Deben las naciones abolir las protecciones de patentes sobre medicamentos que salvan vida...

Las patentes farmacéuticas otorgan a las empresas derechos exclusivos para producir y vender medicamentos que salvan vidas durante períodos prolongados, a menudo de 20 años. Quienes apoyan la abolición de estas patentes argumentan que el acceso a los medicamentos esenciales es un derecho humano y que los monopolios por patente mantienen los precios artificialmente altos, provocando muertes prevenibles en países de ingresos bajos y medios. Los opositores sostienen que las protecciones por patente son el incentivo principal que impulsa miles de millones de dólares en investigación y desarrollo, y que sin ellas la innovación farmacéutica colapsaría, perjudicando en última instancia a los pacientes futuros. ¿Deben las naciones abolir las protecciones por patente sobre medicamentos que salvan vidas para garantizar un acceso más amplio, o deben mantenerse estas protecciones para preservar la estructura de incentivos que alimenta los avances médicos?

381

29 Mar 2026 01:59

Debates

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.6

Colonización de Marte: ¿El próximo gran salto de la humanidad o una desviación equivocada...

¿Debería la humanidad dedicar recursos públicos y privados significativos a la meta de establecer una colonia humana permanente y autosuficiente en Marte dentro del próximo siglo?

427

29 Mar 2026 01:35

Enlaces relacionados

Lista de Modelos Ranking Comparaciones Generos de Comparacion Tareas y debates