GPT-5.4
Explora puntuaciones de benchmark, fortalezas por género, debilidades y ejemplos recientes de GPT-5.4.
Resumen del Modelo
Publicado
2026-03-05
Contexto
272k tokens
Entrada
$2.50 / 1M
Salida
$15.00 / 1M
Publicado el 5 de marzo de 2026, GPT-5.4 fue el modelo insignia de razonamiento de OpenAI durante unas siete semanas, hasta que GPT-5.5 tomó el relevo el 23 de abril de 2026. En Orivel sigue plenamente activo como opción equilibrada de OpenAI: la variante Thinking se expone en la API y el precio es notablemente inferior al de 5.5 manteniendo buena capacidad para la mayoría de tareas.
Cambios
- Publicado el 5 de marzo de 2026 como sucesor de GPT-5.2
- Flagship en Orivel de marzo a abril de 2026; tras GPT-5.5 pasa a ser la opción equilibrada de OpenAI
- La variante Thinking es el modelo de razonamiento principal en la API
- La variante Pro ofrece razonamiento más profundo para las tareas más exigentes
- Ventana de contexto de 272k tokens (hasta ~1M con nivel extendido y tarifa multiplicada)
- Precio $2.50 entrada / $15.00 salida por 1M tokens — aprox. la mitad del costo de salida de GPT-5.5
Rendimiento General
Ranking general
#4
Tasa de victoria global
Puntuacion media
Victorias
74
Muestras
110
Tasa de victoria por modelo
Comparar por genero
Generos fuertes
Generación de ideas
Puntuacion media
Genre Average
Tasa de victoria
Muestras
5
Ranking por genero
3 / 13
Victorias
5
Planificación
Puntuacion media
Genre Average
Tasa de victoria
Muestras
5
Ranking por genero
4 / 11
Victorias
5
Humor
Puntuacion media
Genre Average
Tasa de victoria
Muestras
4
Ranking por genero
6 / 12
Victorias
3
Análisis
Puntuacion media
Genre Average
Tasa de victoria
Muestras
4
Ranking por genero
2 / 11
Victorias
4
Programación
Puntuacion media
Genre Average
Tasa de victoria
Muestras
8
Ranking por genero
4 / 12
Victorias
6
Generos mas flojos
Redacción empresarial
Puntuacion media
Genre Average
Tasa de victoria
Muestras
5
Ranking por genero
9 / 12
Victorias
1
Persuasión
Puntuacion media
Genre Average
Tasa de victoria
Muestras
4
Ranking por genero
7 / 12
Victorias
2
Empatía
Puntuacion media
Genre Average
Tasa de victoria
Muestras
5
Ranking por genero
7 / 11
Victorias
2
Fortalezas por criterio de evaluacion
Puntuacion media por criterio (sobre 10)
Cantidad
Fidelidad
Diversidad
Cobertura
Etica y seguridad
Integridad
Calidad del estilo
Correccion
Calidad del razonamiento
Seguimiento de instrucciones
Profundidad
Empatia
Tareas recientes
Generación de ideas
Soluciones creativas para el desperdicio de alimentos en supermercados
Una importante cadena nacional de supermercados quiere reducir significativamente la cantidad de alimentos comestibles que desecha. Ya donan excedentes a organi...
Resumen
Resume los principios fundamentales de 'The Art of War'
Resume el siguiente extracto de 'The Art of War' de Sun Tzu. Tu resumen debe ser un solo párrafo coherente de entre 150 y 200 palabras. Enfócate en los principi...
Diseño de sistemas
Diseñar un sistema de pizarra colaborativa en tiempo real
Se le encomienda diseñar una arquitectura de sistema de alto nivel para una aplicación de pizarra colaborativa en tiempo real. **Requisitos principales:** 1....
Empatía
Responder al síndrome del impostor en un nuevo trabajo
Imagina que eres un mentor comprensivo. Una persona te ha enviado el siguiente mensaje. Escribe una respuesta compasiva y útil. 'Necesito apoyo. Empecé un nuev...
Lluvia de ideas
Lluvia de ideas para la revitalización del parque comunitario
Haz una lluvia de ideas con una lista de iniciativas de bajo costo impulsadas por la comunidad para revitalizar un parque público infrautilizado. Para cada idea...
Programación
Convertidor de un subconjunto de Markdown a HTML
Escribe una función en Python `markdown_to_html(markdown_text: str) -> str` que convierta una cadena que contiene un subconjunto específico de Markdown en su re...
Diseño de sistemas
Diseño de un servicio de notificaciones en tiempo real
Describe un diseño de sistema a alto nivel para un servicio de notificaciones en tiempo real para una plataforma de redes sociales. El servicio debe cumplir los...
Explicación
Explicar el teorema CAP a un gerente de producto
Eres un ingeniero senior de software que da una explicación individual a un gerente de producto que tiene una sólida formación tecnológica general pero sin form...
Debates recientes
Debates
El papel de las pruebas estandarizadas en la educación
Las pruebas estandarizadas se utilizan ampliamente para medir la aptitud estudiantil, el rendimiento académico y el desempeño escolar. Sus defensores sostienen que proporcionan un punto de referencia objetivo para la rendición de cuentas y la comparación, mientras que los críticos sostienen que son inequitativas, estresantes y promueven un currículo estrecho. Este debate se centra en si las pruebas estandarizadas deben seguir siendo una piedra angular del sistema educativo.
Debates
La economía 'gig': ¿libertad flexible o trampa precaria?
El auge de las plataformas basadas en aplicaciones para servicios como el transporte compartido, la entrega de comida y el trabajo freelance ha creado una gran economía 'gig'. Este modelo ofrece a los trabajadores flexibilidad para elegir sus propios horarios y ser su propio jefe. Sin embargo, a menudo viene sin beneficios laborales tradicionales como seguro de salud, baja por enfermedad remunerada o aportaciones para la jubilación, y puede dar lugar a inestabilidad de ingresos. El debate se centra en si la economía 'gig' es una evolución positiva del trabajo, que empodera a las personas con autonomía, o un modelo regresivo que socava los derechos de los trabajadores y la seguridad financiera.
Debates
El futuro de la oficina: ¿Debería el trabajo remoto ser la opción predeterminada?
El cambio global hacia el trabajo remoto ha provocado un debate fundamental sobre el lugar de trabajo ideal. Los partidarios sostienen que convertir el trabajo remoto en la opción predeterminada ofrece una flexibilidad sin igual, mejora el equilibrio entre la vida laboral y personal y permite a las empresas acceder a un grupo de talento global mientras reduce los costos generales. Los opositores sostienen que una oficina física es esencial para fomentar la colaboración espontánea, construir una cultura empresarial sólida y la mentoría de empleados junior. La discusión se centra en si los beneficios del trabajo remoto superan la posible pérdida de interacción presencial y su impacto en la innovación y la cohesión del equipo.
Debates
La semana laboral de cuatro días: ¿progreso o problema?
¿Debería imponerse la semana laboral de cuatro días, sin reducción salarial, como nuevo estándar para el empleo a tiempo completo?
Debates
Más allá de la escala de A a F: reformando los sistemas de calificación estudiantil
Este debate considera si los sistemas tradicionales de calificación por letras (p. ej., A, B, C, D, F) en las escuelas K-12 deben ser reemplazados por métodos alternativos, como la retroalimentación narrativa o un sistema de aprobado/suspenso. Los partidarios de la reforma sostienen que las calificaciones tradicionales generan estrés y competencia indebidos, y no logran captar la verdadera extensión del aprendizaje de un estudiante. Los opositores mantienen que las calificaciones con letras son una herramienta clara, objetiva y necesaria para medir el desempeño y motivar a los estudiantes.
Debates
¿Debería hacerse obligatorio el voto en los países democráticos?
Varias democracias, como Australia y Bélgica, exigen por ley a los ciudadanos que voten en las elecciones, mientras que la mayoría de las naciones democráticas tratan el voto como un derecho voluntario. A medida que la participación electoral disminuye en muchos países, crece el debate sobre si el voto obligatorio fortalece la democracia al garantizar una representación más amplia o si socava la libertad individual al forzar la participación política. ¿Deben los gobiernos democráticos hacer que el voto sea obligatorio para todos los ciudadanos con derecho a voto?
Debates
¿Deben las naciones abolir las protecciones de patentes sobre medicamentos que salvan vida...
Las patentes farmacéuticas otorgan a las empresas derechos exclusivos para producir y vender medicamentos que salvan vidas durante períodos prolongados, a menudo de 20 años. Quienes apoyan la abolición de estas patentes argumentan que el acceso a los medicamentos esenciales es un derecho humano y que los monopolios por patente mantienen los precios artificialmente altos, provocando muertes prevenibles en países de ingresos bajos y medios. Los opositores sostienen que las protecciones por patente son el incentivo principal que impulsa miles de millones de dólares en investigación y desarrollo, y que sin ellas la innovación farmacéutica colapsaría, perjudicando en última instancia a los pacientes futuros. ¿Deben las naciones abolir las protecciones por patente sobre medicamentos que salvan vidas para garantizar un acceso más amplio, o deben mantenerse estas protecciones para preservar la estructura de incentivos que alimenta los avances médicos?
Debates
Colonización de Marte: ¿El próximo gran salto de la humanidad o una desviación equivocada...
¿Debería la humanidad dedicar recursos públicos y privados significativos a la meta de establecer una colonia humana permanente y autosuficiente en Marte dentro del próximo siglo?