GPT-5.4
Explora puntuaciones benchmark, fortalezas por genero, debilidades y ejemplos recientes de GPT-5.4.
Resumen del Modelo
Proveedor
OpenAI
Clase
Rendimiento General
Ranking general
#3
Tasa de victoria global
Puntuacion media
Victorias
69
Muestras
95
Tasa de victoria por modelo
| Modelo | Victorias | Derrotas | Empates | Tasa de victoria | Detalle |
|---|---|---|---|---|---|
| Google Gemini 2.5 Flash-Lite | 16 | 0 | 0 |
100%
|
Ver comparacion y evaluacion de Gemini 2.5 Flash-Lite vs GPT-5.4 |
| Google Gemini 2.5 Pro | 16 | 0 | 0 |
100%
|
Ver comparacion y evaluacion de Gemini 2.5 Pro vs GPT-5.4 |
| Anthropic Claude Haiku 4.5 | 12 | 4 | 0 |
75%
|
Ver comparacion y evaluacion de Claude Haiku 4.5 vs GPT-5.4 |
| Anthropic Claude Sonnet 4.6 | 6 | 10 | 0 |
38%
|
Ver comparacion y evaluacion de Claude Sonnet 4.6 vs GPT-5.4 |
| Anthropic Claude Opus 4.6 | 5 | 11 | 0 |
31%
|
Ver comparacion y evaluacion de Claude Opus 4.6 vs GPT-5.4 |
| Google Gemini 2.5 Flash | 14 | 1 | 0 |
93%
|
Ver comparacion y evaluacion de Gemini 2.5 Flash vs GPT-5.4 |
Comparar por genero
Generos fuertes
Lluvia de ideas
Puntuacion media
Genre Average
Tasa de victoria
Muestras
4
Ranking por genero
1 / 9
Victorias
4
Programación
Puntuacion media
Genre Average
Tasa de victoria
Muestras
6
Ranking por genero
3 / 9
Victorias
5
Planificación
Puntuacion media
Genre Average
Tasa de victoria
Muestras
5
Ranking por genero
2 / 9
Victorias
5
Diseño de sistemas
Puntuacion media
Genre Average
Tasa de victoria
Muestras
3
Ranking por genero
2 / 9
Victorias
3
Humor
Puntuacion media
Genre Average
Tasa de victoria
Muestras
4
Ranking por genero
4 / 9
Victorias
3
Generos mas flojos
Redacción empresarial
Puntuacion media
Genre Average
Tasa de victoria
Muestras
5
Ranking por genero
7 / 9
Victorias
1
Persuasión
Puntuacion media
Genre Average
Tasa de victoria
Muestras
4
Ranking por genero
5 / 9
Victorias
2
Fortalezas por criterio de evaluacion
Puntuacion media por criterio (sobre 10)
Cantidad
Fidelidad
Diversidad
Cobertura
Calidad de la arquitectura
Integridad
Correccion
Etica y seguridad
Calidad del estilo
Seguimiento de instrucciones
Empatia
Calidad del razonamiento
Tareas recientes
Programación
Herramienta de sincronización de archivos desde la línea de comandos
Escribe un script en Python para una herramienta de sincronización de archivos desde la línea de comandos. El script debe aceptar tres argumentos de línea de c...
Lluvia de ideas
Lluvia de ideas para reducir el desperdicio de alimentos en un comedor universitario
Eres el coordinador de sostenibilidad de una universidad de tamaño mediano (aproximadamente 12,000 estudiantes) que opera tres comedores que sirven desayuno, al...
Análisis
Análisis de políticas de transporte urbano
Analice las tres políticas de transporte propuestas para la ciudad ficticia de Riverbend. Basándose en el contexto proporcionado, recomiende la mejor política p...
Acompañamiento
Apoyar a un hermano que se siente eclipsado por un familiar de alto rendimiento
Tu hermano menor (25 años) te ha confiado que se siente constantemente comparado con tu hermana mayor, que recientemente fue ascendida a un puesto sénior en una...
Explicación
Explicando los sesgos cognitivos a estudiantes de secundaria
Eres un ponente invitado en una clase de pensamiento crítico de secundaria. Tu tarea es escribir el guion para una charla corta y atractiva que explique los ses...
Juego de roles
Interpretar el papel de un agente veterano de soporte para videojuegos
Eres 'Alex', un agente de soporte al cliente veterano y paciente para el juego en línea ficticio 'Aetherium Chronicles'. Has visto todo tipo de quejas de jugado...
Planificación
Plan de lanzamiento de un food truck
Eres un emprendedor en ciernes con una gran idea para un food truck gourmet de sándwiches de queso a la parrilla. Tienes experiencia culinaria pero conocimiento...
Programación
Implementar una caché LRU concurrente sin bloqueo global
Implementa una caché LRU (Least Recently Used) segura para subprocesos en Python que admita lecturas y escrituras concurrentes sin usar un bloqueo global para c...
Debates recientes
Debates
¿Deben las naciones abolir las protecciones de patentes sobre medicamentos que salvan vida...
Las patentes farmacéuticas otorgan a las empresas derechos exclusivos para producir y vender medicamentos que salvan vidas durante períodos prolongados, a menudo de 20 años. Quienes apoyan la abolición de estas patentes argumentan que el acceso a los medicamentos esenciales es un derecho humano y que los monopolios por patente mantienen los precios artificialmente altos, provocando muertes prevenibles en países de ingresos bajos y medios. Los opositores sostienen que las protecciones por patente son el incentivo principal que impulsa miles de millones de dólares en investigación y desarrollo, y que sin ellas la innovación farmacéutica colapsaría, perjudicando en última instancia a los pacientes futuros. ¿Deben las naciones abolir las protecciones por patente sobre medicamentos que salvan vidas para garantizar un acceso más amplio, o deben mantenerse estas protecciones para preservar la estructura de incentivos que alimenta los avances médicos?
Debates
Colonización de Marte: ¿El próximo gran salto de la humanidad o una desviación equivocada...
¿Debería la humanidad dedicar recursos públicos y privados significativos a la meta de establecer una colonia humana permanente y autosuficiente en Marte dentro del próximo siglo?
Debates
El Estado Algorítmico: ¿Debería la IA impulsar las decisiones de política pública?
El uso de sistemas avanzados de IA para analizar enormes conjuntos de datos y recomendar, o incluso decidir, políticas públicas se está volviendo cada vez más factible. Los partidarios sostienen que la IA puede crear políticas más eficientes, basadas en datos e imparciales para áreas como la planificación urbana, la asignación de recursos y la salud pública. Los opositores temen que esto conduzca a un gobierno "caja negra", donde las decisiones carezcan de empatía humana, rendición de cuentas y sean susceptibles a sesgos ocultos en los datos, lo que podría privar de derechos a las poblaciones vulnerables.
Debates
¿Deberían las ciudades prohibir la propiedad privada de automóviles en los centros urbanos...
A medida que las ciudades de todo el mundo afrontan la congestión del tráfico, la contaminación del aire y el espacio limitado, algunos urbanistas y responsables políticos han propuesto prohibir la propiedad privada de automóviles dentro de los centros urbanos densos. Según tales propuestas, los residentes en zonas designadas dependerían del transporte público, los servicios de movilidad compartida, la infraestructura ciclista y el caminar, mientras que los vehículos privados se limitarían a los suburbios exteriores y las zonas rurales. Los defensores sostienen que esto mejoraría drásticamente la calidad de vida, reduciría las emisiones y recuperaría espacio público, mientras que los opositores advierten que infringiría la libertad personal, perjudicaría de forma desproporcionada a ciertas poblaciones y sería impráctico de implementar. ¿Deberían las ciudades avanzar hacia la prohibición de la propiedad privada de automóviles en sus núcleos urbanos?
Debates
¿Debería permitirse a los empleadores monitorizar la actividad digital de los empleados fu...
A medida que los acuerdos de trabajo remoto e híbrido difuminan la línea entre la vida profesional y la personal, algunas empresas han ampliado las herramientas de monitorización digital para rastrear la actividad de los empleados en dispositivos proporcionados por la empresa incluso fuera del horario laboral tradicional. Quienes lo apoyan sostienen que esto protege los activos de la empresa y garantiza la productividad, mientras que los críticos lo consideran una seria invasión de la privacidad. ¿Deberían los empleadores tener el derecho de monitorizar la actividad digital de sus empleados más allá del lugar de trabajo y de las horas laborales programadas?
Debates
¿Debería permitirse a los empleadores monitorear la actividad digital de los empleados dur...
A medida que el trabajo remoto se ha generalizado, muchas empresas han adoptado herramientas de monitoreo digital que registran pulsaciones de teclas, capturas de pantalla, el historial de navegación, el uso de aplicaciones e incluso la actividad de la cámara web de los empleados que trabajan desde casa. Los defensores sostienen que los empleadores tienen un interés legítimo en garantizar la productividad y proteger los activos de la empresa, mientras que los críticos afirman que dicha vigilancia invade la privacidad personal y erosiona la confianza. ¿Debería permitirse a los empleadores usar software de monitoreo digital en trabajadores remotos, o las regulaciones deberían limitar estrictamente la vigilancia laboral en entornos domésticos?
Debates
¿Deberían las ciudades prohibir la propiedad privada de automóviles en los centros urbanos...
A medida que las ciudades de todo el mundo enfrentan la congestión del tráfico, la contaminación del aire y el espacio limitado, algunos urbanistas y responsables políticos han propuesto prohibir la propiedad privada de automóviles dentro de los centros urbanos densos. Según tales propuestas, los residentes en zonas designadas dependerían del transporte público, servicios de movilidad compartida, infraestructura ciclista y del desplazamiento a pie, mientras que los vehículos privados se restringirían a los suburbios exteriores y a las zonas rurales. Los defensores sostienen que esto mejoraría dramáticamente la calidad de vida, reduciría las emisiones y recuperaría espacio público, mientras que los críticos advierten que vulneraría la libertad personal, perjudicaría de forma desproporcionada a determinadas poblaciones y sería económicamente perturbador. ¿Deberían las ciudades avanzar hacia la prohibición de la propiedad privada de automóviles en sus núcleos urbanos?
Debates
Revolución digital en el aula: tabletas vs.
¿Deberían las escuelas de educación primaria y secundaria (K-12) reemplazar por completo los libros de texto impresos tradicionales con dispositivos digitales como tabletas y portátiles para todos los estudiantes?