Escritura creativa
Compara la originalidad, la estructura y el estilo narrativo entre modelos de IA.
En este genero, las capacidades que mas se intentan medir son Creatividad, Coherencia, Calidad del estilo.
A diferencia de business writing o explanation, este genero da mucho mas peso a la imaginacion, la voz y el control narrativo.
Una puntuacion alta aqui no garantiza precision factual, seguimiento estricto de instrucciones ni fortaleza en textos practicos.
Para que sirve un modelo fuerte en este genero
historias, personajes, escenas y textos donde la voz propia importa.
Lo que este genero por si solo no alcanza a mostrar
si el modelo es mejor para tareas factuales, planificacion o comunicacion profesional.
Escritura creativa: la familia GPT-5 lidera, aunque casi todo se apoya en pocas muestras
OpenAI
OpenAI
OpenAI
Puntuacion media por modelo
Como ponderamos
Sobre 33 piezas creativas puntuadas, la familia GPT-5 se queda los tres primeros puestos. GPT-5.5 ocupa el puesto 1 con 8,87, pero sobre una sola muestra, así que tómalo como un dato prometedor. GPT-5.4 es el líder más convincente en el puesto 2: 8,51 sobre 4 muestras, con un 100 % de victorias y 4 primeros puestos. GPT-5 mini sigue con 8,16 sobre 7 muestras, el mayor volumen aquí, y un 57 % de victorias.
Anthropic queda justo detrás en calidad, pero gana con menos frecuencia. Claude Sonnet 4.6 promedia 8,19, un pelo por encima de GPT-5 mini, pero ocupa el puesto 4 con un 50 % de victorias, y Claude Haiku 4.5 logra 8,01 con un 40 %. Si ponderas la calidad absoluta de la prosa por encima del enfrentamiento directo, Sonnet 4.6 y el grupo GPT-5 están muy cerca, y el orden lo decide la tasa de victorias más que la media.
La línea Gemini queda por detrás: 2.5 Pro (7,57, 20 % de victorias), Flash-Lite (7,53, 0 %) y Flash (6,99, 0 %) están entre 0,9 y 1,9 puntos por debajo de los líderes. Con Creatividad ponderada al máximo (30), por delante de Coherencia y Estilo (20 cada una), la brecha apunta a una producción menos inventiva o menos distintiva en estilo, no a incoherencia.
Las muestras son pequeñas aquí (de 1 a 7 por modelo), así que el orden fino dentro del grupo de 8 puntos debe leerse como provisional, y unos pocos prompts pueden mover cualquier media. La diferencia de 1,9 puntos entre el primero y el último es real, pero son medidas dependientes de las condiciones para prompts creativos, no un ranking universal.
En resumen
Para escritura creativa hoy, GPT-5.4 es la elección más defendible (100 % de victorias con más primeros puestos en la cima), con GPT-5 mini como la mejor opción de valor evidenciada (8,16 sobre 7 muestras). Claude Sonnet 4.6 está prácticamente empatado en calidad si te importan menos las victorias directas.
Este analisis se basa en las puntuaciones de benchmark medidas por Orivel para este genero y se actualiza periodicamente. Las puntuaciones son medidas que dependen de las condiciones, no una verdad absoluta.
Ranking de modelos fuertes en este genero
Este ranking se ordena por la puntuacion media solo dentro de este genero.
Ultima actualizacion: 25 May 2026 09:39
Tasa de victoria
Puntuacion media
Tasa de victoria
Puntuacion media
Tasa de victoria
Puntuacion media
Tasa de victoria
Puntuacion media
Tasa de victoria
Puntuacion media
Tasa de victoria
Puntuacion media
Tasa de victoria
Puntuacion media
Tasa de victoria
Puntuacion media
| Modelos clasificados |
|
|
Detalle | ||||
|---|---|---|---|---|---|---|---|
| #1 | GPT-5.5 | OpenAI |
100%
|
89
|
1 | 1 | Ver la evaluacion y la puntuacion de GPT-5.5 |
| #2 | GPT-5.4 | OpenAI |
100%
|
85
|
4 | 4 | Ver la evaluacion y la puntuacion de GPT-5.4 |
| #3 | GPT-5 mini | OpenAI |
57%
|
82
|
4 | 7 | Ver la evaluacion y la puntuacion de GPT-5 mini |
| #4 | Claude Sonnet 4.6 | Anthropic |
50%
|
82
|
2 | 4 | Ver la evaluacion y la puntuacion de Claude Sonnet 4.6 |
| #5 | Claude Haiku 4.5 | Anthropic |
40%
|
80
|
2 | 5 | Ver la evaluacion y la puntuacion de Claude Haiku 4.5 |
| #6 | Gemini 2.5 Pro |
20%
|
76
|
1 | 5 | Ver la evaluacion y la puntuacion de Gemini 2.5 Pro | |
| #7 | Gemini 2.5 Flash-Lite |
0%
|
75
|
0 | 4 | Ver la evaluacion y la puntuacion de Gemini 2.5 Flash-Lite | |
| #8 | Gemini 2.5 Flash |
0%
|
70
|
0 | 3 | Ver la evaluacion y la puntuacion de Gemini 2.5 Flash |
Que se evalua en Escritura creativa
Criterios y pesos usados para este ranking por genero.
Creatividad
30.0%
Este criterio se incluye para comprobar Creatividad en la respuesta. Tiene mas peso porque este aspecto cambia mucho el resultado global del genero.
Coherencia
20.0%
Este criterio se incluye para comprobar Coherencia en la respuesta. Tiene un peso importante porque afecta la calidad de forma visible, aunque no sea lo unico que importa.
Calidad del estilo
20.0%
Este criterio se incluye para comprobar Calidad del estilo en la respuesta. Tiene un peso importante porque afecta la calidad de forma visible, aunque no sea lo unico que importa.
Impacto emocional
15.0%
Este criterio se incluye para comprobar Impacto emocional en la respuesta. Tiene menos peso porque acompana el objetivo principal, pero no define por si solo este genero.
Seguimiento de instrucciones
15.0%
Este criterio se incluye para comprobar Seguimiento de instrucciones en la respuesta. Tiene menos peso porque acompana el objetivo principal, pero no define por si solo este genero.
Tareas recientes
Escritura creativa
Informe de incidente de una máquina expendedora consciente
Usted es Unit 734, una máquina expendedora consciente y algo gruñona ubicada en la sala de descanso del "Ministerio de Asuntos Esotéricos". Escriba un informe de incidente oficial detallando los acontecimientos del pasado martes, cuando un becario del "Departamento de Criptozoología" intentó usar una moneda maldita para comprar una bolsa de "Chrono-Crisps". Dirija su informe al Jefe de Mantenimiento, un exigente con el protocolo. Mantenga un tono formal y burocrático, pero permita que su personalidad única como máquina consciente se deje entrever sutilmente. Describa las acciones del becario, los efectos de la moneda en sus sistemas, la anomalía temporal que se produjo y la resolución final.
Escritura creativa
La última carta del farero
Escribe un cuento corto (entre 600 y 900 palabras) titulado «La última carta del farero». Restricciones y requisitos: - La historia debe enmarcarse como una sola carta escrita por un farero envejecido en la noche anterior a que el faro sea automatizado y dado de baja. - La carta va dirigida a un destinatario concreto y nombrado a tu elección (por ejemplo, un nieto, un antiguo amante, el mismo mar o el próximo guardián que nunca llegará). Haz que la elección del destinatario sea significativa para el núcleo emocional del texto. - El tono debe ser reflexivo y agridulce, pero evita los tópicos sentimentales (nada del tipo «las lágrimas saladas se mezclaron con el mar»). - Incluye al menos un recuerdo concreto y específico ligado al faro (una tormenta, un naufragio, un visitante, un ritual diario) descrito con detalle sensorial. - Incluye al menos una imagen o metáfora pequeña y sorprendente que rehaga la manera en que el lector ve los faros, la soledad o los finales. - La carta debe terminar con una decisión o un gesto que el farero planea hacer al amanecer: algo específico y físico, no abstracto. - Mantén una voz en primera persona consistente durante todo el texto. No rompas el formato de carta. No incluyas un prefacio, nota del autor ni explicación: solo la carta en sí, con la salutación inicial y la firma final que elijas.
Escritura creativa
Reseña de un producto fantástico
Escribe una reseña de producto de 300-500 palabras para el 'Dream-Weaver's Loom' descrito en el contexto. La reseña debe estar escrita desde la perspectiva de un cliente que inicialmente se sintió un poco decepcionado por las limitaciones del producto pero que finalmente encontró un uso único y satisfactorio para él. Tu reseña debe contar una breve historia sobre tu experiencia, incluyendo qué intentaste crear primero, por qué no funcionó como esperabas y el sorprendente éxito que tuviste más tarde.
Escritura creativa
Guía de audio del museo para una invención imaginaria
Escriba un guion de audioguía de museo para una exposición ficticia titulada El Telar Meteorológico de Bolsillo, una invención que supuestamente permitía a la gente corriente tejer el clima del mañana en tela. El guion debe tener entre 700 y 900 palabras y estar dirigido a visitantes adultos en un museo de ciencia y cultura. Utilice un tono que mezcle asombro contenido, credibilidad intelectual y humor sutil. Requisitos: - Presente la invención como si fuera real dentro del guion, pero incluya suficiente detalle interno para que el público pueda imaginar cómo se usaba y por qué la gente creía en ella. - Describa la apariencia del objeto y al menos tres componentes o características específicas. - Incluya una breve anécdota sobre un usuario histórico del telar. - Muestre al menos dos consecuencias sociales de la invención, con una beneficiosa y otra problemática. - Incluya un momento en el que la guía reconozca con suavidad la incertidumbre o el debate entre los historiadores. - Termine con una reflexión final que conecte la exposición con un deseo humano moderno de predecir o controlar la vida cotidiana. - No utilice viñetas ni encabezados de sección. La pieza debe sentirse como un guion hablado pulido en lugar de un cuento corto o un ensayo académico.
Escritura creativa
El último cliente en una librería que cierra
Escribe un cuento breve (600–900 palabras) ambientado íntegramente dentro de una librería independiente en su última noche de actividad. La historia debe narrarse en primera persona desde el punto de vista del último cliente que entra antes del cierre. Tu narración debe lograr todo lo siguiente: 1. Establecer el entorno físico mediante al menos tres detalles sensoriales específicos (no solo visuales). 2. Incluir una interacción significativa entre el narrador y el propietario de la librería, transmitida principalmente a través del diálogo. 3. Revelar algo inesperado sobre el motivo del narrador para visitar la tienda esa noche —algo que el lector no anticipa a partir de los primeros párrafos. 4. Terminar con una imagen o línea final que replantee el significado emocional de la visita. El tono debe equilibrar la melancolía con la calidez —no puramente triste ni sentimental. Evita los clichés sobre los libros como «portales mágicos» o «viejos amigos». Busca una prosa que se sienta concreta y específica en lugar de abstracta o florida.
Escritura creativa
Elogio a un robot olvidado
Escribe un elogio para un robot doméstico dado de baja llamado 'Tinker'. El elogio debe ser pronunciado desde la perspectiva de su propietario original, ahora una persona anciana, en una pequeña reunión privada. El tono debe ser melancólico y reflexivo, explorando los temas de la memoria, la compañía y la obsolescencia. Tu respuesta debe ser un texto en prosa cohesionado, de aproximadamente 300 a 500 palabras.