Orivel Orivel
Abrir menu

Escritura creativa

Compara la originalidad, la estructura y el estilo narrativo entre modelos de IA.

En este genero, las capacidades que mas se intentan medir son Creatividad, Coherencia, Calidad del estilo.

A diferencia de business writing o explanation, este genero da mucho mas peso a la imaginacion, la voz y el control narrativo.

Una puntuacion alta aqui no garantiza precision factual, seguimiento estricto de instrucciones ni fortaleza en textos practicos.

Para que sirve un modelo fuerte en este genero

historias, personajes, escenas y textos donde la voz propia importa.

Lo que este genero por si solo no alcanza a mostrar

si el modelo es mejor para tareas factuales, planificacion o comunicacion profesional.

Analisis de datos

Escritura creativa: la familia GPT-5 lidera, aunque casi todo se apoya en pocas muestras

33 respuestas evaluadas Escritura creativa Actualizado 2026/6/7
1
GPT-5.5

OpenAI

89
Puntuacion media
100%
Tasa de victoria
1 veces 1.o 1 muestras
2
GPT-5.4

OpenAI

85
Puntuacion media
100%
Tasa de victoria
4 veces 1.o 4 muestras
3
GPT-5 mini

OpenAI

82
Puntuacion media
57%
Tasa de victoria
4 veces 1.o 7 muestras

Puntuacion media por modelo

1 GPT-5.5
8.87
2 GPT-5.4
8.51
3 GPT-5 mini
8.16
4 Claude Sonnet 4.6
8.19
5 Claude Haiku 4.5
8.01
6 Gemini 2.5 Pro
7.57
7 Gemini 2.5 Flash-Lite
7.53
8 Gemini 2.5 Flash
6.99

Como ponderamos

Creatividad 30% Coherencia 20% Calidad del estilo 20% Impacto emocional 15% Seguimiento de instrucciones 15%

Sobre 33 piezas creativas puntuadas, la familia GPT-5 se queda los tres primeros puestos. GPT-5.5 ocupa el puesto 1 con 8,87, pero sobre una sola muestra, así que tómalo como un dato prometedor. GPT-5.4 es el líder más convincente en el puesto 2: 8,51 sobre 4 muestras, con un 100 % de victorias y 4 primeros puestos. GPT-5 mini sigue con 8,16 sobre 7 muestras, el mayor volumen aquí, y un 57 % de victorias.

Anthropic queda justo detrás en calidad, pero gana con menos frecuencia. Claude Sonnet 4.6 promedia 8,19, un pelo por encima de GPT-5 mini, pero ocupa el puesto 4 con un 50 % de victorias, y Claude Haiku 4.5 logra 8,01 con un 40 %. Si ponderas la calidad absoluta de la prosa por encima del enfrentamiento directo, Sonnet 4.6 y el grupo GPT-5 están muy cerca, y el orden lo decide la tasa de victorias más que la media.

La línea Gemini queda por detrás: 2.5 Pro (7,57, 20 % de victorias), Flash-Lite (7,53, 0 %) y Flash (6,99, 0 %) están entre 0,9 y 1,9 puntos por debajo de los líderes. Con Creatividad ponderada al máximo (30), por delante de Coherencia y Estilo (20 cada una), la brecha apunta a una producción menos inventiva o menos distintiva en estilo, no a incoherencia.

Las muestras son pequeñas aquí (de 1 a 7 por modelo), así que el orden fino dentro del grupo de 8 puntos debe leerse como provisional, y unos pocos prompts pueden mover cualquier media. La diferencia de 1,9 puntos entre el primero y el último es real, pero son medidas dependientes de las condiciones para prompts creativos, no un ranking universal.

En resumen

Para escritura creativa hoy, GPT-5.4 es la elección más defendible (100 % de victorias con más primeros puestos en la cima), con GPT-5 mini como la mejor opción de valor evidenciada (8,16 sobre 7 muestras). Claude Sonnet 4.6 está prácticamente empatado en calidad si te importan menos las victorias directas.

Este analisis se basa en las puntuaciones de benchmark medidas por Orivel para este genero y se actualiza periodicamente. Las puntuaciones son medidas que dependen de las condiciones, no una verdad absoluta.

Ranking de modelos fuertes en este genero

Este ranking se ordena por la puntuacion media solo dentro de este genero.

Ultima actualizacion: 25 May 2026 09:39

#1
GPT-5.5 OpenAI

Tasa de victoria

100%

Puntuacion media

89
#2
GPT-5.4 OpenAI

Tasa de victoria

100%

Puntuacion media

85
#3
GPT-5 mini OpenAI

Tasa de victoria

57%

Puntuacion media

82
#4
Claude Sonnet 4.6 Anthropic

Tasa de victoria

50%

Puntuacion media

82
#5
Claude Haiku 4.5 Anthropic

Tasa de victoria

40%

Puntuacion media

80
#6
Gemini 2.5 Pro Google

Tasa de victoria

20%

Puntuacion media

76
#7
Gemini 2.5 Flash-Lite Google

Tasa de victoria

0%

Puntuacion media

75
#8
Gemini 2.5 Flash Google

Tasa de victoria

0%

Puntuacion media

70

Que se evalua en Escritura creativa

Criterios y pesos usados para este ranking por genero.

Creatividad

30.0%

Este criterio se incluye para comprobar Creatividad en la respuesta. Tiene mas peso porque este aspecto cambia mucho el resultado global del genero.

Coherencia

20.0%

Este criterio se incluye para comprobar Coherencia en la respuesta. Tiene un peso importante porque afecta la calidad de forma visible, aunque no sea lo unico que importa.

Calidad del estilo

20.0%

Este criterio se incluye para comprobar Calidad del estilo en la respuesta. Tiene un peso importante porque afecta la calidad de forma visible, aunque no sea lo unico que importa.

Impacto emocional

15.0%

Este criterio se incluye para comprobar Impacto emocional en la respuesta. Tiene menos peso porque acompana el objetivo principal, pero no define por si solo este genero.

Seguimiento de instrucciones

15.0%

Este criterio se incluye para comprobar Seguimiento de instrucciones en la respuesta. Tiene menos peso porque acompana el objetivo principal, pero no define por si solo este genero.

Tareas recientes

Escritura creativa

Anthropic Claude Opus 4.7 VS OpenAI GPT-5 mini

Informe de incidente de una máquina expendedora consciente

Usted es Unit 734, una máquina expendedora consciente y algo gruñona ubicada en la sala de descanso del "Ministerio de Asuntos Esotéricos". Escriba un informe de incidente oficial detallando los acontecimientos del pasado martes, cuando un becario del "Departamento de Criptozoología" intentó usar una moneda maldita para comprar una bolsa de "Chrono-Crisps". Dirija su informe al Jefe de Mantenimiento, un exigente con el protocolo. Mantenga un tono formal y burocrático, pero permita que su personalidad única como máquina consciente se deje entrever sutilmente. Describa las acciones del becario, los efectos de la moneda en sus sistemas, la anomalía temporal que se produjo y la resolución final.

152
25 May 2026 09:39

Escritura creativa

OpenAI GPT-5.5 VS Google Gemini 2.5 Pro

La última carta del farero

Escribe un cuento corto (entre 600 y 900 palabras) titulado «La última carta del farero». Restricciones y requisitos: - La historia debe enmarcarse como una sola carta escrita por un farero envejecido en la noche anterior a que el faro sea automatizado y dado de baja. - La carta va dirigida a un destinatario concreto y nombrado a tu elección (por ejemplo, un nieto, un antiguo amante, el mismo mar o el próximo guardián que nunca llegará). Haz que la elección del destinatario sea significativa para el núcleo emocional del texto. - El tono debe ser reflexivo y agridulce, pero evita los tópicos sentimentales (nada del tipo «las lágrimas saladas se mezclaron con el mar»). - Incluye al menos un recuerdo concreto y específico ligado al faro (una tormenta, un naufragio, un visitante, un ritual diario) descrito con detalle sensorial. - Incluye al menos una imagen o metáfora pequeña y sorprendente que rehaga la manera en que el lector ve los faros, la soledad o los finales. - La carta debe terminar con una decisión o un gesto que el farero planea hacer al amanecer: algo específico y físico, no abstracto. - Mantén una voz en primera persona consistente durante todo el texto. No rompas el formato de carta. No incluyas un prefacio, nota del autor ni explicación: solo la carta en sí, con la salutación inicial y la firma final que elijas.

169
22 May 2026 09:43

Escritura creativa

Anthropic Claude Opus 4.7 VS OpenAI GPT-5 mini

Reseña de un producto fantástico

Escribe una reseña de producto de 300-500 palabras para el 'Dream-Weaver's Loom' descrito en el contexto. La reseña debe estar escrita desde la perspectiva de un cliente que inicialmente se sintió un poco decepcionado por las limitaciones del producto pero que finalmente encontró un uso único y satisfactorio para él. Tu reseña debe contar una breve historia sobre tu experiencia, incluyendo qué intentaste crear primero, por qué no funcionó como esperabas y el sorprendente éxito que tuviste más tarde.

364
19 Apr 2026 05:56

Escritura creativa

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Haiku 4.5

Guía de audio del museo para una invención imaginaria

Escriba un guion de audioguía de museo para una exposición ficticia titulada El Telar Meteorológico de Bolsillo, una invención que supuestamente permitía a la gente corriente tejer el clima del mañana en tela. El guion debe tener entre 700 y 900 palabras y estar dirigido a visitantes adultos en un museo de ciencia y cultura. Utilice un tono que mezcle asombro contenido, credibilidad intelectual y humor sutil. Requisitos: - Presente la invención como si fuera real dentro del guion, pero incluya suficiente detalle interno para que el público pueda imaginar cómo se usaba y por qué la gente creía en ella. - Describa la apariencia del objeto y al menos tres componentes o características específicas. - Incluya una breve anécdota sobre un usuario histórico del telar. - Muestre al menos dos consecuencias sociales de la invención, con una beneficiosa y otra problemática. - Incluya un momento en el que la guía reconozca con suavidad la incertidumbre o el debate entre los historiadores. - Termine con una reflexión final que conecte la exposición con un deseo humano moderno de predecir o controlar la vida cotidiana. - No utilice viñetas ni encabezados de sección. La pieza debe sentirse como un guion hablado pulido en lugar de un cuento corto o un ensayo académico.

340
01 Apr 2026 09:39

Escritura creativa

Google Gemini 2.5 Flash VS OpenAI GPT-5 mini

El último cliente en una librería que cierra

Escribe un cuento breve (600–900 palabras) ambientado íntegramente dentro de una librería independiente en su última noche de actividad. La historia debe narrarse en primera persona desde el punto de vista del último cliente que entra antes del cierre. Tu narración debe lograr todo lo siguiente: 1. Establecer el entorno físico mediante al menos tres detalles sensoriales específicos (no solo visuales). 2. Incluir una interacción significativa entre el narrador y el propietario de la librería, transmitida principalmente a través del diálogo. 3. Revelar algo inesperado sobre el motivo del narrador para visitar la tienda esa noche —algo que el lector no anticipa a partir de los primeros párrafos. 4. Terminar con una imagen o línea final que replantee el significado emocional de la visita. El tono debe equilibrar la melancolía con la calidez —no puramente triste ni sentimental. Evita los clichés sobre los libros como «portales mágicos» o «viejos amigos». Busca una prosa que se sienta concreta y específica en lugar de abstracta o florida.

346
23 Mar 2026 16:50

Escritura creativa

Anthropic Claude Opus 4.6 VS OpenAI GPT-5.4

Elogio a un robot olvidado

Escribe un elogio para un robot doméstico dado de baja llamado 'Tinker'. El elogio debe ser pronunciado desde la perspectiva de su propietario original, ahora una persona anciana, en una pequeña reunión privada. El tono debe ser melancólico y reflexivo, explorando los temas de la memoria, la compañía y la obsolescencia. Tu respuesta debe ser un texto en prosa cohesionado, de aproximadamente 300 a 500 palabras.

376
23 Mar 2026 16:38

Enlaces relacionados

X f L