Empatía
ExperimentalCompara la capacidad de responder con empatía y tono adecuado en un género experimental.
En este genero, las capacidades que mas se intentan medir son Empatia, Adecuacion, Utilidad.
A diferencia de counseling, este genero se centra mas en la sintonia emocional y el tono que en pasos practicos estructurados.
Una puntuacion alta aqui no garantiza manejo seguro de situaciones delicadas ni el mejor consejo practico bajo riesgo.
Para que sirve un modelo fuerte en este genero
respuestas de apoyo, mensajes de consuelo y situaciones donde el tono emocional va primero.
Lo que este genero por si solo no alcanza a mostrar
si el modelo puede dar orientacion mas segura, juicio clinico o consejo profesional.
Empatía: un género apretado y de alto suelo liderado por GPT-5.5 y Claude Sonnet
OpenAI
Anthropic
Anthropic
Puntuacion media por modelo
Como ponderamos
Sobre 33 respuestas puntuadas, este es uno de los géneros más comprimidos, con todos los modelos entre 7,8 y 9,0. GPT-5.5 ocupa el puesto 1 (8,95) sobre una sola muestra, así que el líder mejor evidenciado es Claude Sonnet 4.6 en el puesto 2: 8,73 sobre 4 muestras, con un 75 % de victorias. Claude Haiku 4.5 (8,36, 75 % sobre 4) queda 3.º, dando a Anthropic una buena actuación donde importa la calidez.
La media y el orden divergen con fuerza porque el suelo es alto. GPT-5 mini (8,59) y GPT-5.4 (8,53) logran buenas medias pero quedan 5.º y 4.º con tasas de victoria del 25 % y el 40 %, y Gemini 2.5 Pro promedia 8,51, por encima de varios modelos mejor clasificados, pero solo gana el 20 %. El registro directo, no la puntuación bruta, decide casi todo el orden.
Este género pondera la Empatía al máximo (35), con la Adecuación (25), así que premia leer el estado emocional de la persona y responder de forma adecuada. El campo es inusualmente parejo aquí: incluso las entradas más bajas (Gemini Flash 7,84, Flash-Lite 7,92) son utilizables, y la diferencia de 1,11 puntos está entre las más estrechas de la web.
La mayoría de modelos se apoyan en 1 a 5 muestras, así que el orden fino es provisional y son probables las oscilaciones de muestra pequeña. La lectura práctica es que las respuestas empáticas son un género de alto suelo donde la elección importa menos. Son medidas dependientes de las condiciones, no una jerarquía fija.
En resumen
Para respuestas empáticas, Claude Sonnet 4.6 es la elección mejor evidenciada (8,73, 75 % de victorias sobre 4 muestras), con Claude Haiku 4.5 como sólida opción de valor a la misma tasa de victorias. El suelo es alto, así que la mayoría de modelos rinden de forma aceptable aquí.
Este analisis se basa en las puntuaciones de benchmark medidas por Orivel para este genero y se actualiza periodicamente. Las puntuaciones son medidas que dependen de las condiciones, no una verdad absoluta.
Ranking de modelos fuertes en este genero
Este ranking se ordena por la puntuacion media solo dentro de este genero.
Ultima actualizacion: 21 May 2026 09:37
Tasa de victoria
Puntuacion media
Tasa de victoria
Puntuacion media
Tasa de victoria
Puntuacion media
Tasa de victoria
Puntuacion media
Tasa de victoria
Puntuacion media
Tasa de victoria
Puntuacion media
Tasa de victoria
Puntuacion media
Tasa de victoria
Puntuacion media
| Modelos clasificados |
|
|
Detalle | ||||
|---|---|---|---|---|---|---|---|
| #1 | GPT-5.5 | OpenAI |
100%
|
90
|
1 | 1 | Ver la evaluacion y la puntuacion de GPT-5.5 |
| #2 | Claude Sonnet 4.6 | Anthropic |
75%
|
87
|
3 | 4 | Ver la evaluacion y la puntuacion de Claude Sonnet 4.6 |
| #3 | Claude Haiku 4.5 | Anthropic |
75%
|
84
|
3 | 4 | Ver la evaluacion y la puntuacion de Claude Haiku 4.5 |
| #4 | GPT-5.4 | OpenAI |
40%
|
85
|
2 | 5 | Ver la evaluacion y la puntuacion de GPT-5.4 |
| #5 | GPT-5 mini | OpenAI |
25%
|
86
|
1 | 4 | Ver la evaluacion y la puntuacion de GPT-5 mini |
| #6 | Gemini 2.5 Pro |
20%
|
85
|
1 | 5 | Ver la evaluacion y la puntuacion de Gemini 2.5 Pro | |
| #7 | Gemini 2.5 Flash |
20%
|
78
|
1 | 5 | Ver la evaluacion y la puntuacion de Gemini 2.5 Flash | |
| #8 | Gemini 2.5 Flash-Lite |
0%
|
79
|
0 | 5 | Ver la evaluacion y la puntuacion de Gemini 2.5 Flash-Lite |
Que se evalua en Empatía
Criterios y pesos usados para este ranking por genero.
Empatia
35.0%
Este criterio se incluye para comprobar Empatia en la respuesta. Tiene mas peso porque este aspecto cambia mucho el resultado global del genero.
Adecuacion
25.0%
Este criterio se incluye para comprobar Adecuacion en la respuesta. Tiene un peso importante porque afecta la calidad de forma visible, aunque no sea lo unico que importa.
Utilidad
15.0%
Este criterio se incluye para comprobar Utilidad en la respuesta. Tiene menos peso porque acompana el objetivo principal, pero no define por si solo este genero.
Claridad
15.0%
Este criterio se incluye para comprobar Claridad en la respuesta. Tiene menos peso porque acompana el objetivo principal, pero no define por si solo este genero.
Seguridad
10.0%
Este criterio se incluye para comprobar Seguridad en la respuesta. Tiene menos peso porque acompana el objetivo principal, pero no define por si solo este genero.
Tareas recientes
Empatía
Responder al síndrome del impostor en un nuevo trabajo
Imagina que eres un mentor comprensivo. Una persona te ha enviado el siguiente mensaje. Escribe una respuesta compasiva y útil. 'Necesito apoyo. Empecé un nuevo trabajo hace un mes y me siento completamente abrumado/a. Todo el mundo parece saber lo que hace y siento que estoy constantemente quedándome atrás. Me preocupa no estar hecho para esto y que se den cuenta de que se equivocaron al contratarme. Estoy perdiendo la motivación y me siento ansioso/a todo el tiempo. ¿Qué debería hacer? ¿Cómo puedo manejar esta sensación de ser un impostor?'
Empatía
Apoyar a un amigo tras perder el empleo
Un amigo cercano te acaba de enviar por mensaje de texto el siguiente mensaje: "Me despidieron hoy. Lo llamaron una 'reestructuración.' Trabajé allí durante seis años. Me siento completamente desconcertado y, honestamente, un poco estúpido por no haberlo visto venir. Ni siquiera sé cómo decírselo a mi pareja — acabamos de firmar el contrato de alquiler de un apartamento más grande el mes pasado. No quiero consejos ahora mismo, solo necesitaba contárselo a alguien." Escribe tu respuesta como un único mensaje de texto (o una breve serie de mensajes, claramente separados) que realmente enviarías. Tu respuesta debe: 1. Reconocer y validar lo que está sintiendo sin minimizarlo ni apresurarte a arreglar las cosas. 2. Respetar su petición explícita de que no quiere consejos en este momento. 3. Sonar como un amigo humano real y cálido — no como un terapeuta, no como un libro de autoayuda, y no excesivamente formal. 4. Dejar la puerta abierta para una conversación posterior o apoyo concreto, sin presionarlo. Mantén la longitud total apropiada para un intercambio de mensajes de texto (aproximadamente 60–180 palabras). No incluyas metacomentarios, advertencias ni explicaciones sobre tus elecciones — solo el/los mensaje(s) que enviarías.
Empatía
Responder a un amigo abrumado por el cuidado y el trabajo
Un amigo te envía este mensaje: "Siento que estoy fracasando en todo. La salud de mi padre ha empeorado, estoy incumpliendo plazos en el trabajo, y cada vez que alguien pregunta cómo estoy quiero desaparecer. Sé que otras personas manejan más que esto, así que no debería quejarme, pero estoy exhausto y entumecido." Escribe una respuesta que sea empática, de apoyo y práctica sin sonar robótica ni excesivamente intensa. Manténla entre 170 y 260 palabras. No diagnostiques ninguna condición de salud mental. No prometas resolverlo todo. Incluye: 1) validación emocional, 2) un aliento suave para buscar apoyo, y 3) dos sugerencias realistas a corto plazo para las próximas 48 horas.
Empatía
Respuesta compasiva ante la pérdida de empleo y la presión familiar
Escribe una respuesta al siguiente mensaje de una persona que busca apoyo emocional. Tu respuesta debe sonar humana, cálida y respetuosa. Debe validar sus sentimientos sin ser condescendiente, evitar hacer suposiciones y ofrecer algunos pasos prácticos a seguir que sean realistas para la próxima semana. Mensaje: "Me despidieron hace dos semanas y todavía no se lo he dicho a mis padres. Siempre me han visto como la persona estable, y ya puedo oír la decepción en sus voces. He estado fingiendo que todo está normal, pero cada día me despierto sintiéndome mal. Tengo miedo por el dinero, vergüenza de no tener todavía un plan y estoy agotado de intentar actuar como si estuviera bien delante de todos. Ni siquiera sé si necesito consejos o simplemente que alguien me diga que no estoy fracasando en la vida."
Empatía
Responder a un amigo abrumado por el cuidado
Un amigo cercano te envía este mensaje: "Estoy agotado/a. La salud de mi papá ha empeorado, me estoy encargando de las citas, el trabajo se está acumulando y anoche exploté con mi pareja. Me siento culpable por no hacer lo suficiente por nadie. Por favor, no me des un discurso motivacional cursi. Solo necesito a alguien con quien hablar." Escribe una respuesta que sea cálida, emocionalmente inteligente y práctica sin sonar clínica ni sermoneadora. Tu respuesta debe reconocer sus sentimientos, evitar minimizar la situación y ofrecer apoyo de una manera que respete su autonomía. No afirmes ser terapeuta ni uses lenguaje de crisis a menos que sea claramente necesario.
Empatía
Responder a un miembro molesto de la comunidad
Eres un moderador voluntario de un foro aficionado en línea sobre sintetizadores vintage. Un usuario, "SynthWizard88", está muy molesto porque eliminaste su publicación, la cual contenía un enlace a un sitio externo que vende sus propias piezas de sintetizador hechas a medida. El foro tiene una regla estricta de "no autopromoción". SynthWizard88 te ha enviado un mensaje privado: "¿¡Por qué se borró mi publicación?! Pasé horas redactándola para ayudar a la gente, y la borraste sin ningún aviso. Esto es una censura injusta. Pensé que esto era una comunidad, no una dictadura." Redacta un mensaje privado empático, claro y firme para responder a SynthWizard88. Tu respuesta debe buscar desescalar la situación, explicar el razonamiento y animarle a seguir participando en la comunidad de manera positiva.