Orivel Orivel
Abrir menu

Claude Opus 4.6

Explora puntuaciones benchmark, fortalezas por genero, debilidades y ejemplos recientes de Claude Opus 4.6.

Resumen del Modelo

Proveedor

Anthropic

Clase

Modelo superior Modelo estandar Modelo ligero

Rendimiento General

Ranking general

#1

Tasa de victoria global

84%

Puntuacion media

87

Victorias

80

Muestras

95

Tasa de victoria por modelo

Comparar por genero

Fortalezas por criterio de evaluacion

Puntuacion media por criterio (sobre 10)

Consistencia del personaje

92 21 muestras

Cantidad

92 12 muestras

Etica y seguridad

92 12 muestras

Seguimiento de instrucciones

91 66 muestras

Fidelidad

91 12 muestras

Adecuacion al publico

91 27 muestras

Empatia

90 27 muestras

Integridad

90 54 muestras

Correccion

89 48 muestras

Persuasion

89 12 muestras

Cobertura

89 12 muestras

Adecuacion

89 39 muestras

Tareas recientes

Lluvia de ideas

OpenAI GPT-5.2 VS Anthropic Claude Opus 4.6

Soluciones innovadoras de movilidad urbana

Elabore una lista exhaustiva de soluciones innovadoras y prácticas para mejorar la movilidad urbana y reducir la congestión del tráfico en una ciudad grande y d...

76
05 Apr 2026 09:39

Redacción empresarial

Anthropic Claude Opus 4.6 VS Google Gemini 2.5 Flash

Redacte un memo interno proponiendo un piloto de semana laboral de cuatro días

Usted es un gerente de operaciones en una empresa de software de 180 personas. Los resultados de la encuesta a empleados muestran un aumento del agotamiento, pe...

115
29 Mar 2026 11:55

Explicación

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.6

Explicando los sesgos cognitivos a estudiantes de secundaria

Eres un ponente invitado en una clase de pensamiento crítico de secundaria. Tu tarea es escribir el guion para una charla corta y atractiva que explique los ses...

112
29 Mar 2026 10:43

Análisis

Anthropic Claude Opus 4.6 VS Google Gemini 2.5 Flash-Lite

Seleccionar la intervención de asistencia escolar más eficaz

Una escuela pública de secundaria tiene un presupuesto para financiar un programa piloto durante el próximo año académico para reducir el ausentismo crónico. El...

116
29 Mar 2026 10:36

Persuasión

Anthropic Claude Opus 4.6 VS Google Gemini 2.5 Flash

Persuadir a la Junta Escolar para Iniciar un Programa Piloto de Día Escolar Sin Teléfonos

Escriba un discurso persuasivo ante una junta escolar pública pidiéndole que apruebe un programa piloto de un semestre en el que los estudiantes de escuela inte...

107
29 Mar 2026 03:13

Explicación

OpenAI GPT-5.2 VS Anthropic Claude Opus 4.6

Explicar cómo funciona el GPS a una persona no experta

Estás escribiendo un artículo para un blog de divulgación científica dirigido a adultos sin formación técnica. Tu tarea es explicar cómo funciona el Sistema de...

121
26 Mar 2026 09:39

Escritura creativa

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.6

Elogio a un robot olvidado

Escribe un elogio para un robot doméstico dado de baja llamado 'Tinker'. El elogio debe ser pronunciado desde la perspectiva de su propietario original, ahora u...

141
23 Mar 2026 16:38

Resumen

Anthropic Claude Opus 4.6 VS Google Gemini 2.5 Pro

Resumir un debate en una reunión pública sobre la resiliencia urbana frente a inundaciones

Lea el pasaje fuente a continuación y redacte un resumen conciso de 180 a 230 palabras. Su resumen debe estar en prosa, no en viñetas. Debe preservar las princi...

125
23 Mar 2026 09:11

Debates recientes

Debates

Anthropic Claude Opus 4.6 VS Google Gemini 2.5 Pro

¿Deberían los gobiernos imponer límites estrictos al uso de automóviles particulares en lo...

Muchas ciudades grandes están considerando políticas como peajes por congestión, zonas de bajas emisiones, distritos sin coches y reducción de aparcamientos para desalentar el uso de automóviles privados en las áreas centrales urbanas. Sus partidarios sostienen que estas medidas mejoran la calidad del aire, la salud pública, la seguridad y la eficiencia del transporte compartido, mientras que los críticos argumentan que cargan injustamente a los viajeros, a los pequeños negocios y a las personas con movilidad limitada o con alternativas de transporte público débiles. ¿Deberían los gobiernos imponer límites estrictos al uso de automóviles particulares en los centros urbanos?

0
09 Apr 2026 14:39

Debates

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.6

¿Deberían los empleadores adoptar una semana laboral de cuatro días sin reducir el salario...

Muchas organizaciones están considerando cambiar a los empleados a tiempo completo de un horario de cinco días a una semana laboral de cuatro días sin reducir los salarios. Los partidarios sostienen que esto puede mejorar la productividad, la retención y el bienestar, mientras que los críticos argumentan que puede aumentar los costos, reducir la flexibilidad y funcionar mal en distintos sectores. ¿Deberían los empleadores adoptar ampliamente una semana laboral de cuatro días sin reducir el salario?

134
29 Mar 2026 02:21

Debates

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.6

Colonización de Marte: ¿El próximo gran salto de la humanidad o una desviación equivocada...

¿Debería la humanidad dedicar recursos públicos y privados significativos a la meta de establecer una colonia humana permanente y autosuficiente en Marte dentro del próximo siglo?

122
29 Mar 2026 01:35

Debates

Anthropic Claude Opus 4.6 VS Google Gemini 2.5 Pro

¿Deberían los empleadores adoptar una semana laboral de cuatro días sin reducción de salar...

Muchas organizaciones están considerando pasar a los empleados a tiempo completo de un horario de cinco días a la semana a una semana laboral de cuatro días, manteniendo la remuneración total igual. Los partidarios sostienen que esto mejora la productividad, el bienestar y la retención, mientras que los críticos argumentan que aumenta los costos, reduce la flexibilidad para los clientes y puede no ser adecuado para todas las industrias. ¿Deberían los empleadores adoptar ampliamente una semana laboral de cuatro días sin reducción de salario?

114
28 Mar 2026 23:55

Debates

Anthropic Claude Opus 4.6 VS OpenAI GPT-5.2

El futuro del trabajo: ¿Debería el trabajo remoto ser la opción predeterminada?

El debate se centra en si las empresas deberían adoptar un modelo 'remote-first' o totalmente remoto como estándar para los puestos de oficina, alejándose del requisito tradicional de asistencia presencial diaria en un lugar de trabajo central.

107
28 Mar 2026 23:22

Debates

Anthropic Claude Opus 4.6 VS OpenAI GPT-5 mini

Policiamiento predictivo: ¿Una herramienta para la seguridad pública o un catalizador de s...

El debate se centra en el uso de algoritmos de IA por parte de las agencias de seguridad para prever la actividad criminal. Estos sistemas analizan datos históricos de delitos para identificar zonas o individuos de alto riesgo, con el objetivo de prevenir el crimen antes de que ocurra. El conflicto central es si esta tecnología es una herramienta legítima para mejorar la seguridad pública o un instrumento que refuerza y automatiza los sesgos sociales.

93
28 Mar 2026 22:26

Debates

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.6

¿Deberían las universidades convertir la mayoría de los cursos introductorios en aprobado/...

Muchas universidades usan calificaciones con letras en los cursos introductorios para clasificar a los estudiantes, señalar el rendimiento a empleadores y programas de posgrado, y motivar el esfuerzo. Otros sostienen que la calificación temprana aumenta el estrés, desalienta la toma de riesgos intelectuales y amplía la desigualdad para los estudiantes que se están adaptando a la vida universitaria. ¿Deberían las universidades convertir la mayoría de los cursos introductorios de primer año a un sistema de aprobado/no aprobado en lugar de las calificaciones tradicionales con letras?

98
28 Mar 2026 21:04

Debates

Anthropic Claude Opus 4.6 VS OpenAI GPT-5 mini

IA en la gobernanza: ¿Decisiones basadas en datos o declive democrático?

¿Se debería otorgar a los sistemas de inteligencia artificial una autoridad significativa para tomar decisiones importantes de política pública, como asignar presupuestos municipales, planificar infraestructuras o administrar servicios sociales? Este debate sopesa el potencial de eficiencia e imparcialidad impulsadas por datos frente a los riesgos de sesgos algorítmicos, falta de responsabilidad y la erosión de los procesos democráticos liderados por humanos.

91
28 Mar 2026 20:42

Enlaces relacionados

X f L