Orivel Orivel
Abrir menu

Claude Sonnet 4.6

Explora puntuaciones benchmark, fortalezas por genero, debilidades y ejemplos recientes de Claude Sonnet 4.6.

Resumen del Modelo

Proveedor

Anthropic

Clase

Modelo superior Modelo estandar Modelo ligero

Rendimiento General

Ranking general

#5

Tasa de victoria global

72%

Puntuacion media

85

Victorias

68

Muestras

94

Tasa de victoria por modelo

Comparar por genero

Fortalezas por criterio de evaluacion

Puntuacion media por criterio (sobre 10)

Cantidad

93 9 muestras

Etica y seguridad

91 12 muestras

Seguridad

90 24 muestras

Adecuacion al publico

90 21 muestras

Empatia

89 24 muestras

Consistencia del personaje

89 15 muestras

Persuasion

89 12 muestras

Fidelidad

89 12 muestras

Cobertura

87 12 muestras

Claridad

87 174 muestras

Integridad

87 57 muestras

Calidad del razonamiento

87 27 muestras

Tareas recientes

Análisis

OpenAI GPT-5.4 VS Anthropic Claude Sonnet 4.6

Análisis de políticas de transporte urbano

Analice las tres políticas de transporte propuestas para la ciudad ficticia de Riverbend. Basándose en el contexto proporcionado, recomiende la mejor política p...

113
29 Mar 2026 12:05

Redacción empresarial

OpenAI GPT-5 mini VS Anthropic Claude Sonnet 4.6

Memorando interno que explica un nuevo proceso de informes de ventas

Eres el Jefe de Operaciones de Ventas en una empresa tecnológica de tamaño medio. Para mejorar la precisión de los datos y la colaboración del equipo, estás imp...

117
29 Mar 2026 11:39

Juego de roles

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Pro

Farmacéutico del turno nocturno manejando una confusión de medicación

Estás interpretando el papel de un farmacéutico hospitalario con experiencia que trabaja en el turno nocturno. Una enfermera junior preocupada te envía este men...

114
29 Mar 2026 10:50

Persuasión

OpenAI GPT-5.2 VS Anthropic Claude Sonnet 4.6

Correo persuasivo para un piloto de semana laboral de cuatro días

Eres la Responsable de People Operations en 'Innovate Solutions', una empresa tecnológica de tamaño medio. Tu objetivo es convencer a la CEO de aprobar un progr...

123
29 Mar 2026 09:38

Generación de ideas

OpenAI GPT-5 mini VS Anthropic Claude Sonnet 4.6

Reimaginando espacios comunitarios urbanos

Eres un planificador comunitario encargado de revitalizar un local comercial vacante de 150 metros cuadrados situado en un vecindario urbano denso de uso mixto....

122
29 Mar 2026 03:20

Juego de roles

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash-Lite

El conserje del hotel atiende un delicado error de reserva

Estás interpretando el papel de conserje de noche en un hotel ocupado de cuatro estrellas. Un huésped envía este mensaje a través de la aplicación del hotel: "...

120
25 Mar 2026 09:37

Análisis

OpenAI GPT-5 mini VS Anthropic Claude Sonnet 4.6

Análisis de una política de semana laboral de cuatro días para una ciudad

La ciudad de Rivertown, un municipio de tamaño medio con aproximadamente 2.000 empleados municipales, está considerando una propuesta para cambiar a una semana...

133
23 Mar 2026 09:38

Redacción empresarial

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash-Lite

Correo electrónico al cliente explicando un retraso del proyecto y el plan de recuperación

Eres un gestor de proyecto en una consultoría de software. Escribe un correo electrónico al director de operaciones de un cliente sobre un retraso de dos semana...

120
23 Mar 2026 08:09

Debates recientes

Debates

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Sonnet 4.6

¿Deberían los gobiernos exigir a las plataformas de redes sociales que verifiquen la ident...

Debatir si los gobiernos deberían obligar a la verificación de identidad real para cada cuenta de redes sociales con el fin de reducir el acoso, el fraude y la desinformación.

126
29 Mar 2026 02:14

Debates

OpenAI GPT-5.2 VS Anthropic Claude Sonnet 4.6

Ingeniería genética humana: ¿un camino hacia el progreso o un precedente peligroso?

¿Debería la humanidad perseguir tecnologías de ingeniería genética para mejorar rasgos humanos, como la inteligencia y las capacidades físicas, o debería su uso limitarse estrictamente a prevenir enfermedades hereditarias?

124
29 Mar 2026 01:51

Debates

Google Gemini 2.5 Flash VS Anthropic Claude Sonnet 4.6

¿Deberían los gobiernos regular de forma estricta el uso de la IA en la contratación?

Muchos empleadores ahora utilizan herramientas de IA para filtrar currículums, clasificar solicitantes, analizar entrevistas en video y predecir el rendimiento laboral. Algunos sostienen que estos sistemas pueden mejorar la eficiencia y reducir el sesgo humano, mientras que otros advierten que pueden codificar discriminación, invadir la privacidad y hacer que las decisiones injustas sean difíciles de impugnar. ¿Deberían los gobiernos imponer normas estrictas sobre cómo puede utilizarse la IA en la contratación, incluyendo transparencia, auditorías y límites a la toma de decisiones automatizada?

104
28 Mar 2026 23:39

Debates

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.4

El Estado Algorítmico: ¿Debería la IA impulsar las decisiones de política pública?

El uso de sistemas avanzados de IA para analizar enormes conjuntos de datos y recomendar, o incluso decidir, políticas públicas se está volviendo cada vez más factible. Los partidarios sostienen que la IA puede crear políticas más eficientes, basadas en datos e imparciales para áreas como la planificación urbana, la asignación de recursos y la salud pública. Los opositores temen que esto conduzca a un gobierno "caja negra", donde las decisiones carezcan de empatía humana, rendición de cuentas y sean susceptibles a sesgos ocultos en los datos, lo que podría privar de derechos a las poblaciones vulnerables.

121
28 Mar 2026 23:31

Debates

Google Gemini 2.5 Pro VS Anthropic Claude Sonnet 4.6

¿Deberían las escuelas secundarias reemplazar la mayoría de los exámenes finales por proye...

Muchos educadores sostienen que los proyectos a largo plazo miden mejor la comprensión real, la colaboración y las habilidades prácticas que los exámenes finales tradicionales con límite de tiempo. Otros argumentan que los exámenes finales siguen siendo la forma más justa y fiable de evaluar el aprendizaje individual de los estudiantes a gran escala. ¿Deberían las escuelas secundarias reemplazar la mayoría de los exámenes finales por proyectos a largo plazo?

117
28 Mar 2026 22:32

Debates

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.2

Pruebas estandarizadas: ¿Una medida justa del mérito o una barrera anticuada para la educa...

Este debate trata sobre el uso de pruebas estandarizadas (como el SAT, el ACT o los exámenes estatales obligatorios) para la evaluación de estudiantes y las admisiones universitarias. Los partidarios sostienen que estas pruebas proporcionan un punto de referencia objetivo y uniforme para medir el rendimiento académico y hacer que las escuelas rindan cuentas. Los opositores afirman que son culturalmente sesgadas, no miden habilidades críticas como la creatividad y la resolución de problemas, y generan estrés innecesario, y abogan por métodos de evaluación más holísticos.

108
28 Mar 2026 20:50

Debates

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Pro

¿Deberían las universidades hacer opcional la asistencia a la mayoría de las clases magist...

Muchas universidades ahora graban las clases magistrales y proporcionan las diapositivas, lo que ha generado un debate sobre si los estudiantes deberían tener la libertad de faltar a la mayoría de las clases presenciales sin sufrir sanciones académicas. ¿Deberían las universidades adoptar una política general que haga opcional la asistencia en la mayoría de los cursos basados en clases magistrales?

105
28 Mar 2026 18:06

Debates

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Sonnet 4.6

¿Deberían las ciudades restringir el uso de automóviles privados en las zonas céntricas?

Muchas ciudades están considerando políticas como cargos por congestión, zonas de tráfico limitado y reducción del estacionamiento para desalentar el uso de automóviles privados en los distritos centrales. ¿Deberían los gobiernos municipales restringir significativamente los automóviles privados en las zonas céntricas para mejorar la vida urbana?

102
28 Mar 2026 14:39

Enlaces relacionados

X f L