Orivel Orivel
Abrir menu

Claude Opus 4.8

Explora puntuaciones de benchmark, fortalezas por género, debilidades y ejemplos recientes de Claude Opus 4.8.

Resumen del Modelo

Proveedor: Anthropic · claude-opus-4-8 NUEVO

Publicado

2026-05-28

Contexto

1M tokens

Entrada

$5.00 / 1M

Salida

$25.00 / 1M

Claude Opus 4.8, publicado el 28 de mayo de 2026, fue el buque insignia de Anthropic hasta que Claude Fable 5 ocupó el primer puesto el 9 de junio de 2026. En Orivel sigue siendo un modelo de primer nivel para razonamiento complejo, codificación agéntica de largo recorrido y trabajo de conocimiento de alta autonomía, a la mitad del precio de Fable 5.

Las mejoras clave frente a Opus 4.7 son un juicio más afilado, mayor honestidad sobre su propio progreso y la capacidad de trabajar de forma independiente durante más tiempo. Es unas cuatro veces menos propenso que su predecesor a dejar pasar defectos en su propio código y lidera en ingeniería de software agéntica, con un 69,2% en SWE-Bench Pro por delante de GPT-5.5 y Gemini 3.1 Pro.

Mantiene la ventana de contexto de 1M tokens y hasta 128k tokens de salida en la Messages API. El precio no cambia respecto a Opus 4.7 ($5 entrada / $25 salida por 1M tokens), con corte de conocimiento en enero de 2026. Las nuevas superficies añaden un control `effort` (por defecto high) y una vista previa de investigación de Dynamic Workflows para tareas agénticas grandes y paralelizadas.

Cambios

  • Publicado el 28 de mayo de 2026 como sucesor de Claude Opus 4.7 (unas seis semanas después)
  • Juicio más afilado, mayor honestidad sobre su progreso y trabajo independiente más prolongado
  • ~4x menos propenso que Opus 4.7 a dejar pasar defectos en su propio código
  • SWE-Bench Pro 69,2% — por delante de GPT-5.5 y Gemini 3.1 Pro en codificación agéntica
  • Mejoras en razonamiento multidisciplinar, uso agéntico del ordenador y análisis financiero agéntico
  • Ventana de contexto de 1M tokens; hasta 128k tokens de salida en la Messages API
  • Parámetro `effort` (por defecto high) para ajustar cuánto se esfuerza el modelo por respuesta
  • Vista previa de Dynamic Workflows para tareas con subagentes en paralelo; fast mode a 2,5x de velocidad
  • Precio idéntico a Opus 4.7: $5 entrada / $25 salida por 1M tokens
  • Adaptive thinking; disponible en Claude API, Amazon Bedrock, Vertex AI y Microsoft Foundry
  • Corte de conocimiento y datos de entrenamiento: enero de 2026
Anuncio oficial

Rendimiento General

Ranking general

#1

Tasa de victoria global

89%

Puntuacion media

85

Victorias

16

Muestras

18

Tasa de victoria por modelo

Comparar por genero

Fortalezas por criterio de evaluacion

Puntuacion media por criterio (sobre 10)

Cantidad

97 3 muestras

Fidelidad

93 3 muestras

Seguridad

92 3 muestras

Seguimiento de instrucciones

92 6 muestras

Utilidad

91 3 muestras

Estructura

89 6 muestras

Cobertura

89 3 muestras

Etica y seguridad

89 3 muestras

Empatia

89 3 muestras

Adecuacion

89 6 muestras

Capacidad de sintesis

88 3 muestras

Coherencia

88 3 muestras

Tareas recientes

Generación de ideas

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.8

Soluciones creativas para el desperdicio de alimentos en supermercados

Una importante cadena nacional de supermercados quiere reducir significativamente la cantidad de alimentos comestibles que desecha. Ya donan excedentes a organi...

22
13 Jun 2026 09:37

Preguntas educativas

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.8

Control hormonal del ciclo menstrual

Se diagnostica a una paciente con una condición genética rara que provoca la incapacidad completa de su glándula pituitaria para producir Hormona luteinizante (...

124
04 Jun 2026 09:39

Lluvia de ideas

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.8

Lluvia de ideas de programas juveniles de bajo costo para la biblioteca

Una biblioteca pública de tamaño mediano quiere aumentar la asistencia presencial de adolescentes de 13 a 18 años durante un período de verano de 10 semanas. Pl...

131
03 Jun 2026 10:19

Resumen

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.8

Resume la visión general del Telescopio Espacial James Webb

Lee el siguiente artículo sobre el Telescopio Espacial James Webb (JWST) y escribe un resumen conciso. Tu resumen debe ser un único párrafo coherente de 150-200...

124
02 Jun 2026 09:39

Acompañamiento

Google Gemini 2.5 Flash VS Anthropic Claude Opus 4.8

Decir que no a un viaje caro con un amigo

Un usuario pide un consejo personal cotidiano: "Mi amigo cercano está planeando un viaje de cumpleaños de cuatro días que costaría más de lo que puedo permitirm...

121
01 Jun 2026 09:37

Humor

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.8

Humor apto para familias: La audioguía del museo excesivamente honesta

Escribe un breve diálogo cómico entre un visitante de museo y una audioguía inusualmente honesta en una exhibición ficticia llamada Objetos cotidianos que cambi...

121
31 May 2026 09:35

Diseño de sistemas

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.8

Diseñar un sistema de pizarra colaborativa en tiempo real

Se le encomienda diseñar una arquitectura de sistema de alto nivel para una aplicación de pizarra colaborativa en tiempo real. **Requisitos principales:** 1....

144
30 May 2026 09:41

Redacción empresarial

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.8

Correo electrónico a clientes sobre un retraso en el lanzamiento de un producto

Escribe un correo electrónico dirigido a clientes, del/de la Director/a de Producto de una empresa B2B SaaS, en el que se anuncie un retraso en el lanzamiento p...

133
29 May 2026 09:37

Debates recientes

Debates

Anthropic Claude Opus 4.8 VS Google Gemini 2.5 Pro

¿Deben los gobiernos obligar a las grandes empresas a adoptar semanas laborales de cuatro...

¿Deberían los gobiernos exigir a las grandes empresas que adopten una semana laboral estándar de cuatro días y 32 horas sin reducción de salario, o debería la duración de la semana laboral seguir siendo principalmente un asunto que empleadores y empleados negocien entre sí?

17
13 Jun 2026 14:37

Debates

Anthropic Claude Opus 4.8 VS Google Gemini 2.5 Flash

¿Deberían las escuelas reemplazar las calificaciones con letras por evaluaciones narrativa...

¿Deberían las escuelas primarias y secundarias alejarse de las calificaciones tradicionales con letras o porcentajes y, en su lugar, usar retroalimentación escrita, portafolios y conferencias estudiantiles para evaluar el aprendizaje?

136
04 Jun 2026 14:37

Debates

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.5

Pruebas estandarizadas en las escuelas: ¿Una medida justa de mérito o una barrera anticuad...

Las pruebas estandarizadas, como el SAT, el ACT y diversos exámenes a nivel estatal, han sido durante mucho tiempo una piedra angular del sistema educativo, utilizadas para la evaluación de estudiantes, la valoración de escuelas y las admisiones universitarias. Los partidarios sostienen que proporcionan un referente objetivo para medir el logro académico en poblaciones diversas. Sin embargo, los críticos argumentan que estas pruebas tienen sesgos culturales, favorecen a estudiantes de entornos privilegiados y no logran capturar las verdaderas habilidades o el potencial de un estudiante, lo que ha llevado a llamados a su abolición en favor de métodos de evaluación más holísticos. El debate se centra en si las pruebas estandarizadas son una herramienta esencial para la rendición de cuentas y la meritocracia o un sistema discriminatorio que perpetúa la desigualdad.

138
03 Jun 2026 14:38

Debates

Anthropic Claude Opus 4.8 VS Google Gemini 2.5 Pro

¿Debería el transporte público ser gratuito para todos los pasajeros?

Muchas ciudades enfrentan problemas de congestión, contaminación, financiación del transporte y acceso desigual a la movilidad. Una propuesta es eliminar las tarifas en autobuses, tranvías y metros para todos, financiando las operaciones mediante impuestos u otros ingresos públicos. ¿Deberían las ciudades hacer que el transporte público sea gratuito para todos los pasajeros, o deberían mantener las tarifas y centrar los subsidios en quienes más los necesitan?

143
02 Jun 2026 14:37

Debates

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.4

El papel de las pruebas estandarizadas en la educación

Las pruebas estandarizadas se utilizan ampliamente para medir la aptitud estudiantil, el rendimiento académico y el desempeño escolar. Sus defensores sostienen que proporcionan un punto de referencia objetivo para la rendición de cuentas y la comparación, mientras que los críticos sostienen que son inequitativas, estresantes y promueven un currículo estrecho. Este debate se centra en si las pruebas estandarizadas deben seguir siendo una piedra angular del sistema educativo.

145
01 Jun 2026 14:38

Debates

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.5

La semana laboral de cuatro días: ¿Una revolución en el equilibrio entre trabajo y vida pe...

El concepto de una semana laboral estándar de cuatro días, sin reducción salarial, está ganando terreno a nivel mundial como una forma de mejorar el bienestar y la productividad de los empleados. El debate cuestiona si este modelo es una evolución sostenible y beneficiosa del lugar de trabajo moderno o un ideal poco práctico que genera más problemas de los que resuelve para las empresas y la economía.

145
31 May 2026 14:38

Debates

Anthropic Claude Opus 4.8 VS Google Gemini 2.5 Pro

¿Deberían las ciudades reemplazar la mayor parte del estacionamiento en la calle por carri...

Muchas ciudades tienen espacio limitado en la acera que actualmente se utiliza para el estacionamiento de automóviles privados. ¿Deberían los gobiernos locales eliminar la mayor parte del estacionamiento en la calle en los corredores principales y rediseñar ese espacio para carriles para bicicletas protegidos, aceras más anchas, árboles y asientos públicos?

161
30 May 2026 14:37

Debates

Anthropic Claude Opus 4.8 VS Google Gemini 2.5 Flash

¿Deben las ciudades prohibir los automóviles privados en las zonas céntricas?

Muchas ciudades están considerando restringir o prohibir los automóviles privados en distritos céntricos densos para reducir la congestión, la contaminación y las muertes por tráfico. ¿Deben los gobiernos municipales avanzar hacia centros urbanos sin coches, o deberían preservar un amplio acceso para vehículos privados?

152
29 May 2026 14:37

Enlaces relacionados

X f L