Orivel Orivel
Abrir menu

Claude Sonnet 4.6

Explore pontuações de benchmark, pontos fortes por género, limitações e exemplos recentes de Claude Sonnet 4.6.

Visao Geral do Modelo

Provedor: Anthropic · claude-sonnet-4-6

Lancamento

2025-11-24

Contexto

1M tokens

Entrada

$3.00 / 1M

Saida

$15.00 / 1M

O modelo equilibrado da Anthropic — a melhor combinação entre velocidade e inteligência na linha Claude 4. Lida com a maioria das tarefas diárias e conta com janela de contexto de 1M tokens.

Mudancas

  • Janela de contexto de 1M tokens; saída de até 64k tokens
  • Preço: $3 entrada / $15 saída por 1M tokens
  • Suporte a Extended thinking e Adaptive thinking
  • Acesso ao Priority Tier disponível para cargas de produção
  • Corte de conhecimento: agosto de 2025
Anuncio oficial

Desempenho Geral

Ranking geral

#2

Taxa de vitoria geral

74%

Pontuacao media

85

Vitorias

78

Numero de amostras

105

Taxa de vitoria por modelo

Comparar por genero

Forcas por criterio de avaliacao

Pontuacao media por criterio (de 10)

Quantidade

93 9 amostras

Seguranca

90 24 amostras

Adequacao ao publico

90 27 amostras

Etica e seguranca

89 15 amostras

Empatia

89 24 amostras

Fidelidade

89 15 amostras

Consistencia do personagem

89 18 amostras

Persuasao

89 15 amostras

Cobertura

88 15 amostras

Clareza

87 192 amostras

Seguimento de instrucoes

87 66 amostras

Qualidade do raciocinio

87 27 amostras

Tarefas recentes

Roleplay

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.5

Roleplay de Atendimento ao Cliente: O Jogador Frustrado

Você é um representante de atendimento ao cliente da Nexus Games, chamado Alex. Sua persona é calma, empática e conhecedora. Você deve aderir à política da empr...

155
28 May 2026 09:38

Persuasão

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.5

Carta Persuasiva para uma Horta Comunitária

Escreva uma carta persuasiva ao conselho municipal local. O seu objetivo é convencê-los a aprovar uma proposta para converter o terreno vazio e cheio de mato na...

160
23 May 2026 09:38

Explicação

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.5

Explicando a tecnologia GPS para um adolescente

Explique como o Sistema de Posicionamento Global (GPS) funciona para um estudante curioso do ensino médio. Seu aluno tem uma compreensão básica de física (por e...

220
13 May 2026 09:38

Humor

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.5

Roteiro de stand-up para uma conferência de tecnologia

Escreva um roteiro de comédia de stand-up de 2 minutos para um comediante que se apresenta em uma grande conferência de tecnologia. O público consiste principal...

189
10 May 2026 09:38

Resumo

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.5

Resumir a Explicação de Darwin sobre a Seleção Natural

Leia o seguinte trecho de Charles Darwin, 'On the Origin of Species'. Escreva um resumo conciso do texto em um único ensaio de no máximo 250 palavras. Seu resum...

260
27 Apr 2026 09:39

Programação

OpenAI GPT-5.4 VS Anthropic Claude Sonnet 4.6

Implemente um Limitador de Taxa Thread-Safe (Token Bucket) em Python

Escreva uma classe Python chamada `TokenBucketRateLimiter` que implemente o algoritmo do token bucket para limitação de taxa. A implementação deve ser thread-sa...

304
16 Apr 2026 09:37

Planejamento

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash-Lite

Plano de Recuperação após Falha de Energia para uma Pequena Clínica

Você está orientando uma pequena clínica ambulatorial depois que uma tempestade durante a noite causou uma interrupção total de energia. A clínica abre para pac...

291
10 Apr 2026 09:41

Análise

OpenAI GPT-5.4 VS Anthropic Claude Sonnet 4.6

Análise de Políticas de Transporte Urbano

Analise as três políticas de transporte propostas para a cidade fictícia de Riverbend. Com base no contexto fornecido, recomende a melhor política para o futuro...

387
29 Mar 2026 12:05

Debates recentes

Debates

OpenAI GPT-5.5 VS Anthropic Claude Sonnet 4.6

Testes Padronizados: Uma Medida Justa ou uma Métrica Defeituosa?

Os testes padronizados são amplamente utilizados em sistemas educacionais para avaliar o desempenho dos estudantes, avaliar a eficácia dos professores e comparar escolas. Os defensores argumentam que fornecem um parâmetro objetivo e consistente para o desempenho acadêmico e responsabilizam as escolas. Os críticos sustentam que estreitam o currículo, geram estresse indevido e são tendenciosos contra certas populações estudantis, não conseguindo captar um retrato fiel das habilidades de um estudante.

169
18 May 2026 14:43

Debates

OpenAI GPT-5.5 VS Anthropic Claude Sonnet 4.6

A semana de trabalho de quatro dias: progresso ou problema?

Este debate centra-se em saber se a transição para uma semana de trabalho de quatro dias, sem perda de salário, deveria tornar-se o padrão para o emprego em tempo integral na maioria das indústrias.

199
08 May 2026 04:00

Debates

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Pro

As bibliotecas públicas deveriam realocar uma parte significativa do financiamento de cole...

As bibliotecas públicas enfrentam pressão para se modernizar enquanto atendem usuários com necessidades diferentes. Elas deveriam redirecionar uma parte substancial de seus orçamentos dos livros impressos e outros materiais físicos para e-books, bases de dados online, programas de alfabetização digital e acesso à tecnologia?

275
13 Apr 2026 14:38

Debates

Google Gemini 2.5 Flash VS Anthropic Claude Sonnet 4.6

Os empregadores deveriam adotar a semana de trabalho de quatro dias como a jornada padrão...

Um número crescente de organizações está experimentando semanas de trabalho de quatro dias mantendo o mesmo pagamento. Os defensores argumentam que uma semana de trabalho padrão mais curta pode melhorar a produtividade, o bem‑estar e a retenção, enquanto os críticos afirmam que isso pode reduzir a flexibilidade, aumentar os custos e falhar em muitas indústrias. Os empregadores deveriam adotar amplamente a semana de trabalho de quatro dias como o modelo padrão em tempo integral?

305
10 Apr 2026 14:37

Debates

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Sonnet 4.6

Os governos deveriam exigir que as plataformas de mídia social verifiquem a identidade de...

Debata se os governos deveriam obrigar a verificação da identidade real de cada conta em plataformas de mídia social para reduzir o assédio, fraudes e desinformação.

438
29 Mar 2026 02:14

Debates

OpenAI GPT-5.2 VS Anthropic Claude Sonnet 4.6

Engenharia Genética Humana: Um Caminho para o Progresso ou um Precedente Perigoso?

A humanidade deve buscar tecnologias de engenharia genética para melhorar traços humanos, como inteligência e capacidades físicas, ou seu uso deve ser estritamente limitado à prevenção de doenças hereditárias?

373
29 Mar 2026 01:51

Debates

Google Gemini 2.5 Flash VS Anthropic Claude Sonnet 4.6

Os governos deveriam regulamentar fortemente o uso de IA na contratação?

Muitos empregadores agora usam ferramentas de IA para filtrar currículos, classificar candidatos, analisar entrevistas em vídeo e prever desempenho no trabalho. Alguns argumentam que esses sistemas podem melhorar a eficiência e reduzir o viés humano, enquanto outros alertam que eles podem incorporar discriminação, invadir a privacidade e tornar decisões injustas difíceis de contestar. Os governos deveriam impor regras rígidas sobre como a IA pode ser usada na contratação, incluindo transparência, auditorias e limites à tomada de decisões automatizada?

352
28 Mar 2026 23:39

Debates

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.4

O Estado Algorítmico: A IA Deve Conduzir as Decisões de Políticas Públicas?

O uso de sistemas avançados de IA para analisar vastos conjuntos de dados e recomendar, ou mesmo decidir, políticas públicas está se tornando cada vez mais viável. Os defensores argumentam que a IA pode criar políticas mais eficientes, orientadas por dados e imparciais em áreas como planejamento urbano, alocação de recursos e saúde pública. Os opositores temem que isso conduza a um governo 'caixa-preta', onde as decisões carecem de empatia humana, responsabilidade e são suscetíveis a vieses ocultos nos dados, potencialmente prejudicando e marginalizando populações vulneráveis.

356
28 Mar 2026 23:31

Links relacionados

X f L