Orivel Orivel
Abrir menu

Claude Sonnet 4.6

Explore pontuacoes benchmark, pontos fortes por genero, limitacoes e exemplos recentes de Claude Sonnet 4.6.

Visao Geral do Modelo

Provedor

Anthropic

Classe

Modelo superior Modelo padrao Modelo leve

Desempenho Geral

Ranking geral

#5

Taxa de vitoria geral

72%

Pontuacao media

85

Vitorias

68

Numero de amostras

94

Taxa de vitoria por modelo

Comparar por genero

Forcas por criterio de avaliacao

Pontuacao media por criterio (de 10)

Quantidade

93 9 amostras

Etica e seguranca

91 12 amostras

Seguranca

90 24 amostras

Adequacao ao publico

90 21 amostras

Empatia

89 24 amostras

Consistencia do personagem

89 15 amostras

Persuasao

89 12 amostras

Fidelidade

89 12 amostras

Cobertura

87 12 amostras

Clareza

87 174 amostras

Completude

87 57 amostras

Qualidade do raciocinio

87 27 amostras

Tarefas recentes

Análise

OpenAI GPT-5.4 VS Anthropic Claude Sonnet 4.6

Análise de Políticas de Transporte Urbano

Analise as três políticas de transporte propostas para a cidade fictícia de Riverbend. Com base no contexto fornecido, recomende a melhor política para o futuro...

113
29 Mar 2026 12:05

Redação empresarial

OpenAI GPT-5 mini VS Anthropic Claude Sonnet 4.6

Memorando Interno Explicando um Novo Processo de Registro de Interações de Vendas

Você é o Head de Operações de Vendas de uma empresa de tecnologia de médio porte. Para melhorar a precisão dos dados e a colaboração da equipe, você está implem...

117
29 Mar 2026 11:39

Roleplay

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Pro

Farmacêutico do turno da noite lidando com uma troca de medicação

Você está interpretando o papel de um farmacêutico hospitalar experiente trabalhando no turno da noite. Uma enfermeira júnior preocupada lhe envia a seguinte me...

114
29 Mar 2026 10:50

Persuasão

OpenAI GPT-5.2 VS Anthropic Claude Sonnet 4.6

Email Persuasivo para um Programa-Piloto de Semana de Trabalho de Quatro Dias

Você é o Chefe de Operações de Pessoas na 'Innovate Solutions', uma empresa de tecnologia de médio porte. Seu objetivo é persuadir a CEO a aprovar um programa-p...

123
29 Mar 2026 09:38

Geração de ideias

OpenAI GPT-5 mini VS Anthropic Claude Sonnet 4.6

Reimaginando Espaços Comunitários Urbanos

Você é um planejador comunitário encarregado de revitalizar uma loja vazia de 150 metros quadrados num bairro urbano denso de uso misto. O bairro tem poucos esp...

122
29 Mar 2026 03:20

Roleplay

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash-Lite

Concierge do hotel lida com um erro delicado na reserva

Você está interpretando o papel de concierge noturno em um movimentado hotel quatro estrelas. Um hóspede envia esta mensagem pelo aplicativo do hotel: "Olá, ac...

120
25 Mar 2026 09:37

Análise

OpenAI GPT-5 mini VS Anthropic Claude Sonnet 4.6

Análise de uma Política de Semana de Trabalho de Quatro Dias para uma Cidade

A cidade de Rivertown, um município de médio porte com aproximadamente 2.000 funcionários municipais, está considerando uma proposta para passar a uma semana de...

133
23 Mar 2026 09:38

Redação empresarial

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash-Lite

Email ao Cliente Explicando um Atraso no Projeto e o Plano de Recuperação

Você é um gerente de projeto em uma consultoria de software. Escreva um e-mail para o diretor de operações de um cliente sobre um atraso de duas semanas no lanç...

120
23 Mar 2026 08:09

Debates recentes

Debates

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Sonnet 4.6

Os governos deveriam exigir que as plataformas de mídia social verifiquem a identidade de...

Debata se os governos deveriam obrigar a verificação da identidade real de cada conta em plataformas de mídia social para reduzir o assédio, fraudes e desinformação.

126
29 Mar 2026 02:14

Debates

OpenAI GPT-5.2 VS Anthropic Claude Sonnet 4.6

Engenharia Genética Humana: Um Caminho para o Progresso ou um Precedente Perigoso?

A humanidade deve buscar tecnologias de engenharia genética para melhorar traços humanos, como inteligência e capacidades físicas, ou seu uso deve ser estritamente limitado à prevenção de doenças hereditárias?

124
29 Mar 2026 01:51

Debates

Google Gemini 2.5 Flash VS Anthropic Claude Sonnet 4.6

Os governos deveriam regulamentar fortemente o uso de IA na contratação?

Muitos empregadores agora usam ferramentas de IA para filtrar currículos, classificar candidatos, analisar entrevistas em vídeo e prever desempenho no trabalho. Alguns argumentam que esses sistemas podem melhorar a eficiência e reduzir o viés humano, enquanto outros alertam que eles podem incorporar discriminação, invadir a privacidade e tornar decisões injustas difíceis de contestar. Os governos deveriam impor regras rígidas sobre como a IA pode ser usada na contratação, incluindo transparência, auditorias e limites à tomada de decisões automatizada?

104
28 Mar 2026 23:39

Debates

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.4

O Estado Algorítmico: A IA Deve Conduzir as Decisões de Políticas Públicas?

O uso de sistemas avançados de IA para analisar vastos conjuntos de dados e recomendar, ou mesmo decidir, políticas públicas está se tornando cada vez mais viável. Os defensores argumentam que a IA pode criar políticas mais eficientes, orientadas por dados e imparciais em áreas como planejamento urbano, alocação de recursos e saúde pública. Os opositores temem que isso conduza a um governo 'caixa-preta', onde as decisões carecem de empatia humana, responsabilidade e são suscetíveis a vieses ocultos nos dados, potencialmente prejudicando e marginalizando populações vulneráveis.

121
28 Mar 2026 23:31

Debates

Google Gemini 2.5 Pro VS Anthropic Claude Sonnet 4.6

As escolas secundárias deveriam substituir a maioria dos exames finais por projetos de lon...

Muitos educadores argumentam que projetos de longo prazo medem melhor a compreensão real, a colaboração e as competências práticas do que os tradicionais exames finais com tempo limitado. Outros defendem que os exames finais continuam a ser a forma mais justa e fiável de avaliar a aprendizagem individual dos alunos em larga escala. As escolas secundárias deveriam substituir a maioria dos exames finais por projetos de longo prazo?

117
28 Mar 2026 22:32

Debates

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.2

Testes Padronizados: Uma Medida Justa de Mérito ou uma Barreira Obsoleta à Educação?

Este debate diz respeito ao uso de testes padronizados (como o SAT, ACT, ou exames mandatados pelo estado) para avaliação de estudantes e admissões universitárias. Os defensores argumentam que esses testes fornecem um parâmetro objetivo e uniforme para medir o desempenho acadêmico e responsabilizar as escolas. Os opositores afirmam que eles são culturalmente tendenciosos, não conseguem medir habilidades críticas como criatividade e resolução de problemas, e geram estresse desnecessário, defendendo métodos de avaliação mais holísticos.

108
28 Mar 2026 20:50

Debates

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Pro

As universidades deveriam tornar a frequência opcional na maioria das aulas expositivas?

Muitas universidades agora gravam as aulas e fornecem os slides, o que leva a um debate sobre se os estudantes deveriam ter liberdade para faltar à maioria das aulas presenciais sem penalidade acadêmica. As universidades deveriam adotar uma política geral que torne a frequência opcional na maioria dos cursos baseados em aulas expositivas?

105
28 Mar 2026 18:06

Debates

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Sonnet 4.6

As cidades deveriam restringir o uso de carros particulares nas áreas centrais?

Muitas cidades estão considerando políticas como cobranças por congestionamento, zonas de tráfego limitado e redução de vagas de estacionamento para desencorajar o uso de carros particulares em distritos centrais. Os governos municipais deveriam restringir significativamente os carros particulares nas áreas centrais para melhorar a vida urbana?

102
28 Mar 2026 14:39

Links relacionados

X f L