Anthropic lança Claude Opus 4.5: Primeiro modelo de IA a ultrapassar 80% no benchmark de programação, desempenho supera humanos e preço cai 67%
Resumo de Notícias
A Anthropic lançou oficialmente seu mais recente modelo de IA carro-chefe, Claude Opus 4.5, em 24 de novembro de 2025. O modelo alcança avanços revolucionários em desenvolvimento de software, capacidade de raciocínio e processamento de tarefas complexas de várias etapas. Atualmente, está disponível para usuários através do aplicativo Claude, API e das três principais plataformas de nuvem. Esta é a terceira grande versão de modelo da Anthropic em dois meses, após o lançamento do Sonnet 4.5 em setembro e do Haiku 4.5 em outubro, marcando a entrada da concorrência na indústria de IA em uma fase de intensa disputa.
A mudança mais significativa do Claude Opus 4.5 é uma redução substancial de preço, com preço de US$ 5 por milhão de tokens de entrada e US$ 25 por milhão de tokens de saída. Isso representa uma redução de 67% em comparação com os US$ 15/US$ 75 do seu antecessor, Opus 4.1, tornando as capacidades de IA de ponta mais acessíveis. Esta estratégia de preços o torna mais atraente na concorrência com o GPT-5.1 da OpenAI (US$ 1,25/US$ 10) e o Gemini 3 Pro do Google (US$ 2/US$ 12).
Em termos de desempenho, o Claude Opus 4.5 alcançou uma taxa de precisão de 80,9% no benchmark SWE-bench Verified, tornando-se o primeiro modelo a ultrapassar a marca de 80%. Ele superou o GPT-5.1-Codex-Max da OpenAI (77,9%) e o Gemini 3 Pro do Google (76,2%). Este benchmark testa especificamente o desempenho de sistemas de IA em tarefas reais de engenharia de software, e o resultado do Claude Opus 4.5 representa um novo padrão da indústria.
Mais impressionante ainda, a Anthropic testou o Opus 4.5 usando o exame técnico real que a empresa aplica ao recrutar engenheiros de desempenho. A pontuação do modelo superou a pontuação mais alta já registrada por todos os candidatos humanos. Este resultado gerou uma discussão aprofundada na indústria sobre como a tecnologia de IA pode remodelar as profissões de colarinho branco.
Em termos técnicos, o Claude Opus 4.5 está equipado com uma janela de contexto de 200.000 tokens e um limite de saída de 64.000 tokens. A data de corte do conhecimento foi atualizada para março de 2025. O modelo passou por grandes melhorias na gestão de memória, otimizado especificamente para operações de longo contexto, sendo capaz de lembrar detalhes cruciais de forma mais inteligente. Essas melhorias o tornam particularmente adequado para atuar como um agente principal, coordenando o trabalho colaborativo de vários subagentes Haiku.
Em aplicações práticas, testadores iniciais relataram que o Opus 4.5 é capaz de lidar com tarefas que o Sonnet 4.5 mal conseguia concluir, encontrando soluções para problemas complexos de múltiplos sistemas sem a necessidade de orientação manual. O renomado desenvolvedor Simon Willison usou o Claude Code para realizar uma grande refatoração do sqlite-utils durante um teste de fim de semana, completando 20 commits em dois dias, envolvendo 39 arquivos, 2022 linhas de código adicionadas e 1173 linhas excluídas.
Em termos de segurança, a Anthropic afirma que o Opus 4.5 é o modelo mais robusto em alinhamento até o momento, alcançando avanços significativos na defesa contra ataques de injeção de prompt e sendo mais difícil de enganar do que qualquer outro modelo de ponta na indústria. Isso é particularmente importante para clientes corporativos que usam Claude para tarefas críticas.
Em sincronia com o lançamento do modelo, a Anthropic introduziu uma série de atualizações de produtos: a extensão Claude para Chrome agora está disponível para todos os usuários Max; Claude para Excel foi lançado oficialmente para usuários Max, Team e Enterprise, suportando tabelas dinâmicas, gráficos e upload de arquivos. O aplicativo de desktop Claude Code também foi lançado oficialmente, suportando plataformas Windows, macOS e Windows (Arm 64), permitindo que os desenvolvedores executem várias sessões de codificação ou pesquisa em paralelo.
Notavelmente, a Anthropic ajustou os limites de uso, permitindo que os usuários com acesso ao Opus 4.5 utilizem o modelo em um nível semelhante ao do Sonnet anteriormente. Isso significa que os usuários não precisam se preocupar com muitas restrições em seu trabalho diário.
Em termos de cenário de concorrência de mercado, Microsoft e Nvidia anunciaram na semana passada investimentos de bilhões de dólares na Anthropic, elevando a avaliação deste laboratório de IA para aproximadamente US$ 350 bilhões. A Anthropic alcançou uma receita anualizada de US$ 2 bilhões no primeiro trimestre de 2025, dobrando em relação aos US$ 1 bilhão do trimestre anterior, e o número de clientes com gastos anuais superiores a US$ 100.000 cresceu oito vezes ano a ano.
O lançamento do Claude Opus 4.5 ocorre em um período de intensa concorrência na indústria de IA. A OpenAI lançou o GPT-5.1 em 12 de novembro, o Google introduziu o Gemini 3 em 18 de novembro, e agora a Anthropic responde ao mercado com o Opus 4.5. Scott White, chefe de produto da Anthropic, afirmou: "Estou incrivelmente animado com o volume de produtos que estamos lançando no mercado e o ciclo de feedback que isso gera."
Em relação ao público-alvo, White apontou que os usuários ideais do Opus 4.5 são desenvolvedores de software profissionais e trabalhadores do conhecimento, como analistas financeiros, consultores e contadores, bem como aqueles que desejam impulsionar a criatividade e construir coisas novas.
Desenvolvedores podem invocar o Claude Opus 4.5 via API usando a string do modelo "claude-opus-4-5-20251101", e desfrutar de 90% de economia de custo com cache de prompt e 50% de economia de custo com processamento em lote. O modelo já está disponível em plataformas como Amazon Bedrock, Vertex AI do Google Cloud e Microsoft Foundry.
A Anthropic enfatiza que o Opus 4.5 é um modelo avançado projetado para "casos de uso sem precedentes", especialmente adequado para engenharia de software profissional, fluxos de trabalho de agentes complexos e tarefas corporativas de alto risco. Sua capacidade de raciocínio híbrido permite alternar flexivelmente entre respostas instantâneas e pensamento estendido. Usuários da API podem ajustar finamente o esforço total que o modelo dedica a uma resposta, equilibrando desempenho, latência e custo.
O feedback de parceiros da indústria também confirma as poderosas capacidades do Opus 4.5. A Lovable afirmou que o modelo oferece capacidades de raciocínio de ponta em seu modo de chat, o raciocínio profundo mudou a forma como o planejamento é feito, e um excelente planejamento leva a uma melhor geração de código. A Warp relatou que, nos testes do Terminal Bench, o Opus 4.5 melhorou em 15% em relação ao Sonnet 4.5, o que foi particularmente notável no uso do Planning Mode. Nico Christie, cofundador da empresa de modelagem financeira Fundamental Research Labs, disse que, em avaliações internas, a precisão aumentou em 20% e a eficiência em 15%, e tarefas complexas que antes pareciam inatingíveis agora são realizáveis.
O lançamento do Claude Opus 4.5 não representa apenas um novo avanço na força tecnológica da Anthropic, mas também prenuncia que os assistentes de IA estão evoluindo de simples ferramentas de perguntas e respostas para sistemas inteligentes capazes de realizar tarefas profissionais complexas de forma independente. Com a queda substancial dos preços e o aumento significativo das capacidades, a aplicação comercial da tecnologia de IA deve acelerar ainda mais, trazendo profundas transformações para todas as indústrias.