Alibaba lança o modelo carro-chefe Qwen3-Max-Preview com trilhão de parâmetros, inaugurando uma nova era na tecnologia de IA da China

September 09, 2025
Alibaba
5 min

Resumo de Notícias

A Alibaba lançou em 5 de setembro de 2025 o primeiro modelo de linguagem grande com trilhões de parâmetros, Qwen3-Max-Preview. Este é o modelo carro-chefe com a maior escala de parâmetros da série Qwen, marcando um avanço significativo na tecnologia de IA chinesa no campo de modelos de ultra-grande escala. O modelo adota uma arquitetura não-inferencial, demonstrou excelente desempenho em vários testes de benchmark, suporta mais de 100 idiomas e pode ser experimentado gratuitamente através da interface web Qwen Chat ou invocado via API na plataforma Alibaba Cloud Bailian.

Especificações Técnicas e Avanços Inovadores

O Qwen3-Max-Preview, como versão de pré-visualização carro-chefe da série Qwen3, possui uma escala de parâmetros superior a 1 trilhão, tornando-o um dos maiores modelos de API aberta conhecidos. O modelo adota uma arquitetura de Modelo de Especialistas Mistos (MoE) que, ao ativar dinamicamente módulos de especialistas, reduz significativamente os custos de inferência, mantendo um desempenho poderoso.

É importante notar que o Qwen3-Max-Preview utiliza uma arquitetura de modelo não-inferencial, mas ainda alcançou uma melhoria significativa na capacidade de inferência através de um design otimizado. O modelo suporta uma capacidade de processamento de contexto de mais de 256K tokens, podendo lidar com cenários como documentos longos, diálogos complexos e arquivos de código em larga escala.

Desempenho Líder em Todas as Áreas

De acordo com os resultados dos testes de benchmark divulgados oficialmente, o Qwen3-Max-Preview teve um desempenho notável em várias avaliações autorizadas:

  • Raciocínio Matemático (AIME25): Pontuação de 80,6%, um desempenho notável para um modelo não-inferencial.
  • Capacidade de Programação (LiveCodeBench v6): Pontuação de 57,6%, com uma melhoria significativa na capacidade de assistência à programação.
  • Conhecimento Geral (SuperGPQA): Demonstra forte capacidade de compreensão em perguntas e respostas de conhecimento geral.
  • Alinhamento com Preferências Humanas (Arena-Hard v2): Excelente desempenho na execução de instruções complexas.

Os resultados dos testes mostram que o Qwen3-Max-Preview superou modelos mainstream nacionais e internacionais como Claude Opus 4 (modo não-pensante), Kimi K2 e DeepSeek-V3.1 em vários indicadores, provando a eficácia da expansão em escala.

Capacidades Essenciais Totalmente Atualizadas

Em comparação com a série Qwen2.5 anterior, o Qwen3-Max-Preview alcançou melhorias significativas nas seguintes dimensões:

Compreensão e Geração de Linguagem: Suporta mais de 100 idiomas, com excelente capacidade de compreensão em chinês e inglês, e uma melhoria significativa na qualidade da tradução multilíngue.

Inferência e Execução de Instruções: A precisão do raciocínio lógico complexo foi significativamente aprimorada, a capacidade de compreender e executar instruções complexas foi fortalecida, e o fenômeno de alucinação do modelo foi notavelmente reduzido.

Otimização de Chamada de Ferramentas: Otimizado especificamente para Geração Aumentada por Recuperação (RAG) e chamada de ferramentas, estabelecendo as bases para a construção de poderosas aplicações de Agentes de IA.

Cobertura de Conhecimento de Cauda Longa: Cobertura mais abrangente de conhecimento em áreas especializadas, com melhorias simultâneas na amplitude e robustez do conhecimento.

Cenários de Aplicação e Valor Comercial

O lançamento do Qwen3-Max-Preview traz novas possibilidades de aplicação para vários setores:

Processamento de Documentos Corporativos: A capacidade de contexto ultra-longo permite-lhe lidar com tarefas complexas como documentos corporativos extensos e análise de contratos.

Assistente de Programação Inteligente: Poderosas capacidades de compreensão e geração de código, que podem fornecer assistência de programação de alta qualidade para desenvolvedores.

Atendimento ao Cliente Multilíngue: Suporta mais de 100 idiomas, fornecendo soluções unificadas de atendimento ao cliente multilíngue para empresas transnacionais.

Criação de Conteúdo e Planejamento Estratégico: Demonstra grande potencial em áreas como escrita criativa, redação publicitária e análise estratégica.

Estratégia Comercial e Posicionamento de Mercado

Ao contrário da estratégia de código aberto anterior, a Alibaba optou por lançar o Qwen3-Max-Preview como um modelo comercial de código fechado. O modelo adota uma estratégia de preços semelhante à do Claude e GPT-4, mas com uma certa vantagem de custo, refletindo a confiança da Alibaba no desempenho do modelo.

Os usuários podem experimentar o modelo de duas maneiras: primeiro, através da interface web Qwen Chat (chat.qwen.ai) para uma experiência gratuita; segundo, através da interface API da plataforma Alibaba Cloud Bailian para uso comercial. A plataforma também oferece aos novos usuários um limite de experiência de 1 milhão de tokens gratuitos por modelo.

Significado Técnico e Impacto na Indústria

O lançamento do Qwen3-Max-Preview possui um significado técnico e valor industrial importantes:

Avanço Tecnológico: A escala de trilhões de parâmetros demonstra a força técnica das empresas chinesas de IA no desenvolvimento de modelos de ultra-grande escala, marcando um avanço crucial para a China no campo dos modelos básicos de IA.

Impulso Industrial: Fornece suporte de modelo básico de classe mundial para desenvolvedores de aplicações de IA domésticos, contribuindo para o desenvolvimento geral da indústria de IA na China.

Cenário Competitivo: Na competição global de modelos de IA, as empresas chinesas estão a reduzir a lacuna com as empresas líderes internacionais, e até mesmo a alcançar a liderança em alguns indicadores.

Perspectivas Futuras

Como versão de pré-visualização, as capacidades do Qwen3-Max-Preview ainda estão em constante aprimoramento. A Alibaba declarou que a versão oficial trará mais surpresas, e a filosofia de "Scaling works" continuará a guiar a direção do desenvolvimento do modelo.

O lançamento deste modelo coincide com um período crucial de mudanças no ambiente global de IA, demonstrando a determinação e a força da China na inovação autônoma da tecnologia de IA. Com a experiência e o feedback de mais usuários, o Qwen3-Max-Preview deverá desempenhar um valor ainda maior em aplicações de nível empresarial, injetando um novo impulso no desenvolvimento da indústria de IA chinesa.

Atualmente, o modelo já está disponível para acesso via API na plataforma Alibaba Cloud Bailian, permitindo que os desenvolvedores o integrem rapidamente através do formato padrão da API OpenAI, e espera-se que seja amplamente aplicado em diversas áreas, como atendimento ao cliente inteligente, criação de conteúdo e assistência à programação.