QwenLM/Qwen3-CoderView GitHub Homepage for Latest Official Releases

O modelo de programação de IA de código aberto mais avançado lançado pelo Alibaba, projetado para tarefas de programação de agentes inteligentes.

PythonQwen3-CoderQwenLM 10.4k Last Updated: July 30, 2025

Introdução Detalhada ao Projeto Qwen3-Coder

Visão Geral do Projeto

Qwen3-Coder é o modelo de programação de IA de código aberto mais avançado desenvolvido pela equipe Qwen da Alibaba, projetado especificamente para tarefas de programação de agentes inteligentes. O modelo adota uma arquitetura de Mistura de Especialistas (MoE), possuindo um total de 480 bilhões de parâmetros, dos quais 35 bilhões são ativados a cada inferência.

Principais Características

🚀 Desempenho Excepcional

Estabeleceu novos recordes de desempenho entre os modelos de código aberto em programação de agentes inteligentes, uso de navegador por agentes inteligentes e uso de ferramentas por agentes inteligentes, comparável ao Claude Sonnet-4.
Superou concorrentes nacionais como DeepSeek e o modelo K2 da Moonshot AI em benchmarks de tarefas de engenharia de software do mundo real, como o SWE-Bench.

📚 Capacidade de Contexto Longo

Suporta nativamente um comprimento de contexto de 256K tokens, expansível para 1 milhão de tokens através de métodos de extrapolação.
Otimizado especificamente para a compreensão em escala de bases de código, capaz de processar vastas bases de código em uma única sessão.

🛠 Programação de Agentes Inteligentes

Suporta a maioria das plataformas como Qwen Code, CLINE, com um formato de chamada de função especialmente projetado.
Desenvolvedores podem definir ferramentas personalizadas, permitindo que o Qwen3-Coder as invoque dinamicamente em tarefas de conversação ou geração de código.

🌍 Amplo Suporte a Idiomas

Suporta 358 linguagens de programação, incluindo uma variedade de linguagens mainstream e de nicho, de ABAP a Zig.
Mantém as vantagens do modelo base em matemática e capacidades gerais.

Arquitetura Técnica

Arquitetura do Modelo

Tipo de Arquitetura: Modelo de Mistura de Especialistas (MoE)
Parâmetros Totais: 480 bilhões de parâmetros
Parâmetros Ativados: 35 bilhões de parâmetros ativados por consulta
Configuração de Especialistas: 8 de 160 especialistas ativados

Dados de Treinamento

O volume de dados de treinamento atinge 7,5 trilhões de tokens, dos quais 70% são dados de código.
Utiliza o Qwen2.5-Coder para limpar e reescrever dados ruidosos, melhorando significativamente a qualidade geral dos dados.

Otimização por Aprendizado por Reforço

Adota treinamento por aprendizado por reforço de código, cobrindo uma gama mais ampla de tarefas de programação do mundo real.
Introduz o aprendizado por reforço de longo prazo (Agent RL) para encorajar o modelo a resolver tarefas do mundo real usando ferramentas através de interações multi-turn.

Modo de Uso

Exemplo de Conversa Básica

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "Qwen/Qwen3-Coder-480B-A35B-Instruct"
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

prompt = "write a quick sort algorithm."
messages = [
    {"role": "user", "content": prompt}
]

text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)

model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=65536
)

generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]
response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

Preenchimento de Código (Fill-in-the-Middle)

input_text = """<|fim_prefix|>def quicksort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[len(arr) // 2]
    <|fim_suffix|>
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]
    return quicksort(left) + middle + quicksort(right)<|fim_middle|>"""

messages = [
    {"role": "system", "content": "You are a code completion assistant."},
    {"role": "user", "content": input_text}
]

# Processar a tarefa de preenchimento de código
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)

Ferramentas Complementares

Ferramenta CLI Qwen Code

A Alibaba também lançou o Qwen Code como código aberto, uma poderosa ferramenta de interface de linha de comando (CLI) que permite aos desenvolvedores delegar tarefas de engenharia à IA usando linguagem natural.

Principais funções:

Compreensão e Edição de Código: Consultar e editar grandes bases de código que excedem os limites da janela de contexto tradicional.
Automação de Fluxo de Trabalho: Automatizar tarefas operacionais, como processar pull requests e operações complexas de rebase.
Analisador Aprimorado: Um analisador otimizado especificamente para o modelo Qwen-Coder.

Instalação e Configuração

Certifique-se de ter o Node.js 20 ou superior instalado e, em seguida, configure a chave da API Qwen:

# Crie um arquivo .env na raiz do projeto
echo "QWEN_API_KEY=your_api_key_here" > .env

Benchmarks de Desempenho

Desempenho em Modelos de Código Aberto

Excelente desempenho no benchmark SWE-Bench, superando os modelos concorrentes da Moonshot AI e DeepSeek.
Estabeleceu novos recordes para modelos de código aberto em programação de agentes inteligentes, uso de navegador por agentes inteligentes e uso de ferramentas por agentes inteligentes.

Comparação com Modelos Comerciais

Em comparação com o Claude Sonnet-4 da Anthropic e o GPT-4.1 da OpenAI, o desempenho é comparável ou ligeiramente inferior em algumas áreas.
Em domínios específicos, o desempenho é comparável aos principais modelos americanos (incluindo Claude da Anthropic e GPT-4 da OpenAI).

Métodos de Acesso

Aquisição do Modelo

Acesso à API

A API do Qwen3-Coder pode ser acessada diretamente através do Alibaba Cloud Model Studio.
A API do Qwen3-Coder já está disponível na plataforma Bailian do Alibaba Cloud.

Cenários de Aplicação Empresarial

Para empresas, o Qwen3-Coder oferece uma alternativa de código aberto e de alto desempenho aos modelos proprietários de código fechado. Com seu excelente desempenho na execução de código e inferência de contexto longo, é particularmente adequado para:

Compreensão em Nível de Base de Código: Adequado para sistemas de IA que precisam entender grandes bases de código, documentação técnica ou padrões de arquitetura.
Desenvolvimento de Agentes Inteligentes: Suporta a construção de agentes de IA capazes de lidar autonomamente com desafios de programação.
Desenvolvimento de Software em Larga Escala: Lida com fluxos de trabalho de programação complexos e de várias etapas.

Documentação Técnica

Informações detalhadas sobre desempenho e documentação técnica podem ser encontradas nos seguintes locais:

O Qwen3-Coder representa o mais recente avanço em modelos de programação de IA de código aberto, fornecendo aos desenvolvedores e empresas ferramentas poderosas de programação inteligente e impulsionando a vanguarda do desenvolvimento de software assistido por IA.