QwenLM/Qwen3-CoderView GitHub Homepage for Latest Official Releases

Das fortschrittlichste Open-Source-KI-Programmiermodell von Alibaba, speziell für intelligente Agentenprogrammieraufgaben entwickelt.

PythonQwen3-CoderQwenLM 10.4k Last Updated: July 30, 2025

Detaillierte Einführung in das Qwen3-Coder-Projekt

Projektübersicht

Qwen3-Coder ist ein hochmodernes Open-Source-KI-Programmier-Großmodell, das vom Alibaba Qwen-Team entwickelt wurde und speziell für intelligente Agenten-Programmieraufgaben konzipiert ist. Das Modell verwendet eine Mixture-of-Experts (MoE)-Architektur mit insgesamt 480 Milliarden Parametern, von denen 35 Milliarden Parameter bei jeder Inferenz aktiviert werden.

Kernfunktionen

🚀 Herausragende Leistung

Setzt neue Leistungsrekorde unter Open-Source-Modellen in den Bereichen intelligente Agentenprogrammierung, intelligente Agenten-Browsernutzung und intelligente Agenten-Toolnutzung, vergleichbar mit Claude Sonnet-4
Übertrifft in realen Software-Engineering-Aufgaben-Benchmarks wie SWE-Bench nationale Konkurrenten wie DeepSeek und Moonshot AIs K2-Modell

📚 Lange Kontextfähigkeit

Unterstützt nativ eine Kontextlänge von 256K Tokens, erweiterbar auf 1 Million Tokens durch Extrapolationsmethoden
Speziell für das Verständnis von Codebasen optimiert, kann umfangreiche Codebasen in einer einzigen Sitzung verarbeiten

🛠 Intelligente Agentenprogrammierung

Unterstützt die meisten Plattformen wie Qwen Code, CLINE, mit einem speziell entwickelten Funktionsaufruf-Format
Entwickler können benutzerdefinierte Tools definieren, die Qwen3-Coder dynamisch in Dialog- oder Codegenerierungsaufgaben aufrufen kann

🌍 Breite Sprachunterstützung

Unterstützt 358 Programmiersprachen, darunter eine Vielzahl von gängigen und Nischensprachen von ABAP bis Zig
Behält die Stärken des Basismodells in Mathematik und allgemeinen Fähigkeiten bei

Technische Architektur

Modellarchitektur

Architekturtyp: Mixture-of-Experts (MoE)-Modell
Gesamtparameter: 480 Milliarden Parameter
Aktivierte Parameter: 35 Milliarden Parameter werden pro Abfrage aktiviert
Expertenkonfiguration: 8 von 160 Experten werden aktiviert

Trainingsdaten

Der Umfang der Trainingsdaten beträgt 7,5 Billionen Tokens, davon 70% Codedaten
Bereinigung und Umschreibung von Rauschdaten mithilfe von Qwen2.5-Coder, was die allgemeine Datenqualität erheblich verbessert

Optimierung durch Reinforcement Learning

Einsatz von Code-Reinforcement-Learning-Training, das ein breiteres Spektrum realer Programmieraufgaben abdeckt
Einführung von Long-Term Reinforcement Learning (Agent RL), um das Modell zu ermutigen, Tools durch mehrstufige Interaktionen zur Lösung realer Aufgaben zu verwenden

Nutzung

Beispiel für eine grundlegende Konversation

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "Qwen/Qwen3-Coder-480B-A35B-Instruct"
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

prompt = "write a quick sort algorithm."
messages = [
    {"role": "user", "content": prompt}
]

text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)

model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=65536
)

generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]
response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

Code-Vervollständigung (Fill-in-the-Middle)

input_text = """<|fim_prefix|>def quicksort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[len(arr) // 2]
    <|fim_suffix|>
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]
    return quicksort(left) + middle + quicksort(right)<|fim_middle|>"""

messages = [
    {"role": "system", "content": "You are a code completion assistant."},
    {"role": "user", "content": input_text}
]

# Verarbeitung der Code-Vervollständigungsaufgabe
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)

Begleitende Tools

Qwen Code CLI-Tool

Alibaba hat gleichzeitig Qwen Code als Open Source veröffentlicht, ein leistungsstarkes Kommandozeilen-Interface (CLI)-Tool, das es Entwicklern ermöglicht, Engineering-Aufgaben mithilfe natürlicher Sprache an die KI zu delegieren.

Hauptfunktionen:

Code-Verständnis und -Bearbeitung: Abfragen und Bearbeiten großer Codebasen, die über die Grenzen traditioneller Kontextfenster hinausgehen
Workflow-Automatisierung: Automatisierung von Betriebsaufgaben wie der Bearbeitung von Pull-Requests und komplexen Rebase-Operationen
Verbesserter Parser: Ein speziell für das Qwen-Coder-Modell optimierter Parser

Installation und Konfiguration

Stellen Sie sicher, dass Node.js 20 oder höher installiert ist, und richten Sie dann den Qwen API-Schlüssel ein:

# Im Stammverzeichnis des Projekts eine .env-Datei erstellen
echo "QWEN_API_KEY=your_api_key_here" > .env

Leistungsbenchmarks

Leistung unter Open-Source-Modellen

Hervorragende Leistung im SWE-Bench-Benchmark, übertrifft Konkurrenzmodelle von Moonshot AI und DeepSeek
Setzt neue Open-Source-Modellrekorde in den Bereichen intelligente Agentenprogrammierung, intelligente Agenten-Browsernutzung und intelligente Agenten-Toolnutzung

Vergleich mit kommerziellen Modellen

Im Vergleich zu Anthropic's Claude Sonnet-4 und OpenAI's GPT-4.1 in einigen Bereichen vergleichbar oder mit geringfügigen Unterschieden
In spezifischen Bereichen vergleichbar mit führenden US-Modellen (einschließlich Anthropic's Claude und OpenAI's GPT-4)

Zugriffsmethoden

Modellzugriff

API-Zugriff

Direkter Zugriff auf die Qwen3-Coder API über Alibaba Cloud Model Studio
Die Qwen3-Coder API ist auf der BaiLian-Plattform von Alibaba Cloud verfügbar

Anwendungsfälle für Unternehmen

Für Unternehmen bietet Qwen3-Coder eine offene, leistungsstarke Alternative zu proprietären Closed-Source-Modellen. Mit seiner hervorragenden Leistung bei der Code-Ausführung und der Langkontext-Inferenz ist es besonders geeignet für:

Verständnis auf Codebasis-Ebene: Geeignet für KI-Systeme, die große Codebasen, technische Dokumentationen oder Architekturmuster verstehen müssen
Entwicklung intelligenter Agenten: Unterstützt den Aufbau von KI-Agenten, die Programmierherausforderungen autonom bewältigen können
Groß angelegte Softwareentwicklung: Bearbeitung komplexer, mehrstufiger Programmier-Workflows

Technische Dokumentation

Detaillierte Leistungsinformationen und technische Dokumentation finden Sie unter:

Qwen3-Coder stellt den neuesten Durchbruch bei Open-Source-KI-Programmiermodellen dar und bietet Entwicklern und Unternehmen leistungsstarke intelligente Programmierwerkzeuge, die die Grenzen der KI-gestützten Softwareentwicklung vorantreiben.