QwenLM/Qwen3-CoderView GitHub Homepage for Latest Official Releases

Alibabaが開発した最先端のオープンソースAIプログラミングモデル。インテリジェントエージェントプログラミングタスク専用に設計。

PythonQwen3-CoderQwenLM 10.4k Last Updated: July 30, 2025

Qwen3-Coder プロジェクト詳細紹介

プロジェクト概要

Qwen3-Coderは、アリババQwenチームが開発した最先端のオープンソースAIプログラミング大規模モデルで、インテリジェントエージェントのプログラミングタスク向けに設計されています。このモデルは混合エキスパート（MoE）アーキテクチャを採用しており、総パラメータ数は4800億ですが、推論ごとに350億パラメータがアクティブ化されます。

コア機能

🚀 優れた性能

オープンソースモデルの中で、インテリジェントエージェントプログラミング、インテリジェントエージェントブラウザ使用、インテリジェントエージェントツール使用において最新の性能記録を樹立し、Claude Sonnet-4に匹敵します。
SWE-Benchなどの実世界のソフトウェアエンジニアリングタスクのベンチマークにおいて、DeepSeekやMoonshot AIのK2モデルといった国内の競合他社を凌駕しました。

📚 長コンテキスト能力

ネイティブで256Kトークンのコンテキスト長をサポートし、外挿法により100万トークンまで拡張可能です。
コードベース規模の理解に特化して最適化されており、単一のセッションで膨大なコードベースを処理できます。

🛠 インテリジェントエージェントプログラミング

Qwen Code、CLINEなど、ほとんどのプラットフォームをサポートし、特別に設計された関数呼び出し形式を備えています。
開発者はカスタムツールを定義でき、Qwen3-Coderが会話やコード生成タスクでこれらのツールを動的に呼び出すことができます。

🌍 幅広い言語サポート

ABAPからZigまで、様々な主要なプログラミング言語およびニッチなプログラミング言語を含む358種類のプログラミング言語をサポートしています。
基盤モデルの数学および汎用能力における優位性を維持しています。

技術アーキテクチャ

モデルアーキテクチャ

アーキテクチャタイプ: 混合エキスパート（MoE）モデル
総パラメータ数: 4800億パラメータ
アクティブ化パラメータ数: クエリごとに350億パラメータがアクティブ化
エキスパート構成: 160のエキスパート中8つがアクティブ化

トレーニングデータ

トレーニングデータ規模は7.5兆トークンに達し、そのうち70%がコードデータです。
Qwen2.5-Coderを利用してノイズデータのクリーンアップと書き換えを行い、全体的なデータ品質を大幅に向上させました。

強化学習による最適化

コード強化学習トレーニングを採用し、より広範な実世界のプログラミングタスクをカバーしています。
長期強化学習（Agent RL）を導入し、モデルが複数回のインタラクションを通じてツールを使用し、実世界のタスクを解決することを促します。

使用方法

基本的な会話例

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "Qwen/Qwen3-Coder-480B-A35B-Instruct"
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

prompt = "write a quick sort algorithm."
messages = [
    {"role": "user", "content": prompt}
]

text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)

model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=65536
)

generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]
response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

コード補完（Fill-in-the-Middle）

input_text = """<|fim_prefix|>def quicksort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[len(arr) // 2]
    <|fim_suffix|>
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]
    return quicksort(left) + middle + quicksort(right)<|fim_middle|>"""

messages = [
    {"role": "system", "content": "You are a code completion assistant."},
    {"role": "user", "content": input_text}
]

# コード補完タスクを処理
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)

性能ベンチマーク

オープンソースモデルにおけるパフォーマンス

SWE-Benchベンチマークで優れたパフォーマンスを発揮し、Moonshot AIやDeepSeekの競合モデルを凌駕しました。
インテリジェントエージェントプログラミング、インテリジェントエージェントブラウザ使用、インテリジェントエージェントツール使用において、オープンソースモデルの新記録を樹立しました。

商用モデルとの比較

AnthropicのClaude Sonnet-4やOpenAIのGPT-4.1と比較して、一部の領域で同等またはわずかな差があります。
特定の領域では、主要な米国モデル（AnthropicのClaudeやOpenAIのGPT-4を含む）と同等のパフォーマンスを発揮します。

アクセス方法

モデルの入手

APIアクセス

Alibaba Cloud Model Studioを通じてQwen3-CoderのAPIに直接アクセスできます。
Qwen3-Coder APIは、Alibaba CloudのBailianプラットフォームで利用可能です。

企業向け利用シナリオ

企業にとって、Qwen3-Coderはクローズドソースのプロプライエタリモデルに対するオープンで高性能な代替手段を提供します。コード実行と長コンテキスト推論における優れたパフォーマンスにより、特に以下の用途に適しています。

コードベースレベルの理解: 大規模なコードベース、技術文書、またはアーキテクチャパターンを理解する必要があるAIシステム。
インテリジェントエージェント開発: プログラミングの課題を自律的に処理できるAIエージェントの構築をサポートします。
大規模ソフトウェア開発: 複雑な多段階プログラミングワークフローの処理。

技術ドキュメント

詳細な性能紹介と技術ドキュメントは以下の場所で確認できます。

Qwen3-Coderは、オープンソースAIプログラミングモデルの最新のブレークスルーを象徴しており、開発者と企業に強力なインテリジェントプログラミングツールを提供し、AI支援ソフトウェア開発の最前線を推進しています。