알리바바에서 출시한 최첨단 오픈 소스 AI 프로그래밍 모델로, 지능형 에이전트 프로그래밍 작업을 위해 설계되었습니다.

PythonQwen3-CoderQwenLM 10.4k Last Updated: July 30, 2025

Qwen3-Coder 프로젝트 상세 소개

프로젝트 개요

Qwen3-Coder는 알리바바 Qwen 팀이 개발한 최첨단 오픈소스 AI 프로그래밍 대규모 모델로, 지능형 에이전트 프로그래밍 작업을 위해 특별히 설계되었습니다. 이 모델은 MoE(혼합 전문가) 아키텍처를 채택했으며, 총 4,800억 개의 파라미터를 보유하고 있으며, 이 중 350억 개의 파라미터가 각 추론 시 활성화됩니다.

핵심 기능

🚀 탁월한 성능

  • 오픈소스 모델 중 지능형 에이전트 프로그래밍, 지능형 에이전트 브라우저 사용 및 지능형 에이전트 도구 사용 분야에서 최신 성능 기록을 세웠으며, Claude Sonnet-4와 견줄 만합니다.
  • SWE-Bench와 같은 실제 소프트웨어 엔지니어링 작업 벤치마크에서 DeepSeek 및 Moonshot AI의 K2 모델과 같은 국내 경쟁사를 능가했습니다.

📚 긴 컨텍스트 처리 능력

  • 256K 토큰의 컨텍스트 길이를 기본적으로 지원하며, 외삽법을 통해 100만 토큰까지 확장 가능합니다.
  • 코드베이스 규모의 이해를 위해 최적화되어 단일 세션에서 방대한 코드베이스를 처리할 수 있습니다.

🛠 지능형 에이전트 프로그래밍

  • Qwen Code, CLINE과 같은 대부분의 플랫폼을 지원하며, 특별히 설계된 함수 호출 형식을 제공합니다.
  • 개발자는 사용자 정의 도구를 정의하여 Qwen3-Coder가 대화 또는 코드 생성 작업에서 이러한 도구를 동적으로 호출할 수 있도록 할 수 있습니다.

🌍 광범위한 언어 지원

  • ABAP부터 Zig까지 다양한 주류 및 비주류 프로그래밍 언어를 포함하여 358가지 프로그래밍 언어를 지원합니다.
  • 기본 모델의 수학 및 일반 능력에서의 강점을 유지합니다.

기술 아키텍처

모델 아키텍처

  • 아키텍처 유형: MoE(혼합 전문가) 모델
  • 총 파라미터: 4,800억 개 파라미터
  • 활성화 파라미터: 각 쿼리 시 350억 개 파라미터 활성화
  • 전문가 구성: 160개 전문가 중 8개 활성화

훈련 데이터

  • 훈련 데이터 규모는 7.5조 토큰에 달하며, 이 중 70%가 코드 데이터입니다.
  • Qwen2.5-Coder를 활용하여 노이즈 데이터를 정리하고 재작성하여 전체 데이터 품질을 크게 향상시켰습니다.

강화 학습 최적화

  • 더 광범위한 실제 프로그래밍 작업을 포괄하는 코드 강화 학습 훈련을 채택했습니다.
  • 다단계 상호작용을 통해 도구를 사용하여 실제 작업을 해결하도록 모델을 장려하는 장기 강화 학습(Agent RL)을 도입했습니다.

사용 방법

기본 대화 예시

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "Qwen/Qwen3-Coder-480B-A35B-Instruct"
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

prompt = "write a quick sort algorithm."
messages = [
    {"role": "user", "content": prompt}
]

text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)

model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=65536
)

generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]
response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

코드 채우기(Fill-in-the-Middle)

input_text = """<|fim_prefix|>def quicksort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[len(arr) // 2]
    <|fim_suffix|>
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]
    return quicksort(left) + middle + quicksort(right)<|fim_middle|>"""

messages = [
    {"role": "system", "content": "You are a code completion assistant."},
    {"role": "user", "content": input_text}
]

# 코드 채우기 작업 처리
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)

부속 도구

Qwen Code CLI 도구

알리바바는 또한 Qwen Code를 오픈소스화했습니다. 이는 개발자가 자연어를 사용하여 엔지니어링 작업을 AI에 위임할 수 있도록 하는 강력한 CLI(명령줄 인터페이스) 도구입니다.

주요 기능:

  • 코드 이해 및 편집: 기존 컨텍스트 창 제한을 초과하는 대규모 코드베이스를 쿼리하고 편집합니다.
  • 워크플로우 자동화: 풀 리퀘스트 처리 및 복잡한 리베이스 작업과 같은 운영 작업을 자동화합니다.
  • 향상된 파서: Qwen-Coder 모델에 특별히 최적화된 파서입니다.

설치 및 구성

Node.js 20 이상 버전이 설치되어 있는지 확인한 다음 Qwen API 키를 설정합니다.

# 프로젝트 루트 디렉토리에 .env 파일 생성
echo "QWEN_API_KEY=your_api_key_here" > .env

성능 벤치마크

오픈소스 모델에서의 성능

  • SWE-Bench 벤치마크에서 뛰어난 성능을 보여 Moonshot AI 및 DeepSeek의 경쟁 모델을 능가했습니다.
  • 지능형 에이전트 프로그래밍, 지능형 에이전트 브라우저 사용 및 지능형 에이전트 도구 사용 분야에서 오픈소스 모델의 새로운 기록을 세웠습니다.

상용 모델과의 비교

  • Anthropic의 Claude Sonnet-4 및 OpenAI의 GPT-4.1과 비교하여 일부 영역에서 동등하거나 약간의 차이를 보였습니다.
  • 특정 영역에서 Anthropic의 Claude 및 OpenAI의 GPT-4를 포함한 선도적인 미국 모델과 동등한 성능을 보였습니다.

접근 방법

모델 획득

API 접근

  • 알리바바 클라우드 모델 스튜디오를 통해 Qwen3-Coder의 API에 직접 접근할 수 있습니다.
  • Qwen3-Coder API는 알리바바 클라우드의 Bailian 플랫폼에 출시되었습니다.

기업 적용 시나리오

기업에게 Qwen3-Coder는 폐쇄형 독점 모델에 대한 개방적이고 고성능의 대안을 제공합니다. 코드 실행 및 긴 컨텍스트 추론에서의 뛰어난 성능 덕분에 특히 다음과 같은 경우에 적합합니다.

  • 코드베이스 수준 이해: 대규모 코드베이스, 기술 문서 또는 아키텍처 패턴을 이해해야 하는 AI 시스템에 적합합니다.
  • 지능형 에이전트 개발: 프로그래밍 문제를 자율적으로 처리할 수 있는 AI 에이전트 구축을 지원합니다.
  • 대규모 소프트웨어 개발: 복잡한 다단계 프로그래밍 워크플로우를 처리합니다.

기술 문서

자세한 성능 소개 및 기술 문서는 다음 위치에서 찾을 수 있습니다.

Qwen3-Coder는 오픈소스 AI 프로그래밍 모델의 최신 돌파구를 대표하며, 개발자와 기업에 강력한 지능형 프로그래밍 도구를 제공하여 AI 지원 소프트웨어 개발의 최전선을 추진합니다.

Star History Chart