알리바바, 조 단위 파라미터 플래그십 모델 Qwen3-Max-Preview 발표 - 중국 AI 기술의 새로운 시대 개막

September 09, 2025
Alibaba
4 min

뉴스 요약

알리바바는 2025년 9월 5일, 최초의 1조 개 매개변수 대규모 언어 모델 Qwen3-Max-Preview를 발표했다. 이는 Qwen 시리즈 중 가장 큰 매개변수 규모를 가진 플래그십 모델로, 중국 AI 기술이 초대규모 모델 분야에서 중대한 돌파구를 마련했음을 알린다. 이 모델은 비추론 아키텍처를 채택했으며, 여러 벤치마크 테스트에서 우수한 성능을 보였고, 100가지 이상의 언어를 지원한다. Qwen Chat 웹사이트를 통해 무료로 체험하거나 알리클라우드 바이리안 플랫폼 API를 통해 호출할 수 있다.

기술 사양 및 혁신적 돌파

Qwen3-Max-Preview는 Qwen3 시리즈의 플래그십 프리뷰 버전으로, 매개변수 규모가 1조 개를 넘어 알려진 개방형 API 모델 중 가장 큰 모델 중 하나가 되었다. 이 모델은 MoE(Mixture of Experts) 아키텍처를 채택하여 전문가 모듈을 동적으로 활성화하는 방식으로 강력한 성능을 유지하면서 추론 비용을 크게 절감한다.

주목할 점은 Qwen3-Max-Preview가 비추론 모델 아키텍처를 채택했음에도 불구하고, 최적화된 설계를 통해 추론 능력에서 현저한 향상을 이루었다는 것이다. 이 모델은 256K 토큰 이상의 컨텍스트 처리 능력을 지원하여 긴 문서, 복잡한 대화, 대규모 코드 파일 등의 시나리오를 처리할 수 있다.

전반적으로 뛰어난 성능

공식 발표된 벤치마크 테스트 결과에 따르면, Qwen3-Max-Preview는 여러 권위 있는 평가에서 뛰어난 성능을 보였다:

  • 수학적 추론 (AIME25): 80.6% 득점, 비추론 모델로서 뛰어난 성능
  • 프로그래밍 능력 (LiveCodeBench v6): 57.6% 득점, 프로그래밍 보조 능력 현저히 강화
  • 일반 지식 (SuperGPQA): 일반 지식 질의응답에서 강력한 이해 능력 발휘
  • 인간 선호도 정렬 (Arena-Hard v2): 복잡한 지시 이행 측면에서 우수한 성능

테스트 결과에 따르면, Qwen3-Max-Preview는 여러 지표에서 Claude Opus 4 (비사고 모드), Kimi K2, DeepSeek-V3.1 등 국내외 주요 모델들을 능가하며, 규모 확장(scaling)의 유효성을 입증했다.

핵심 능력 전면 업그레이드

이전 세대 Qwen2.5 시리즈와 비교하여 Qwen3-Max-Preview는 다음 몇 가지 측면에서 크게 향상되었다:

언어 이해 및 생성: 100가지 이상의 언어 지원, 중국어 및 영어 이해 능력 탁월, 다국어 번역 품질 현저히 향상.

추론 및 지시 실행: 복잡한 논리 추론 정확성 대폭 향상, 복잡한 지시에 대한 이해 및 실행 능력 강화, 모델 환각 현상 현저히 감소.

도구 호출 최적화: RAG(검색 증강 생성) 및 도구 호출에 대한 특별 최적화를 통해 강력한 AI 에이전트 애플리케이션 구축을 위한 기반 마련.

롱테일 지식 커버리지: 전문 분야 지식 커버리지 더욱 포괄적, 지식의 폭과 견고성 동시 향상.

응용 시나리오 및 상업적 가치

Qwen3-Max-Preview의 출시는 여러 산업에 새로운 응용 가능성을 가져왔다:

기업용 문서 처리: 초장문 컨텍스트 처리 능력으로 대규모 기업 문서, 계약 분석 등 복잡한 작업 처리 가능.

스마트 프로그래밍 도우미: 강력한 코드 이해 및 생성 능력으로 개발자에게 고품질 프로그래밍 지원 제공.

다국어 고객 서비스: 100가지 이상의 언어를 지원하여 다국적 기업에 통합된 다국어 고객 서비스 솔루션 제공.

콘텐츠 제작 및 전략 기획: 창의적 글쓰기, 광고 문구, 전략 분석 등 분야에서 강력한 잠재력 발휘.

비즈니스 전략 및 시장 포지셔닝

이전의 오픈소스 전략과 달리, 알리바바는 Qwen3-Max-Preview를 클로즈드 소스 상업 모델로 출시하기로 결정했다. 이 모델은 Claude, GPT-4와 유사한 가격 책정 전략을 채택했지만, 특정 비용 우위를 가지며 모델 성능에 대한 알리바바의 자신감을 보여준다.

사용자는 두 가지 방법으로 이 모델을 체험할 수 있다: 첫째, Qwen Chat (chat.qwen.ai) 웹사이트를 통해 무료로 체험하는 방법, 둘째, 알리클라우드 바이리안 플랫폼의 API 인터페이스를 통해 상업적으로 호출하는 방법이다. 플랫폼은 또한 신규 사용자에게 모델당 100만 무료 토큰의 체험 한도를 제공한다.

기술적 의미 및 산업 영향

Qwen3-Max-Preview의 출시는 중요한 기술적 의미와 산업적 가치를 지닌다:

기술적 돌파: 1조 개 매개변수 규모는 초대규모 모델 연구 개발 분야에서 중국 AI 기업의 기술력을 보여주며, 중국이 AI 기반 모델 분야에서 중요한 돌파구를 마련했음을 알린다.

산업 추진: 국내 AI 애플리케이션 개발자에게 세계적 수준의 기반 모델 지원을 제공하여 중국 AI 산업 전반의 발전을 촉진하는 데 기여한다.

경쟁 구도: 글로벌 AI 모델 경쟁에서 중국 기업들은 국제 선두 기업들과의 격차를 줄이고 있으며, 일부 지표에서는 선두를 달리고 있다.

미래 전망

프리뷰 버전으로서 Qwen3-Max-Preview의 능력은 계속해서 다듬어지고 있다. 알리바바는 정식 버전이 더 많은 놀라움을 가져올 것이며, "Scaling works"라는 개념이 모델 개발 방향을 계속해서 이끌 것이라고 밝혔다.

이 모델의 출시는 국제 AI 환경 변화의 중요한 시기에 이루어졌으며, 중국 AI 기술의 자주적 혁신에 대한 결단과 실력을 보여준다. 더 많은 사용자의 실제 경험과 피드백을 통해 Qwen3-Max-Preview는 기업용 애플리케이션에서 더 큰 가치를 발휘하고 중국 AI 산업 발전에 새로운 동력을 불어넣을 것으로 기대된다.

현재 이 모델은 알리클라우드 바이리안 플랫폼에서 API 접속 서비스를 개방했으며, 개발자들은 표준 OpenAI API 형식으로 빠르게 통합할 수 있어 스마트 고객 서비스, 콘텐츠 제작, 프로그래밍 보조 등 여러 분야에서 광범위하게 응용될 것으로 예상된다.