엔비디아의 네모트론 3 슈퍼, 오픈소스 에이전트 AI의 규칙을 다시 쓰다

March 13, 2026

엔비디아

3 min

뉴스 요약

2026년 3월 11일 수요일(미국 동부 시간), NVIDIA는 자율 멀티 에이전트 AI 애플리케이션을 위해 특별히 설계된 강력한 새로운 오픈 소스 대규모 언어 모델인 Nemotron 3 Super를 공식 출시했습니다. 이번 출시는 미국 오픈 소스 AI 분야를 선도하려는 NVIDIA의 광범위한 전략에서 중요한 이정표를 세웠으며, 오픈 모델 AI 개발에 260억 달러가 투자된 것으로 알려졌습니다.

1,200억 개의 매개변수를 가진 강력한 모델

Nemotron 3 Super는 하이브리드 Mixture-of-Experts(MoE) 아키텍처 덕분에 추론 시 120억 개의 활성 매개변수만으로 작동하는 1,200억 개의 매개변수 모델입니다. 이 설계는 Mamba-2 상태 공간 레이어와 Transformer 어텐션 레이어를 결합하여 모델이 뛰어난 메모리와 계산 효율성으로 긴 컨텍스트 작업을 처리할 수 있도록 합니다. 이전 모델인 Nemotron Super보다 5배 이상의 처리량을 제공하며, 이전 세대보다 2배 높은 정확도를 자랑합니다.

에이전트 AI의 두 가지 핵심 문제 해결

NVIDIA는 Nemotron 3 Super를 멀티 에이전트 AI 시스템의 두 가지 지속적인 병목 현상을 직접 해결하기 위해 구축했습니다. 첫 번째는 "컨텍스트 폭발"로, 에이전트가 매 턴마다 도구 출력, 추론 단계 및 대화 기록을 다시 보낼 때 발생하는 지수적인 토큰 증가입니다. 이를 해결하기 위해 Nemotron 3 Super는 기본 100만 토큰 컨텍스트 창을 제공하여 에이전트가 원래 목표와의 정렬을 잃지 않고 장기간 작업에 대한 전체 워크플로우 인식을 유지할 수 있도록 합니다.

두 번째는 "사고세"로, 복잡한 워크플로우의 각 하위 작업에 대해 대규모 추론 모델을 배포하는 데 드는 막대한 비용입니다. 이 모델의 하이브리드 MoE 아키텍처와 세 가지 핵심 혁신은 이를 직접적으로 해결합니다. Latent MoE(동일한 컴퓨팅 비용으로 4배 더 많은 전문가를 활성화), Multi-Token Prediction(순방향 패스당 여러 토큰을 예측하여 생성 시간 대폭 단축), 기본 NVFP4 정밀도 학습(Hopper의 FP8 대비 NVIDIA Blackwell GPU에서 최대 4배 빠른 추론 가능)입니다.

완전 오픈 및 엔터프라이즈 준비 완료

많은 고성능 모델과 달리 Nemotron 3 Super는 허용적인 라이선스 하에 완전한 오픈 가중치, 데이터셋 및 학습 레시피와 함께 출시됩니다. NVIDIA는 10조 개 이상의 큐레이션된 사전 학습 토큰, 4천만 개의 사후 학습 샘플 및 21가지 구성의 강화 학습 환경을 게시합니다. 개발자는 Hugging Face, build.nvidia.com, OpenRouter 및 Perplexity에서 모델에 액세스하고 NVIDIA NIM 마이크로서비스를 통해 배포할 수 있습니다.

엔터프라이즈 액세스는 Google Cloud Vertex AI 및 Oracle Cloud Infrastructure를 통해 제공되며, Amazon Bedrock 및 Microsoft Azure 배포도 곧 제공될 예정입니다.

산업 채택 및 벤치마크 성능

선도적인 AI 네이티브 기업들이 이미 이 모델을 통합했습니다. Perplexity는 Nemotron 3 Super를 Computer 제품의 20개 오케스트레이션 모델 중 하나로 제공합니다. 소프트웨어 개발 에이전트 회사인 CodeRabbit, Factory 및 Greptile은 정확도를 높이고 컴퓨팅 비용을 절감하기 위해 이를 배포하고 있습니다. Palantir, Cadence, Siemens 및 Amdocs를 포함한 엔터프라이즈 대기업들도 통합을 약속했습니다.

경쟁 벤치마크 측면에서 Nemotron 3 Super는 효율성과 개방성 측면에서 Artificial Analysis에서 최고 자리를 차지했습니다. Nemotron 3 Super를 기반으로 하는 NVIDIA의 AI-Q 연구 에이전트는 DeepResearch Bench 및 DeepResearch Bench II 모두에서 1위를 차지했습니다. 이 모델은 PinchBench에서 85.6%를 기록하여 Anthropic의 Claude Opus 4.5, Kimi 2.5 및 GPT-OSS 120B를 능가했습니다. 처리량 비교에서 OpenAI의 GPT-OSS 120B보다 2.2배, Alibaba의 Qwen3.5-122B보다 7.5배 빠릅니다.

더 큰 그림: 오픈 AI를 국가 전략으로

NVIDIA CEO 젠슨 황은 오픈 혁신의 전략적 중요성을 강조하며, 회사가 고급 AI를 개발자에게 에이전트 시스템을 대규모로 구축하는 데 필요한 투명성과 효율성을 제공하는 개방형 플랫폼으로 전환하는 것을 목표로 한다고 말했습니다. 분석가들은 Nemotron 3 출시가 지정학적 플레이이기도 하다고 지적합니다. 중국의 Qwen 및 Kimi 모델이 오픈 소스 분야를 장악함에 따라 Nemotron은 미국에 경쟁력 있고 완전히 투명한 대안을 제공합니다.

Nemotron 3 Super는 Nemotron 3 제품군 중간에 위치하며, 이전에 출시된 300억 매개변수 Nemotron 3 Nano(2025년 12월 출시) 위에 있고 아직 출시일이 발표되지 않은 예상 5,000억 매개변수 Nemotron 3 Ultra 아래에 있습니다.