구글, 제미니 3 플래시 배포: 최첨단 AI 인텔리전스가 전 세계적으로 플래시 속도 성능과 만나다

December 19, 2025

제미니3 플래시

4 min

뉴스 요약

Google이 최첨단 수준의 지능과 고속 성능, 비용 효율성을 결합한 최신 인공지능 모델인 Gemini 3 Flash를 공식 출시했습니다. 이 모델은 지난달 Gemini 3 Pro와 함께 처음 선보인 Gemini 3 제품군을 대폭 확장하는 의미로, 2025년 12월 18일(태평양 표준시)부터 전 세계적으로 배포되기 시작했습니다.

글로벌 출시 및 이용 가능성

Gemini 3 Flash는 지금부터 여러 플랫폼을 통해 전 세계 수백만 명의 사용자에게 배포됩니다. 이 모델은 이제 Gemini 앱의 기본 AI가 되어 이전의 Gemini 2.5 Flash를 대체합니다. 사용자는 Gemini 앱과 Google 검색의 AI 모드를 통해 무료로 액세스할 수 있습니다.

개발자 및 기업을 위해 Gemini 3 Flash는 Google AI Studio의 Gemini API, Google Antigravity(Google의 새로운 에이전트 개발 플랫폼), Gemini CLI, Android Studio, Vertex AI 및 Gemini Enterprise를 통해 미리 보기로 제공됩니다.

벤치마크 성능 및 기술 역량

Gemini 3 Flash는 고급 벤치마크에서 인상적인 성능을 보여주었으며, 도구 없이 GPQA Diamond에서 90.4%, Humanity's Last Exam에서 33.7%를 달성했습니다. 이는 더 큰 최첨단 모델과 경쟁할 만한 점수입니다. 또한 MMMU Pro에서 81.2%를 기록하며 멀티모달 이해에서 Gemini 3 Pro와 동등한 성능을 보였습니다.

Artificial Analysis 벤치마킹 데이터에 따르면, Gemini 3 Flash는 이전 모델인 Gemini 2.5 Pro에 비해 여러 벤치마크에서 훨씬 뛰어난 성능을 발휘하며 3배 더 빠르게 작동합니다.

가격 및 비용 효율성

API를 사용하는 개발자를 위해 Google은 입력 토큰당 100만 개에 0.50달러, 출력 토큰당 100만 개에 3.00달러로 가격을 책정했으며, 오디오 입력 토큰은 100만 개당 1.00달러입니다. 이는 Gemini 2.5 Flash의 가격(각각 0.30달러 및 2.50달러)보다 약간 오른 가격이지만, Google은 성능 향상이 비용 차이를 정당화한다고 강조합니다.

향상된 기능 및 사용 사례

Gemini 3 Flash는 멀티모달 추론 기능이 뛰어나 비디오 분석, 시각적 질의응답, 복잡한 코딩 작업, 데이터 추출과 같은 고급 애플리케이션을 가능하게 합니다. 이 모델은 이미지, 비디오, 오디오 녹음 및 텍스트를 동시에 처리하여 실시간 정보와 실용적인 권장 사항을 결합한 포괄적인 응답을 제공할 수 있습니다.

사용자는 콘텐츠 분석을 위해 비디오와 이미지를 업로드하거나, 실시간 AI 식별을 위해 스케치를 그리거나, 맞춤형 콘텐츠 생성을 위해 오디오 녹음을 제출할 수 있습니다. 또한 이 모델은 애플리케이션 구축을 위한 음성 받아쓰기를 지원하여 사용자가 전통적인 코딩 기술 없이도 아이디어를 작동하는 앱으로 변환할 수 있습니다.

기업 채택 및 업계 반응

주요 기술 기업들은 이미 Gemini 3 Flash를 운영에 통합하기 시작했습니다. 초기 도입 기업으로는 JetBrains, Figma, Cursor, Harvey, Latitude, Bridgewater Associates 등이 있으며, 이들은 모델의 속도, 효율성 및 추론 기능을 비즈니스 혁신에 활용하고 있습니다.

지난달 Gemini 3 Pro 출시 이후 Google은 API를 통해 하루에 1조 개 이상의 토큰을 처리하고 있으며, 이는 Gemini 3 제품군에 대한 개발자 및 기업의 강력한 채택을 나타냅니다.

경쟁 환경

이번 출시는 AI 분야의 경쟁이 심화되는 가운데 이루어졌습니다. OpenAI는 최근 GPT-5.2를 출시했으며, Google의 시장 점유율이 증가함에 따라 ChatGPT의 트래픽이 감소했다는 보고가 있습니다. Gemini 3 Flash의 출시 시점은 Google의 경쟁 우위를 유지하기 위한 전략적인 것으로 보입니다.

기술 아키텍처

Gemini 3 Flash는 품질 대 효율성의 파레토 최전선을 밀어붙이도록 설계되었습니다. 즉, 최소한의 컴퓨팅 비용으로 최대의 성능을 제공합니다. 이 모델은 유사한 작업을 위해 Gemini 2.5 Pro보다 30% 적은 토큰을 사용하면서도 뛰어난 추론 능력을 유지합니다.

이 모델에는 조정 가능한 사고 수준(최소, 낮음, 중간, 높음)과 같은 고급 기능이 포함되어 있어 개발자가 특정 사용 사례에 따라 응답 품질, 추론 복잡성, 지연 시간 및 비용의 균형을 맞출 수 있습니다.

소비자 경험 개선

Google 검색의 AI 모드에서 Gemini 3 Flash는 향상된 추론 능력과 쿼리 뉘앙스에 대한 개선된 이해를 제공합니다. 이 모델은 사용자의 쿼리 여러 측면을 고려하여 복잡한 질문을 더 효과적으로 분석하고, 연구와 즉각적인 조치를 결합한 포괄적이고 시각적으로 이해하기 쉬운 응답을 제공합니다.

또한 미국 사용자는 이제 검색 내에서 최첨단 이미지 생성 및 편집을 위한 Nano Banana Pro를 포함한 고급 AI 생성 도구를 갖춘 Gemini 3 Pro 모델에 대한 액세스가 확대되었습니다.

미래 전망

Gemini 3 Flash의 출시는 최첨단 수준의 지능을 대규모로 접근 가능하게 함으로써 고급 AI 기능을 민주화하려는 Google의 노력을 보여줍니다. Pro급 모델의 정교한 추론과 Flash급 속도 및 효율성을 결합함으로써 Google은 비용 효율성을 유지하면서 소비자 대상 챗봇부터 복잡한 기업 워크플로에 이르기까지 더 광범위한 애플리케이션을 가능하게 하는 것을 목표로 합니다.

Google은 Gemini 3 Pro, Gemini 3 Deep Think, Gemini 3 Flash를 포함하는 Gemini 3 제품군을 계속 확장하고 있으며, 개발자와 사용자에게 다양한 성능 및 비용 요구 사항에 맞는 포괄적인 AI 모델 제품군을 제공합니다.