Google, Gemini 3 시리즈 정식 출시: AI 추론 능력 비약적 향상, 출시 당일 검색 엔진 통합으로 새로운 이정표 달성

November 19, 2025
Google,Gemini3
6 min

요약

구글은 미국 동부 시간 기준 2025년 11월 18일, 자사 역사상 가장 지능적인 AI 모델인 ‘제미나이(Gemini) 3 시리즈’를 정식 출시했다. 제미나이 3 프로(Gemini 3 Pro)는 업계 권위 있는 LMArena 순위표에서 1501점을 기록하며 1위에 올랐으며, 총 19개 벤치마크 테스트 전 항목에서 경쟁 모델들을 압도했다. 새 모델은 추론 능력, 멀티모달 이해력, 코드 생성 분야에서 중대한 돌파구를 마련했으며, ‘생성형 인터페이스(Generative UI)’ 등 혁신적인 신기능도 도입했다. 동시에 구글은 새로운 ‘제미나이 에이전트(Gemini Agent)’ 기능과 ‘안티그라비티(Antigravity)’ 코드 개발 플랫폼을 선보이며 AI 경쟁에서의 입지를 더욱 공고히 했다.

핵심 성능 돌파

제미나이 3 프로는 업계에서 널리 인정받는 LMArena 순위표에서 1501점이라는 획기적인 점수를 달성해, 이전 세대인 제미나이 2.5 프로의 1451점을 넘어섰다. 구글이 공개한 데이터에 따르면, 해당 모델은 주요 벤치마크 20개 중 19개에서 최고 점수를 기록하며 전반적인 기술 우위를 입증했다.

학문적 테스트 측면에서 제미나이 3 프로는 ‘인류의 마지막 시험(Humanity's Last Exam)’에서 37.5%의 정확도를 달성했다. 이 시험은 100개 이상의 학문 분야를 아우르는 2500개의 난제로 구성되어 있으며, 오픈AI의 GPT-5.1이 기록한 26.5%보다 약 11%p 높은 성과다. 박사급 과학 문제 벤치마크인 GPQA Diamond에서는 91.9%를 기록해, 기존 GPT-5.1이 보유하던 87.6%의 기록을 넘어섰다.

수학적 추론 분야에서는 MathArena Apex에서 23.4%라는 신기록을 수립했다. 멀티모달 추론 능력 측면에서는 MMMU-Pro 테스트에서 81%, Video-MMMU 테스트에서 87.6%를 달성하며 시각적 이해 분야에서 선두 자리를 확고히 했다.

딥싱크(Deep Think) 모드의 뛰어난 성능

구글은 또한 ‘제미나이 3 딥싱크(Deep Think)’ 모드를 발표했다. 이는 심층 추론에 특화된 버전으로, 향후 몇 주 내에 구글 AI 울트라(Google AI Ultra) 구독자(월 249.99달러)에게 우선 제공될 예정이다. 딥싱크 모드는 ‘인류의 마지막 시험’에서 41.0%의 정확도를, GPQA Diamond에서는 93.8%의 성과를 거뒀다.

가장 주목할 만한 점은 ARC-AGI 테스트(코드 실행 활성화 기준)에서 제미나이 3 딥싱크가 사상 최초로 45.1%라는 기록을 세웠고, 제미나이 3 프로 역시 31.1%를 달성했다는 점이다. 반면 2위를 차지한 GPT-5.1 Thinking(High)은 겨우 17.6%에 그쳤으며, 이는 2~3배에 달하는 성능 격차를 보여준다. ARC-AGI는 AI의 범용 지능과 새로운 문제 해결 능력을 평가하는 핵심 지표로 간주된다.

제품 통합 및 사용 가능성

11월 18일부터 제미나이 3 프로는 전 세계 모든 사용자에게 공개되었다. 사용자는 제미나이 앱, AI 모드(AI Mode), AI 오버뷰(AI Overviews) 내 모델 선택기를 통해 ‘Thinking’ 모드를 선택하여 새 모델을 이용할 수 있다. 구글 AI Plus, Pro, Ultra 구독 사용자는 더 높은 사용 한도를 제공받는다.

개발자들은 구글 AI 스튜디오(Google AI Studio), 제미나이 API(Gemini API), 버텍스 AI(Vertex AI)를 통해 제미나이 3 프로에 접근할 수 있다. API 가격은 입력 토큰 백만 개당 2달러, 출력 토큰 백만 개당 12달러(프롬프트 길이 20만 토큰 미만 기준)로, 제미나이 2.5 프로 대비 소폭 인상되었다.

생성형 인터페이스 혁신

제미나이 3은 ‘생성형 인터페이스(Generative UI)’ 개념을 도입했다. 이는 모델이 실시간으로 상호작용 가능한 인터페이스를 생성하는 방식으로, 사용자의 프롬프트에 따라 웹사이트, 게임, 도구, 애플리케이션 등 전체 사용자 경험을 자동으로 설계하고 맞춤화할 수 있다.

현재 제미나이 앱 내에서 두 가지 실험적 기능이 출시되고 있다. ‘비주얼 레이아웃(Visual Layout)’은 사진과 모듈이 포함된 잡지 스타일의 몰입형 뷰를 제공하며, ‘다이내믹 뷰(Dynamic View)’는 각 프롬프트에 맞춰 완전히 맞춤화된 상호작용형 응답을 설계하고 코드로 구현한다. 예를 들어, 5세 아동에게 미생물군집(microbiome)을 설명할 때와 성인에게 설명할 때 필요한 내용과 기능이 다르므로, 시스템은 자동으로 인터페이스 디자인을 조정한다.

제미나이 에이전트, 자동화 작업 지원

제미나이 에이전트는 실험적 기능으로, 구글 AI 울트라 구독자에게 우선적으로 제공된다. 이 기능은 제미나이 앱 내에서 다단계 작업을 직접 처리할 수 있으며, 제미나이 3의 고급 추론 능력, 실시간 웹 브라우징, 도구 활용 능력(Canvas, Deep Research, Gmail, Google Calendar 포함)을 결합한다.

예를 들어 사용자가 “받은편지함을 정리해줘”라고 요청하면, 시스템은 관련 이메일을 그룹화하고 빠른 보관 및 읽음 표시 옵션을 제공한다. 또 다른 예시로는 “내 메일에 있는 정보를 바탕으로 다음 주 여행을 위해 하루 80달러 이하의 중형 SUV를 예약해줘”라는 요청이 있다. 이 경우 제미나이는 항공편 정보를 확인하고 예산 내에서 렌터카 옵션을 조사한 후 예약을 준비한다. 단, 구매나 이메일 발송 같은 중요한 작업은 반드시 사용자 승인을 받은 후 실행한다.

안티그라비티 개발 플랫폼

구글은 동시에 ‘구글 안티그라비티(Google Antigravity)’라는 새로운 AI 에이전트 개발 플랫폼도 공개했다. 이 플랫폼은 개발자가 “더 높은 수준의 작업 중심(task-oriented)으로” 코딩할 수 있도록 지원한다. 통합 개발 환경(IDE)은 ChatGPT와 유사한 프롬프트 창, 명령줄 인터페이스, 브라우저 창을 결합해 코드 변경 사항의 실제 효과를 즉시 시각화할 수 있다.

구글 제품 부사장 조시 우드워드(Josh Woodward)는 제미나이 3을 회사 “역사상 최고의 컨텍스트 기반 코딩 모델”이라고 평가했다. 이 에이전트는 에디터, 터미널, 브라우저를 넘나들며 복잡한 종단간(end-to-end) 소프트웨어 작업을 자율적으로 계획·실행할 수 있으며, 자신의 코드를 스스로 검증할 수 있다.

시장 포지셔닝 및 경쟁 상황

제미나이 3의 출시 시점은 오픈AI가 GPT-5.1을 발표한 지 일주일도 채 되지 않았고, 앤서로픽(Anthropic)이 클로드 소넷 4.5(Claude Sonnet 4.5)를 출시한 지 불과 두 달 만이다. 이는 최첨단 AI 모델 개발의 치열한 경쟁 속도를 여실히 보여준다.

구글 CEO 순다르 피차이(Sundar Pichai)는 블로그 글에서 “단 2년 만에 AI는 단순한 텍스트와 이미지 해석에서 ‘상황을 파악하는 능력’까지 진화했다”고 말하며, “오늘부터 구글의 규모로 제미나이를 전면 배포할 것”이라고 선언했다.

데이터에 따르면, 제미나이 앱은 현재 월간 활성 사용자(MAU)가 6억 5천만 명이며, AI 오버뷰는 월간 20억 명의 사용자를 보유하고 있다. 이에 비해 오픈AI는 지난 8월 챗GPT의 주간 활성 사용자가 7억 명에 달한다고 밝힌 바 있다. 구글 클라우드 고객의 70% 이상이 AI 서비스를 사용 중이며, 1300만 명의 개발자가 이미 구글의 생성형 모델을 활용해 애플리케이션을 구축하고 있다.

응답 품질 최적화

구글 딥마인드(Google DeepMind) CEO 데미스 하사비스(Demis Hassabis)는 제미나이 3 기반 AI 응답이 “진부한 표현과 아첨 대신 통찰을 제공할 것”이라며, “사용자가 듣고 싶은 것이 아니라 꼭 들어야 할 것을 전달할 것”이라고 강조했다. 이는 현재 AI 챗봇이 지나치게 아첨하는 경향에 대한 업계 비판에 대한 대응이다.

구글은 제미나이 3 프로의 응답이 “똑똑하고, 간결하며, 직설적”이며, 문맥과 사용자 의도를 이해하는 능력이 크게 향상되었기 때문에 “사용자가 원하는 결과를 얻기 위해 더 적은 프롬프트만으로도 충분하다”고 설명했다.

타사 통합 지원

제미나이 3은 커서(Cursor), 깃허브(GitHub), 제트브레인스(JetBrains), 마누스(Manus), 클라인(Cline) 등 여러 타사 개발 도구의 지원을 이미 확보했다. 클라인의 AI 책임자 닉 파쉬(Nik Pash)는 “클라인은 개발자의 IDE 내에서 제미나이 3을 활용해 자율적인 코드 생성을 지원하고 있다. 제미나이 3 프로는 전체 코드베이스를 아우르는 복잡하고 장기적인 작업—다중 파일 리팩토링, 디버깅 세션, 기능 구현—을 처리할 수 있으며, 작업 맥락을 유지한다. 이 모델은 제미나이 2.5 프로보다 긴 컨텍스트를 훨씬 효율적으로 활용하며, 다른 선도 모델들이 겪고 있는 문제들을 해결했다”고 밝혔다.

향후 전망

구글은 곧 제미나이 3 시리즈에 추가 모델들을 출시해 사용자들이 AI로 더 많은 일을 할 수 있도록 지원할 계획이다. 또한 미국 대학생들에게 무료로 구글 AI 프로(Google AI Pro) 1년 사용권을 제공해, 제미나이 3을 포함한 최고 수준의 구글 AI 서비스를 이용할 수 있도록 보장할 예정이다.

제미나이 3 출시와 함께, 구글은 선도적인 인프라에서부터 세계적 수준의 연구 및 모델, 그리고 전 세계 수십억 명에게 도달하는 제품에 이르기까지 AI 분야의 풀스택(full-stack) 접근법을 통해 첨단 기술을 더욱 빠르게 시장에 적용하고 있다. AI 무장 경쟁은 전례 없는 속도로 가속되고 있으며, 제미나이 3의 출시는 분명히 2025년 AI 분야에서 가장 중대한 사건 중 하나로 기록될 것이다.