구글, 미스터리 Nano Banana의 실체 공개: Gemini 2.5 이미지 AI 모델이 업계의 새로운 표준을 주도
뉴스 요약
구글은 코드명 "나노 바나나(Nano Banana)"로 알려진 차세대 AI 이미지 생성 및 편집 모델의 공식 출시를 확인했으며, 공식 명칭은 Gemini 2.5 Flash Image이다. 이 모델은 8월 26일 Gemini 앱에서 공식 출시되었으며, 앞서 익명 테스트 플랫폼 LMArena에서 센세이션을 일으키며 세계 최고의 이미지 편집 모델로 평가받았다.
신비한 코드명, 구글의 공식 '인정'
지난 몇 주 동안 "나노 바나나"라는 AI 이미지 편집 모델이 소셜 미디어에서 큰 화제를 모았다. 이 모델은 크라우드소싱 평가 플랫폼 LMArena에 처음 등장하여 다른 AI 모델들과 익명으로 '대결'을 펼쳤으며, 사용자들은 프롬프트 단어를 입력하여 두 익명 모델이 최상의 결과를 생성하도록 경쟁시킬 수 있었다. 놀랍게도 이 신비한 모델은 이미지 편집 순위에서 다른 경쟁자들을 지속적으로 압도하며 광범위한 관심과 추측을 불러일으켰다.
구글 딥마인드(DeepMind)의 CEO 데미스 하사비스(Demis Hassabis)는 심지어 현미경으로 본 '이상한 물체' 사진을 트위터에 게시하며 이 바나나 관련 프로젝트를 암시하기도 했다. 8월 26일, 구글은 나노 바나나가 실제로 자사의 내부 프로젝트임을 공식 인정하고 이를 Gemini 앱에 통합했다.
기술적 돌파: 95% 이상의 캐릭터 일관성 유지
새로운 모델의 핵심 강점은 뛰어난 캐릭터 일관성 유지 능력에 있다. 사용자들은 동일한 캐릭터를 다른 환경에 배치하거나, 단일 제품을 여러 각도에서 보여주거나, 일관된 브랜드 자산을 생성하면서도 주체의 특징을 완벽하게 유지할 수 있다. 커뮤니티 보고서에 따르면, 나노 바나나는 95% 이상의 정체성 유지율을 달성하며, 첫 시도 성공률은 약 90%로 다른 AI 모델의 성능을 훨씬 능가한다.
구글은 블로그에서 다음과 같이 설명했다. "우리는 자신이나 친숙한 사람의 사진을 편집할 때 미묘한 결함도 중요하다는 것을 알고 있습니다. '거의 같지만 완전히 같지 않은' 묘사는 어색하게 느껴질 수 있습니다. 이것이 바로 우리의 최신 업데이트가 친구, 가족, 심지어 반려동물의 사진이 60년대 벌집 머리 스타일을 시도하든 치와와에게 발레복을 입히든 항상 그들 자신처럼 보이도록 하는 것을 목표로 하는 이유입니다."
강력한 기능, 광범위한 응용
이 모델은 여러 고급 기능을 지원한다. 여기에는 여러 이미지를 단일 이미지로 혼합하는 기능, 캐릭터 일관성을 유지하여 풍부한 스토리텔링을 하는 기능, 자연어를 사용하여 특정 변환을 수행하는 기능, 그리고 Gemini의 세계 지식을 활용하여 이미지를 생성하고 편집하는 기능이 포함된다. 사용자들은 배경을 변경하고, 사진의 개별 세부 사항을 편집하고, 상상하는 어떤 사진에도 자신을 배치하고, 원하는 어떤 스타일로든 표현하며, 심지어 이미지의 디자인 스타일을 추출하여 다른 개체에 적용할 수도 있다.
이 모델은 이미 여러 산업에서 실용적인 가치를 입증했다. 전자상거래 플랫폼은 이를 사용하여 제품 이미지의 색상 변형과 스타일을 확장하며, 보고된 전환율이 34% 증가했다. 콘텐츠 팀은 몇 일이 걸리던 작업을 이제 한 시간 내에 완전한 마케팅 캠페인을 구축할 수 있게 되어 작업 시간이 크게 단축되었다. 게임 스튜디오는 이를 사용하여 NPC를 위한 수천 개의 캐릭터 초상화를 생성하고, 건축 회사는 두 번의 고객 수정 단계를 건너뛸 수 있을 만큼 충분한 실내 모델 도면을 생성한다.
가격 정책 및 보안 보장
Gemini 2.5 Flash Image는 Gemini API, Google AI Studio 및 Vertex AI를 통해 개발자와 기업 사용자에게 제공되며, 가격은 100만 출력 토큰당 30달러이다. 이미지 한 장은 1290 출력 토큰에 해당하며, 이는 이미지당 약 0.039달러이다.
일반 사용자의 경우, 무료 Gemini 사용자는 하루에 최대 100번의 이미지 편집을 할 수 있으며, 유료 사용자는 편집 횟수를 10배 늘릴 수 있다. 딥페이크 이미지 문제를 해결하기 위해 Gemini 2.5 Flash Image를 통해 생성되거나 편집된 모든 이미지에는 보이지 않는 SynthID 디지털 워터마크와 가시적인 식별자가 포함되어 사용자가 AI 생성 또는 편집 콘텐츠를 인식할 수 있도록 한다.
산업 영향 및 미래 전망
구글 제품 책임자 니콜 브리치토바(Nicole Brichtova)는 인터뷰에서 "우리는 시각적 품질의 발전과 모델이 지시를 따르는 능력을 진정으로 추진하고 있습니다. 우리는 사용자에게 창의적 통제권을 부여하여 모델로부터 원하는 결과를 얻을 수 있도록 하고 싶지만, 그렇다고 해서 무엇이든 가능하다는 의미는 아닙니다."라고 말했다.
나노 바나나 AI의 출시는 이미지 편집 분야에서 최초의 진정한 돌파구로 평가받고 있다. 이는 다른 도구에서 흔히 발생하는 왜곡 및 불일치 문제를 피하고 사진 수준의 품질을 제공할 수 있다. 측면 사진을 정면 사진으로 변환하는 것과 같은 간단한 편집부터 여러 사람, 순차적 변화, 심지어 스토리보드를 포함하는 복잡한 변환에 이르기까지, Gemini, Seedream, FLUX, GPT-4o와 같은 최고 모델들을 지속적으로 능가한다.
구글은 긴 텍스트 렌더링, 더욱 신뢰할 수 있는 캐릭터 일관성, 그리고 이미지 내 미세한 세부 사항의 사실적 표현을 적극적으로 개선하고 있다고 밝혔다. 이러한 혁신은 AI 이미지 생성 기술이 더욱 실용적이고 신뢰할 수 있으며 사용하기 쉬운 방향으로 발전하고 있음을 나타내며, 전체 크리에이티브 산업의 워크플로우를 재정의할 잠재력을 가지고 있다.