Googleが謎のNano Bananaの正体を明かす:Gemini 2.5画像AIモデルが業界の新基準をリード

August 28, 2025
GoogleBlog
3 min

ニュース概要

Googleは、コードネーム「Nano Banana」の次世代AI画像生成・編集モデル、公式名称「Gemini 2.5 Flash Image」のリリースを正式に確認しました。このモデルは8月26日にGeminiアプリで正式にリリースされ、それ以前に匿名テストプラットフォームLMArenaで話題を呼び、世界トップクラスの画像編集モデルと評価されていました。

謎のコードネームが憶測を呼ぶ、Googleが正式に「認める」

ここ数週間、AI画像編集モデル「Nano Banana」がソーシャルメディアで大きな話題となっていました。このモデルは、まずクラウドソーシング評価プラットフォームLMArenaに登場し、匿名で他のAIモデルと「対戦」していました。ユーザーはプロンプトを入力し、2つの匿名モデルに最適な結果を生成させることで競わせることができました。驚くべきことに、この謎のモデルは画像編集ランキングで他の競合モデルを継続的に打ち破り、広範な注目と憶測を呼びました。

Google DeepMindのCEOであるデミス・ハサビス氏でさえ、顕微鏡で見た「奇妙な物体」の画像をTwitterに投稿し、このバナナ関連のプロジェクトを示唆していました。8月26日、GoogleはNano Bananaが確かに自社の内部プロジェクトであることを正式に認め、Geminiアプリに統合しました。

技術的ブレイクスルー:95%以上のキャラクター一貫性を維持

新モデルの核となる強みは、その優れたキャラクターの一貫性維持能力にあります。ユーザーは、同じキャラクターを異なる環境に配置したり、単一の製品を複数の角度から表示したり、一貫したブランドアセットを生成したりすることができ、その際、被写体の特徴を完璧に維持します。コミュニティの報告によると、Nano Bananaは95%以上のアイデンティティ保持率を達成し、初回試行での成功率は約90%で、他のAIモデルの性能をはるかに上回ります。

Googleはブログで次のように説明しています。「自分自身や身近な人の写真を編集する際、わずかな欠陥も重要であることを私たちは知っています。『似ているが完全に同じではない』描写は、違和感を与えるものです。だからこそ、私たちの最新のアップデートは、60年代のハチの巣ヘアスタイルを試したり、チワワにバレエのチュチュを着せたりする場合でも、友人、家族、さらにはペットの写真が常に彼ら自身に見えるように設計されています。」

強力な機能、幅広い応用

このモデルは、複数の画像を単一の画像にブレンドする、キャラクターの一貫性を保ちながら豊かなストーリーテリングを行う、自然言語を用いてターゲットを絞った変換を行う、そしてGeminiの持つ世界知識を活用して画像を生成・編集するなど、様々な高度な機能をサポートしています。ユーザーは背景を変更したり、写真の個々の細部を編集したり、想像上のあらゆる写真の中に自分を配置したり、好きなスタイルで表現したり、さらには画像のデザインスタイルを抽出して他のオブジェクトに適用したりすることができます。

このモデルはすでに複数の業界で実用的な価値を示しています。Eコマースプラットフォームでは、製品画像の色のバリエーションやスタイルを拡張するために使用され、コンバージョン率が34%向上したと報告されています。コンテンツチームは、数日かかっていた作業をわずか1時間で完全なマーケティングキャンペーンを構築できるようになり、作業時間が大幅に短縮されました。ゲームスタジオは、NPCのために数千ものキャラクターポートレートを生成しています。建築会社は、顧客の修正を2ラウンドスキップできるほどの室内モデル図を生成しています。

価格戦略とセキュリティ保証

Gemini 2.5 Flash Imageは、Gemini API、Google AI Studio、Vertex AIを通じて開発者および企業ユーザーに提供され、価格は100万出力トークンあたり30ドルです。1枚の画像は1290出力トークンに相当します(画像1枚あたり約0.039ドル)。

一般ユーザー向けには、無料のGeminiユーザーは1日最大100回まで画像編集が可能で、有料ユーザーは編集回数が10倍に増加します。ディープフェイク画像の問題に対処するため、Gemini 2.5 Flash Imageを通じて作成または編集されたすべての画像には、目に見えないSynthIDデジタル透かしと、AIが生成または編集したコンテンツであることをユーザーが識別できる可視の識別子が含まれます。

業界への影響と将来の展望

Googleのプロダクトリーダーであるニコール・ブリチトワ氏がインタビューで述べたところによると、「私たちは視覚的な品質の向上と、モデルが指示に従う能力を真に推進しています。ユーザーにクリエイティブな制御権を与え、モデルから望む結果を得られるようにしたいと考えていますが、それは何でもできるという意味ではありません。」

Nano Banana AIのリリースは、画像編集分野における初の真のブレイクスルーと見なされており、他のツールでよく見られる歪みや不整合の問題を回避し、写真レベルの品質を提供できます。側面写真を正面写真に変換するような単純な編集から、複数人、シーケンスの変化、さらには絵コンテを含む複雑な変換まで、Gemini、Seedream、FLUX、GPT-4oなどのトップモデルを常に凌駕しています。

Googleは、長文のレンダリング、より信頼性の高いキャラクターの一貫性、および画像内の詳細な事実表現を積極的に改善していると述べています。この革新は、AI画像生成技術がより実用的で信頼性が高く、使いやすい方向へと進化していることを示しており、クリエイティブ産業全体のワークフローを再定義する可能性を秘めています。