谷歌发布Nano Banana Pro AI图像工具:支持多语言文本渲染与14元素混合
摘要
谷歌于2025年11月20日(美国东部时间)发布了Nano Banana Pro,这是一款基于Gemini 3 Pro构建的新一代AI图像生成与编辑工具。该模型在文本渲染、多元素融合和创意控制方面实现了突破性进展,支持在图像内生成清晰可读的多语言文字,并能同时融合多达14个图像元素,同时保持最多5人面部的一致性。Nano Banana Pro现已上线Gemini应用、Google Ads、Workspace及其他产品,免费用户享有有限配额,订阅用户则拥有更高使用额度。
谷歌宣布于2025年11月20日(美国东部时间)推出Nano Banana Pro,标志着自今年8月发布初代Nano Banana以来的一次重大升级。该模型基于谷歌最新的Gemini 3 Pro打造,代表了公司在AI图像生成技术领域的最高成就。
Nano Banana Pro的核心突破体现在三大关键领域。首先,模型在文本渲染能力上取得显著进步,能够在图像中直接生成清晰、准确且易于阅读的文字,支持从简短标语到长段落的各种格式,并具备多语言生成、本地化及翻译功能,使用户能够创建包含复杂文字信息的海报、信息图和示意图。
其次,Nano Banana Pro具备强大的多元素融合能力。模型可同时处理多达14个图像元素,并保持最多5人之间的面部一致性。这一功能使用户能够将草图转化为产品原型,将蓝图变为逼真的3D结构,或创建复杂的合成场景,同时维持品牌形象的视觉统一。
第三,Nano Banana Pro提供专业级的创意控制功能。用户可调整摄像角度、更改焦点、应用色彩分级,甚至改变场景光照效果。模型支持局部编辑,允许用户选择、优化并变换图像任意部分,同时支持多种宽高比以及高达2K和4K的输出分辨率。
Nano Banana Pro还可连接至Google Search知识库,获取天气、体育比分等实时信息,基于真实世界数据生成内容丰富的信息图和教育类视觉内容。这一能力使其不仅能创作视觉吸引力强的图像,还能生成具有教育意义和信息价值的视觉作品。
在产品可用性方面,Nano Banana Pro已集成至多个谷歌产品中。消费者和学生可通过Gemini应用中的“生成图像”功能,选择“Thinking”模型使用Nano Banana Pro。免费用户享有有限配额,超出后将自动切换回原始Nano Banana模型;Google AI Plus、Pro和Ultra订阅用户则享有更高的使用额度。
对于专业用户,Google Ads中的图像生成功能已升级为Nano Banana Pro,并逐步推广至Google Slides和Vids等Workspace应用。开发者和企业用户可通过Gemini API、Google AI Studio和Vertex AI访问该模型。此外,Google AI Ultra订阅用户可在AI影视制作工具Flow中使用Nano Banana Pro。
在AI内容识别方面,谷歌已采取多项措施确保透明度。所有由谷歌工具生成的媒体均嵌入不可见的SynthID数字水印。用户现在可在Gemini应用中直接上传图片,询问其是否由谷歌AI生成。免费用户和Google AI Pro用户生成的图像将带有可见的Gemini闪光水印,而Google AI Ultra订阅用户及Google AI Studio开发工具生成的图像则去除可见水印。
初代Nano Banana自8月发布后迅速走红,其将自拍转换为超现实3D人像的能力在社交媒体引发热潮。据谷歌实验室及Gemini副总裁乔什·伍德沃德(Josh Woodward)透露,Nano Banana在四天内为Gemini应用带来了1300万新用户。目前Gemini应用月活跃用户超过6.5亿,而由Gemini驱动的AI概览功能月活用户已达20亿。
Nano Banana Pro的发布正值谷歌与OpenAI在生成式AI领域激烈竞争之际。目前OpenAI的ChatGPT位居苹果App Store免费应用榜首,Gemini位列第二。OpenAI首席执行官山姆·奥尔特曼(Sam Altman)在10月表示,ChatGPT周活跃用户已达8亿。
除Nano Banana Pro外,谷歌正积极扩展其AI产品组合,持续推进AI影视制作工具Flow,以及“世界构建”模型Genie的发展,后者目前以限量研究预览形式提供。
Adobe也宣布将Nano Banana Pro集成至Firefly和Photoshop中。截至12月1日前,Creative Cloud Pro和Firefly套餐订阅用户可在Firefly应用中使用Firefly图像模型及合作模型无限生成图像。
关于AI图像生成的市场需求,伍德沃德指出,许多用户正在订阅Gemini服务以获得更高的使用额度。他表示这是“最理想的问题”,公司正努力应对强劲的需求。
分析人士指出,Nano Banana Pro的发布标志着AI图像生成技术进入新阶段,重点从简单的图像生成转向更精准的文本渲染、多元素融合和专业级控制。应用场景也从个人创意表达拓展至专业设计、广告创作和企业级应用。
在Nano Banana Pro和Gemini 3 Pro发布后,Alphabet股价于11月21日上涨4%,创下历史新高,反映出市场对谷歌在AI领域持续创新能力的认可。