Google revela la verdadera identidad del misterioso Nano Banana: el modelo de IA de imagen Gemini 2.5 lidera el nuevo estándar de la industria

August 28, 2025

GoogleBlog

5 min

Resumen de Noticias

Google ha confirmado oficialmente el lanzamiento de su nueva generación de modelos de edición y generación de imágenes con IA, cuyo nombre en clave es "Nano Banana" y cuyo nombre oficial es Gemini 2.5 Flash Image. El modelo se lanzó oficialmente en la aplicación Gemini el 26 de agosto, después de haber causado sensación en la plataforma de pruebas anónimas LMArena, donde fue calificado como el modelo de edición de imágenes líder a nivel mundial.

Misterioso nombre en clave genera especulaciones, Google lo "reclama" oficialmente

En las últimas semanas, un modelo de edición de imágenes con IA llamado "Nano Banana" ha causado furor en las redes sociales. El modelo apareció por primera vez en LMArena, una plataforma de evaluación colaborativa, donde "se enfrentó" de forma anónima a otros modelos de IA. Los usuarios podían introducir indicaciones para que dos modelos anónimos compitieran en la generación del mejor resultado. Sorprendentemente, este misterioso modelo superó constantemente a sus competidores en la clasificación de edición de imágenes, lo que generó una gran atención y especulaciones.

Demis Hassabis, CEO de Google DeepMind, incluso publicó en Twitter una imagen de un "objeto extraño" bajo un microscopio, insinuando este proyecto relacionado con el plátano. El 26 de agosto, Google reconoció oficialmente que Nano Banana era de hecho su proyecto interno y lo integró en la aplicación Gemini.

Avance tecnológico: Mantenimiento de la consistencia del personaje en más del 95%

La principal ventaja del nuevo modelo radica en su excelente capacidad para mantener la consistencia del personaje. Los usuarios pueden colocar el mismo personaje en diferentes entornos, mostrar un solo producto desde múltiples ángulos o generar activos de marca consistentes, manteniendo perfectamente las características del sujeto. Según los informes de la comunidad, Nano Banana puede lograr una tasa de retención de identidad de más del 95%, con una tasa de éxito en el primer intento de aproximadamente el 90%, superando con creces el rendimiento de otros modelos de IA.

Google explicó en su blog: "Sabemos que al editar fotos de uno mismo o de personas conocidas, los defectos sutiles importan; una representación 'cercana pero no exactamente igual' puede sentirse incorrecta. Por eso, nuestra última actualización está diseñada para que las fotos de tus amigos, familiares e incluso mascotas siempre se parezcan a ellos mismos, ya sea que estés probando un peinado colmena de los años 60 o vistiendo a tu chihuahua con un tutú de ballet".

Funcionalidad potente, amplia aplicación

El modelo admite una variedad de funciones avanzadas, que incluyen la mezcla de múltiples imágenes en una sola, la narración de historias enriquecida con consistencia de personajes, transformaciones específicas utilizando lenguaje natural y el aprovechamiento del conocimiento mundial de Gemini para generar y editar imágenes. Los usuarios pueden cambiar fondos, editar detalles individuales en fotos, colocarse en cualquier foto imaginaria, presentarse en cualquier estilo deseado e incluso extraer el estilo de diseño de una imagen y aplicarlo a otros objetos.

El modelo ya ha demostrado su valor práctico en múltiples industrias: las plataformas de comercio electrónico lo utilizan para expandir las variantes de color y estilos de las imágenes de productos, reportando un aumento del 34% en las tasas de conversión; los equipos de contenido pueden construir campañas de marketing completas en una hora, lo que antes requería días de trabajo ahora se reduce drásticamente; los estudios de juegos lo utilizan para generar miles de retratos de personajes para PNJ; las empresas de arquitectura generan planos de modelos de interiores, lo suficiente como para saltarse dos rondas de modificaciones del cliente.

Estrategia de precios y seguridad

Gemini 2.5 Flash Image se ofrece a desarrolladores y usuarios empresariales a través de Gemini API, Google AI Studio y Vertex AI, con un precio de 30 dólares por cada millón de tokens de salida, lo que equivale a 1290 tokens de salida por imagen (aproximadamente 0,039 dólares por imagen).

Para los usuarios comunes, los usuarios gratuitos de Gemini pueden crear hasta 100 ediciones de imágenes al día, y los usuarios de pago pueden aumentar el número de ediciones diez veces. Para abordar el problema de las imágenes deepfake, todas las imágenes creadas o editadas a través de Gemini 2.5 Flash Image incluirán una marca de agua digital invisible SynthID, así como una identificación visible, para que los usuarios puedan reconocer el contenido generado o editado por IA.

Impacto en la industria y perspectivas futuras

Nicole Brichtova, líder de producto de Google, declaró en una entrevista: "Realmente estamos impulsando el progreso en la calidad visual y la capacidad del modelo para seguir instrucciones. Queremos dar a los usuarios control creativo para que puedan obtener los resultados que desean del modelo, pero eso no significa que todo sea posible".

El lanzamiento de Nano Banana AI se considera el primer avance real en el campo de la edición de imágenes, ya que evita las distorsiones e inconsistencias comunes en otras herramientas y puede ofrecer una calidad a nivel fotográfico. Desde ediciones simples (como convertir una foto de perfil en una de frente) hasta transformaciones complejas que involucran a varias personas, cambios secuenciales o incluso guiones gráficos, siempre supera a los modelos líderes como Gemini, Seedream, FLUX y GPT-4o.

Google ha declarado que está mejorando activamente el renderizado de texto largo, una consistencia de personajes más fiable y la representación fáctica de detalles finos en las imágenes. Esta innovación marca que la tecnología de generación de imágenes con IA está avanzando hacia una dirección más práctica, fiable y fácil de usar, con el potencial de redefinir los flujos de trabajo de toda la industria creativa.