OpenAI presenta el modelo Sora 2 y la aplicación social homónima: la generación de video con IA entra en la era de la sincronización de audio y video
Resumen
OpenAI lanzó oficialmente el 30 de septiembre Sora 2, su modelo de generación de video con IA de nueva generación, y al mismo tiempo presentó la aplicación social complementaria para iOS, Sora. El nuevo modelo logra por primera vez la sincronización de video y audio generados por IA, incluyendo la generación automática de diálogos y efectos de sonido. La aplicación adopta un diseño de flujo de videos cortos similar a TikTok, y actualmente solo está disponible en Estados Unidos y Canadá, operando bajo un sistema de invitación.
Avance tecnológico: Mejora significativa en la precisión física
Sora 2 ha logrado mejoras notables en la simulación física, el realismo y la controlabilidad. A diferencia de los modelos de video anteriores que a menudo presentaban deformaciones de objetos y violaciones de las leyes físicas, Sora 2 es capaz de manejar escenas de acción complejas, como movimientos de gimnasia, trucos de skate y saltos de buceo, y seguir las reglas físicas del mundo real.
Los miembros del equipo de investigación de OpenAI, Bill Peebles, Rohan Sahai y Thomas Dimson, demostraron las diversas capacidades del modelo en una transmisión en vivo de YouTube. Los videos de demostración incluyeron partidos de voleibol de playa, actuaciones de trucos de skate y rutinas de gimnasia, mostrando una fluidez y un realismo sin precedentes.
Sincronización de audio y video: Superando una deficiencia clave
La actualización más destacada es que Sora 2 es el primer modelo en admitir la generación de audio con IA que coincide con las imágenes de video, incluyendo diálogos y efectos de sonido sincronizados. Esta función subsana una deficiencia importante del modelo Sora original. Cuando OpenAI presentó por primera vez el modelo Sora a principios de 2024, causó un gran revuelo en la industria, pero no se abrió al público hasta diciembre de 2024. Durante este período, competidores como Runway, Luma y Kling lanzaron sus propios modelos de video con capacidades de generación de audio.
Aplicación social: Desafiando a las plataformas de videos cortos
Junto con Sora 2, se lanzó la aplicación para iOS llamada Sora, que presenta un diseño de flujo de videos cortos recomendado por algoritmos. La característica más distintiva de la aplicación es "Cameo" (aparición especial), que permite a los usuarios insertar sus propias imágenes y las de sus amigos en videos generados por IA, previa autorización. OpenAI ha declarado que ha establecido estrictas medidas de protección de identidad para evitar el uso no autorizado de la imagen de otras personas.
Actualmente, la aplicación funciona con un modelo gratuito, y OpenAI afirma que esto es para que los usuarios puedan explorar libremente sus funciones. El único plan de pago es para la generación adicional de videos durante las horas pico.
Surgen controversias sobre derechos de autor
El primer día del lanzamiento de la aplicación Sora, algunos usuarios generaron videos de personajes de juegos protegidos por derechos de autor, como Mario y Pikachu, lo que generó preocupación entre los expertos en derechos de autor. Mark McKenna, profesor de derecho de la UCLA, señaló que si OpenAI permite la salida de contenido protegido por derechos de autor, a menos que los usuarios opten por no participar, esta práctica podría no cumplir con las disposiciones de la ley de derechos de autor.
Además, algunos usuarios generaron videos del CEO de OpenAI, Sam Altman, robando piezas de computadora en una tienda, lo que subraya el riesgo potencial de esta tecnología para crear contenido falso. Para abordar estos problemas, OpenAI ha declarado que todos los videos generados a través de la aplicación o el sitio web de Sora llevarán una marca de agua móvil y se etiquetarán en los metadatos como generados por IA.
Fiebre creativa de los usuarios y fenómenos de parodia
Tras el lanzamiento de Sora 2, las redes sociales chinas experimentaron un auge en la creación de videos con IA. Los usuarios generaron videos de diversas temáticas, incluyendo dramas históricos, dramas urbanos modernos y eventos deportivos. Algunos internautas incluso crearon escenarios ficticios de la selección masculina de fútbol de China ganando la Copa del Mundo, así como varios videos de parodia dirigidos a Sam Altman.
Posicionamiento en el mercado: La combinación de modelo y producto
Los analistas señalan que la estrategia de OpenAI ha pasado de la pura competencia de modelos a una combinación de "modelo + producto". Cuando una tecnología cruza el umbral de usabilidad, OpenAI lanza rápidamente aplicaciones complementarias, utilizando barreras de producto para fidelizar a los usuarios. Esta estrategia ya se había validado anteriormente con ChatGPT y la herramienta de generación de código Codex.
Actualmente, la aplicación Sora se ha convertido en la aplicación más descargada en la categoría de Fotos y Videos de la App Store de iOS. OpenAI ha declarado que espera expandir sus servicios a más países y regiones lo antes posible.
Los lectores que utilicen esta tecnología deben prestar atención al cumplimiento de las leyes y regulaciones pertinentes, y respetar la privacidad y los derechos de propiedad intelectual de los demás.