OpenAI lança o modelo Sora 2 e o aplicativo social de mesmo nome: a geração de vídeo AI inaugura a era da sincronização de áudio e vídeo
Resumo
A OpenAI lançou oficialmente em 30 de setembro o modelo de geração de vídeo por IA de nova geração, Sora 2, juntamente com o aplicativo social iOS Sora. O novo modelo alcançou pela primeira vez a sincronização de vídeo e áudio gerados por IA, incluindo a geração automática de diálogos e efeitos sonoros. O aplicativo adota um design de feed de vídeos curtos semelhante ao TikTok, atualmente disponível apenas nos EUA e Canadá, e opera por convite.
Avanço Tecnológico: Precisão Física Aumentada Significativamente
O Sora 2 alcançou melhorias significativas em simulação física, realismo e controlabilidade. Ao contrário dos modelos de vídeo anteriores que frequentemente apresentavam deformação de objetos e violação das leis da física, o Sora 2 é capaz de lidar com cenas de ação complexas, como movimentos de ginástica, truques de skate e mergulho, e segue as regras físicas do mundo real.
Os membros da equipe de pesquisa da OpenAI, Bill Peebles, Rohan Sahai e Thomas Dimson, demonstraram as várias capacidades do modelo em uma transmissão ao vivo no YouTube. Os vídeos de demonstração incluíram cenas como jogos de vôlei de praia, performances de truques de skate e movimentos de ginástica, exibindo fluidez e realismo sem precedentes.
Sincronização de Áudio e Vídeo: Preenchendo uma Lacuna Crucial
A atualização mais notável é que o Sora 2 suporta pela primeira vez a geração de áudio por IA que corresponde às imagens de vídeo, incluindo diálogos e efeitos sonoros sincronizados. Esta funcionalidade preenche uma falha importante do modelo Sora original. Quando a OpenAI revelou o modelo Sora pela primeira vez no início de 2024, causou sensação na indústria, mas só foi disponibilizado ao público em dezembro de 2024. Durante este período, concorrentes como Runway, Luma e Kling lançaram sucessivamente modelos de vídeo com capacidade de geração de áudio.
Aplicação Social: Desafiando Plataformas de Vídeos Curtos
Lançado simultaneamente com o Sora 2, o aplicativo iOS chamado Sora adota um design de feed de vídeos curtos com recomendação algorítmica. A funcionalidade mais distintiva do aplicativo é o "Cameo", que permite aos usuários, após autorização, inserir suas próprias imagens e as de amigos em vídeos gerados por IA. A OpenAI afirmou ter estabelecido medidas rigorosas de proteção de identidade para evitar o uso não autorizado da imagem de outras pessoas.
O aplicativo atualmente adota um modelo gratuito, e a OpenAI declarou que isso é para permitir que os usuários explorem livremente suas funcionalidades. O único plano de cobrança é para a geração de vídeos adicionais durante os períodos de pico.
Controvérsias de Direitos Autorais Surgem
No primeiro dia de lançamento do aplicativo Sora, usuários geraram vídeos de personagens de jogos protegidos por direitos autorais, como Mario e Pikachu, levantando preocupações entre especialistas em direitos autorais. O professor de direito da UCLA, Mark McKenna, apontou que se a OpenAI permitir a saída de conteúdo protegido por direitos autorais, a menos que os usuários optem por não participar, essa prática pode não estar em conformidade com as disposições da lei de direitos autorais.
Além disso, um usuário gerou um vídeo do CEO da OpenAI, Sam Altman, roubando peças de computador em uma loja, destacando o risco potencial da tecnologia na criação de conteúdo falso. Para lidar com essas questões, a OpenAI afirmou que todos os vídeos gerados através do aplicativo ou site Sora terão uma marca d'água móvel e serão marcados nos metadados como gerados por IA.
Onda de Criação de Usuários e Fenômenos de Paródia
Após o lançamento do Sora 2, uma onda de criação de vídeos por IA varreu as mídias sociais chinesas. Os usuários geraram vídeos de vários temas, incluindo dramas de época, dramas urbanos modernos, eventos esportivos, etc. Alguns internautas até criaram cenas fictícias da seleção chinesa de futebol masculino vencendo a Copa do Mundo, bem como vários vídeos de paródia visando Sam Altman.
Posicionamento de Mercado: Combinação de Modelo e Produto
Analistas apontam que a estratégia da OpenAI mudou da mera competição de modelos para uma combinação de "modelo + produto". Quando uma tecnologia ultrapassa o ponto crítico de usabilidade, a OpenAI lança rapidamente aplicativos complementares, usando barreiras de produto para fidelizar os usuários. Esta estratégia já foi comprovada anteriormente com o ChatGPT e a ferramenta de geração de código Codex.
Atualmente, o aplicativo Sora tornou-se o aplicativo mais baixado na categoria de Fotos e Vídeos da App Store do iOS. A OpenAI afirmou que espera expandir o serviço para mais países e regiões o mais rápido possível.
Ao usar esta tecnologia, os leitores devem estar atentos ao cumprimento das leis e regulamentos relevantes, respeitando a privacidade e a propriedade intelectual de terceiros.