Google e a Nova IA de Vídeos: Veo 3 e Além

Avanços em geração de vídeo por IA, seus recursos, concorrentes e desafios éticos

O Google vem avançando rapidamente no campo de geração de vídeo por inteligência artificial. Em abril de 2025, a empresa lançou o Veo 2, uma ferramenta capaz de criar videoclipes curtos (até 8 segundos) em 720p a partir de descrições de texto. Pouco depois, durante o evento Google I/O em maio, apresentou o Veo 3 – terceira versão do modelo desenvolvido pela DeepMind – que eleva a qualidade dos vídeos gerados a outro nível. O Veo 3 consegue produzir vídeos de até 60 segundos em resolução 1080p, com movimentos suaves, iluminação realista e efeitos físicos avançados, incluindo a incorporação automática de áudio como trilha sonora, efeitos sonoros e até diálogos sincronizados com o movimento labial dos personagens. Essa evolução marcou um salto tecnológico no campo de síntese de vídeo, sendo descrita pelos especialistas como um divisor de águas na produção audiovisual.

Além de seus modelos de geração de vídeo, o Google anunciou o Flow, uma plataforma de “filmmaking” movida a IA. O Flow integra os modelos Veo (vídeo), Imagen (imagem) e Gemini (texto) em um único ambiente de criação, projetado para facilitar o trabalho de roteiristas e videomakers. Por meio dele, criadores podem descrever cenas em linguagem natural, selecionar ângulos de câmera, gerenciar personagens e até importar ativos próprios (como imagens ou esboços), gerando sequências cinematográficas coerentes. Em palavras da equipe do Google, o Flow foi desenhado para que “time slows down and creation is effortless” com saída cinematográfica e aderência excepcional aos comandos dado. Em resumo, o Google posiciona essas ferramentas como recursos para ajudar na concepção de conteúdo audiovisual criativo e de alta qualidade.

No mercado de IA para vídeo, há concorrentes em destaque. A OpenAI lançou o Sora, modelo que permite criar vídeos de até 60 segundos através do ChatGPT, com capacidade de gerar dezenas de clipes mensais (usuários Pro podem produzir vídeos de 20 segundos a uma taxa rápida. Há também startups e plataformas independentes: por exemplo, Fliki gera vídeos de até 5 minutos com locução e múltiplos idiomas usando prompts de texto, com versão gratuita limitada e planos pagos sem marca d’água. A Synthesia.io foca em criar vídeos com avatares virtuais para usos corporativos, permitindo aulas ou apresentações em mais de 140 idiomas e até avatares customizados. O Runway AI destaca-se por oferecer ferramentas de edição e referência visual, em que o usuário pode fornecer imagens ou vídeos base para gerar novas cenas – incluindo recursos como lip-sync em fotos estáticas e expansão inteligente de cena; há planos gratuitos com saída em 720p e assinaturas pagas para mais recursos. Essas soluções têm ênfases diversas (desde clipes explicativos até avatares falantes), mas todas competem no crescente mercado de mídia gerada por IA.

O avanço dessas IAs levanta importantes questões éticas. Ferramentas como Veo, Sora e Runway utilizam redes neurais profundas que podem criar deepfakes – vídeos hiper-realistas que mostram pessoas fazendo coisas que nunca fizeram na realidade. Estudos e reportagens alertam que, com o barateamento dessas tecnologias, criminosos e agentes de desinformação podem produzir conteúdos falsos convincentes e amplificar notícias falsas. A lei e plataformas já enfrentam desafios para detectar e moderar esse tipo de conteúdo, pois as filmagens sintéticas estão cada vez mais difíceis de diferenciar das reais. Assim, pesquisadores e reguladores pedem atenção: há debates sobre rotular vídeos gerados, direitos de imagem e limites criativos. O Google tem buscado implementar restrições de uso (por exemplo, exigindo contas pagas e responsabilidades no acesso ao Veo), mas especialistas insistem que transparência e educação serão cruciais para evitar abusos na era dos vídeos gerados por IA.

Quanto ao futuro, ainda há incertezas em relação à evolução dessas tecnologias. As fontes consultadas não trazem previsões concretas, mas a expectativa geral é que os modelos avancem em capacidade e realismo: espera-se que em breve sejam capazes de gerar vídeos ainda mais longos, em resoluções 4K ou superiores, com interatividade e fluidez maiores. Para o setor audiovisual, isso indica uma tendência de fusão entre criatividade humana e automação de IA, potencialmente acelerando produções de vídeo e democratizando efeitos especiais. Contudo, especialistas alertam que paralelamente será cada vez mais importante discutir regulamentações éticas e jurídicas, de modo a garantir que o poder de “criar a realidade” pela IA seja usado de forma responsável.

em Notícias

Musk e Trump: A Nova Discordância Política entre Bilionário e Presidente

Embate em alta entre ex-parceiros políticos, entre críticas mútuas e ameaças oficiais