Pular para o conteúdo

Google e a Nova IA de Vídeos: Veo 3 e Além

Avanços em geração de vídeo por IA, seus recursos, concorrentes e desafios éticos

​O Google vem avançando rapidamente no campo de geração de vídeo por inteligência artificial. Em abril de 2025, a empresa lançou o Veo 2, uma ferramenta capaz de criar videoclipes curtos (até 8 segundos) em 720p a partir de descrições de texto. Pouco depois, durante o evento Google I/O em maio, apresentou o Veo 3 – terceira versão do modelo desenvolvido pela DeepMind – que eleva a qualidade dos vídeos gerados a outro nível. O Veo 3 consegue produzir vídeos de até 60 segundos em resolução 1080p, com movimentos suaves, iluminação realista e efeitos físicos avançados, incluindo a incorporação automática de áudio como trilha sonora, efeitos sonoros e até diálogos sincronizados com o movimento labial dos personagens. Essa evolução marcou um salto tecnológico no campo de síntese de vídeo, sendo descrita pelos especialistas como um divisor de águas na produção audiovisual.

​Além de seus modelos de geração de vídeo, o Google anunciou o Flow, uma plataforma de “filmmaking” movida a IA. O Flow integra os modelos Veo (vídeo), Imagen (imagem) e Gemini (texto) em um único ambiente de criação, projetado para facilitar o trabalho de roteiristas e videomakers. Por meio dele, criadores podem descrever cenas em linguagem natural, selecionar ângulos de câmera, gerenciar personagens e até importar ativos próprios (como imagens ou esboços), gerando sequências cinematográficas coerentes. Em palavras da equipe do Google, o Flow foi desenhado para que “time slows down and creation is effortless” com saída cinematográfica e aderência excepcional aos comandos dado. Em resumo, o Google posiciona essas ferramentas como recursos para ajudar na concepção de conteúdo audiovisual criativo e de alta qualidade.

​No mercado de IA para vídeo, há concorrentes em destaque. A OpenAI lançou o Sora, modelo que permite criar vídeos de até 60 segundos através do ChatGPT, com capacidade de gerar dezenas de clipes mensais (usuários Pro podem produzir vídeos de 20 segundos a uma taxa rápida. Há também startups e plataformas independentes: por exemplo, Fliki gera vídeos de até 5 minutos com locução e múltiplos idiomas usando prompts de texto, com versão gratuita limitada e planos pagos sem marca d’água. A Synthesia.io foca em criar vídeos com avatares virtuais para usos corporativos, permitindo aulas ou apresentações em mais de 140 idiomas e até avatares customizados. O Runway AI destaca-se por oferecer ferramentas de edição e referência visual, em que o usuário pode fornecer imagens ou vídeos base para gerar novas cenas – incluindo recursos como lip-sync em fotos estáticas e expansão inteligente de cena; há planos gratuitos com saída em 720p e assinaturas pagas para mais recursos. Essas soluções têm ênfases diversas (desde clipes explicativos até avatares falantes), mas todas competem no crescente mercado de mídia gerada por IA.

​O avanço dessas IAs levanta importantes questões éticas. Ferramentas como Veo, Sora e Runway utilizam redes neurais profundas que podem criar deepfakes – vídeos hiper-realistas que mostram pessoas fazendo coisas que nunca fizeram na realidade. Estudos e reportagens alertam que, com o barateamento dessas tecnologias, criminosos e agentes de desinformação podem produzir conteúdos falsos convincentes e amplificar notícias falsas. A lei e plataformas já enfrentam desafios para detectar e moderar esse tipo de conteúdo, pois as filmagens sintéticas estão cada vez mais difíceis de diferenciar das reais. Assim, pesquisadores e reguladores pedem atenção: há debates sobre rotular vídeos gerados, direitos de imagem e limites criativos. O Google tem buscado implementar restrições de uso (por exemplo, exigindo contas pagas e responsabilidades no acesso ao Veo), mas especialistas insistem que transparência e educação serão cruciais para evitar abusos na era dos vídeos gerados por IA.

​Quanto ao futuro, ainda há incertezas em relação à evolução dessas tecnologias. As fontes consultadas não trazem previsões concretas, mas a expectativa geral é que os modelos avancem em capacidade e realismo: espera-se que em breve sejam capazes de gerar vídeos ainda mais longos, em resoluções 4K ou superiores, com interatividade e fluidez maiores. Para o setor audiovisual, isso indica uma tendência de fusão entre criatividade humana e automação de IA, potencialmente acelerando produções de vídeo e democratizando efeitos especiais. Contudo, especialistas alertam que paralelamente será cada vez mais importante discutir regulamentações éticas e jurídicas, de modo a garantir que o poder de “criar a realidade” pela IA seja usado de forma responsável.

Musk e Trump: A Nova Discordância Política entre Bilionário e Presidente
Embate em alta entre ex-parceiros políticos, entre críticas mútuas e ameaças oficiais