Gemini Omni: nova tecnologia do Google permite editar vídeos ‘conversando’ com a IA

O Google anunciou nesta terça-feira (19), no Google I/O 2026, em Mountain View (EUA), o Gemini Omni, um modelo de IA voltado à criação e edição de vídeos com aspecto ultrarrealista — e um detalhe que promete mexer no fluxo de trabalho de criadores: você pode “editar conversando” com a IA. Em vez de arrastar clipes e cortar na unha, basta descrever em texto o que quer mudar. Se cumprir o que promete, é como ter um editor assistente que não dorme, não reclama e entende contexto de cena. Se não cumprir, bem, pelo menos não cobra hora extra.

O que o Omni faz (e por que isso importa)

Segundo o Google, o Omni combina imagens, áudio, vídeo e texto para gerar vídeos de alta qualidade e também permite enviar um vídeo já gravado para editar por comandos em linguagem natural. A empresa diz que o usuário pode tanto alterar detalhes específicos quanto transformar completamente uma cena apenas conversando com a IA. Mais ambicioso ainda: o modelo teria a capacidade de “entender o que deveria acontecer em seguida” para dar continuidade ao vídeo — algo que, se funcionar bem, aproxima a edição da lógica de direção e storyboard automatizados. Minha leitura? Estamos testando a fronteira entre “edição” e “coautoria algorítmica”.

Como usar e onde chega primeiro

A tecnologia começa a ser disponibilizada hoje para assinantes dos planos Google AI Plus, Pro e Ultra. O Omni poderá ser usado no app do Gemini, no Google Flow e no YouTube Shorts. O Google diz ainda que a ferramenta será liberada gratuitamente no YouTube Shorts e no aplicativo YouTube Create ainda nesta semana — um claro empurrão para criadores móveis e para formatos curtos. Estratégia típica: abrir a porta onde a adoção é mais rápida (Shorts), enquanto os planos pagos atendem quem precisa de mais poder (ou mais minutos de processamento).

Avatares digitais: entre o recurso e o risco

O pacote inclui a criação de um avatar digital com a sua própria voz e aparência — em outras palavras, um deepfake de si mesmo, com consentimento. O Google ressalta:

“Estamos comprometidos em desenvolver IA de forma responsável e temos políticas claras para proteger os usuários de danos e governar o uso de nossas ferramentas de IA.”

Ótimo ouvir, mas minha pulga atrás da orelha continua: quanto mais fácil for “virar outra pessoa” em vídeo, mais importante será o controle de identidade e o contexto de uso. No mínimo, isso terá impacto em campanhas, atendimento virtual e, claro, publicidade — onde clones autorizados são um sonho barato para marcas e um novo contrato para artistas.

Marca-d’água e rastreabilidade

Todo conteúdo criado ou editado pelo Omni virá com SynthID, a marca-d’água digital imperceptível do Google para identificar mídias geradas por IA. Isso ajuda na rastreabilidade e na checagem de autenticidade — um cinto de segurança necessário numa estrada cada vez mais rápida. Minha aposta: a adoção ampla de marcas-d’água vai virar exigência de plataformas, especialmente em conteúdo político e publicitário.

Omni x Veo 3: o que muda

O Google já tinha o Veo 3, modelo de IA para gerar vídeos realistas no esquema clássico “texto para vídeo”. A diferença, segundo Koray Kavukcuoglu, diretor de tecnologia do Google DeepMind e arquiteto-chefe de IA do Google, é estratégica:

“O Veo funciona no modelo tradicional de ‘texto para vídeo’. Já o Gemini Omni é um modelo multimodal nativo, construído desde o início sobre a estrutura do Gemini.”

Tradução do Maumau: o Veo é o gerador; o Omni quer ser o editor-diretor-continuidade, entendendo linguagem, imagem e contexto em conjunto. Para o mercado, isso sinaliza duas linhas de produto complementares: criação “do zero” e edição/iteração inteligente sobre material existente.

Para quem é isso agora

Criadores de Shorts e Reels: edição por texto e integração com YouTube Shorts/YouTube Create devem reduzir atrito e acelerar publicações.
Pequenas produtoras: pedir refinamentos rápidos (“clarear a cena”, “trocar o céu por um entardecer”, “estabilizar o take 3”) sem abrir o Premiere pode cortar tempo — e custo.
Marcas e times internos: avatares autorizados e iteração multimodal criam novos formatos de atendimento e treinamento em vídeo.

Limites práticos (o reality check do editor)

Ferramentas “sem linha do tempo” são ótimas para 80% das mudanças; nos 20% finais (cor de pele fiel, mix fino de áudio, cortes no quadro exato), o editor humano ainda reina. E a promessa de “saber o que vem a seguir” é poderosa, mas pode tropeçar em continuidade complexa, humor sutil e intenção de direção — três coisas que, na prática, exigem sensibilidade. Ou seja: eu vejo o Omni como coeditor acelerador, não como substituto do olhar criativo.

O que vem aí

O Google trabalha em uma versão mais potente, a Omni Pro, “prevista para breve”, sem detalhes divulgados. Traduzindo do gogolês: prepare-se para mais parâmetros, mais minutos de geração e, possivelmente, ferramentas de controle fino para workflows profissionais.

Fechamento

O Gemini Omni aponta para um futuro em que edição de vídeo é conversa — literalmente. Com disponibilidade global para assinantes e uma porta gratuita via Shorts e YouTube Create, o Google joga pesado no ecossistema de criadores. Entre o entusiasmo (menos cliques, mais ideias) e a cautela (avatares, autenticidade, limites de precisão), meu veredito do dia é pragmático: teste cedo, teste muito e mantenha o crédito do diretor. Porque, no fim, se a IA sabe “o que deveria acontecer em seguida”, o público ainda sabe o que quer ver agora. E esse roteiro continua sendo nosso.

Gemini Omni: nova tecnologia do Google permite editar vídeos ‘conversando’ com a IA

O que o Omni faz (e por que isso importa)

Como usar e onde chega primeiro

Avatares digitais: entre o recurso e o risco

Marca-d’água e rastreabilidade

Omni x Veo 3: o que muda

Para quem é isso agora

Limites práticos (o reality check do editor)

O que vem aí

Fechamento

Maumau

Deixe um comentário Cancelar resposta

Tecnologia brasileira: entenda como ressonância magnética portátil vai usar IA para melhorar imagens e reduzir custos do SUS

‘Panelas’ no Discord escondem ‘as mais perversas formas de crime’ contra crianças, diz policial infiltrada

Para fortalecer acordo comercial, Trump suspende restrições à exportação de tecnologia para a China, diz jornal

Samsung lança celular dobrável ‘fininho’ no Brasil; veja preços

Tecnologia brasileira: entenda como ressonância magnética portátil vai usar IA para melhorar imagens e reduzir custos do SUS

Sorriso Maroto, Jorge Aragão e Tiee, festival Meli Music, cinema ao ar livre, festas: veja o que fazer em SP neste fim de semana

‘Panelas’ no Discord escondem ‘as mais perversas formas de crime’ contra crianças, diz policial infiltrada

Zita Carvalhosa, produtora de cinema e criadora do festival de curtas Kinoforum, morre aos 65 anos em SP

Para fortalecer acordo comercial, Trump suspende restrições à exportação de tecnologia para a China, diz jornal

Governo de Goiás abre 424 vagas para cursos gratuitos de tecnologia em Goiânia e Senador Canedo

Robôs x robôs: o que operação na Ucrânia revela sobre a guerra do futuro

Cemitério de Manaus vira sala de cinema para exibir documentário sobre santa popular assassinada em 1901

Author

Gemini Omni: nova tecnologia do Google permite editar vídeos ‘conversando’ com a IA

O que o Omni faz (e por que isso importa)

Como usar e onde chega primeiro

Avatares digitais: entre o recurso e o risco

Marca-d’água e rastreabilidade

Omni x Veo 3: o que muda

Para quem é isso agora

Limites práticos (o reality check do editor)

O que vem aí

Fechamento

Deixe um comentário Cancelar resposta

You May Also Like