O Google anunciou nesta terça-feira (19), no Google I/O 2026, em Mountain View (EUA), o Gemini Omni, um modelo de IA voltado à criação e edição de vídeos com aspecto ultrarrealista — e um detalhe que promete mexer no fluxo de trabalho de criadores: você pode “editar conversando” com a IA. Em vez de arrastar clipes e cortar na unha, basta descrever em texto o que quer mudar. Se cumprir o que promete, é como ter um editor assistente que não dorme, não reclama e entende contexto de cena. Se não cumprir, bem, pelo menos não cobra hora extra.
O que o Omni faz (e por que isso importa)
Segundo o Google, o Omni combina imagens, áudio, vídeo e texto para gerar vídeos de alta qualidade e também permite enviar um vídeo já gravado para editar por comandos em linguagem natural. A empresa diz que o usuário pode tanto alterar detalhes específicos quanto transformar completamente uma cena apenas conversando com a IA. Mais ambicioso ainda: o modelo teria a capacidade de “entender o que deveria acontecer em seguida” para dar continuidade ao vídeo — algo que, se funcionar bem, aproxima a edição da lógica de direção e storyboard automatizados. Minha leitura? Estamos testando a fronteira entre “edição” e “coautoria algorítmica”.
Como usar e onde chega primeiro
A tecnologia começa a ser disponibilizada hoje para assinantes dos planos Google AI Plus, Pro e Ultra. O Omni poderá ser usado no app do Gemini, no Google Flow e no YouTube Shorts. O Google diz ainda que a ferramenta será liberada gratuitamente no YouTube Shorts e no aplicativo YouTube Create ainda nesta semana — um claro empurrão para criadores móveis e para formatos curtos. Estratégia típica: abrir a porta onde a adoção é mais rápida (Shorts), enquanto os planos pagos atendem quem precisa de mais poder (ou mais minutos de processamento).
Avatares digitais: entre o recurso e o risco
O pacote inclui a criação de um avatar digital com a sua própria voz e aparência — em outras palavras, um deepfake de si mesmo, com consentimento. O Google ressalta:
“Estamos comprometidos em desenvolver IA de forma responsável e temos políticas claras para proteger os usuários de danos e governar o uso de nossas ferramentas de IA.”
Ótimo ouvir, mas minha pulga atrás da orelha continua: quanto mais fácil for “virar outra pessoa” em vídeo, mais importante será o controle de identidade e o contexto de uso. No mínimo, isso terá impacto em campanhas, atendimento virtual e, claro, publicidade — onde clones autorizados são um sonho barato para marcas e um novo contrato para artistas.
Marca-d’água e rastreabilidade
Todo conteúdo criado ou editado pelo Omni virá com SynthID, a marca-d’água digital imperceptível do Google para identificar mídias geradas por IA. Isso ajuda na rastreabilidade e na checagem de autenticidade — um cinto de segurança necessário numa estrada cada vez mais rápida. Minha aposta: a adoção ampla de marcas-d’água vai virar exigência de plataformas, especialmente em conteúdo político e publicitário.
Omni x Veo 3: o que muda
O Google já tinha o Veo 3, modelo de IA para gerar vídeos realistas no esquema clássico “texto para vídeo”. A diferença, segundo Koray Kavukcuoglu, diretor de tecnologia do Google DeepMind e arquiteto-chefe de IA do Google, é estratégica:
“O Veo funciona no modelo tradicional de ‘texto para vídeo’. Já o Gemini Omni é um modelo multimodal nativo, construído desde o início sobre a estrutura do Gemini.”
Tradução do Maumau: o Veo é o gerador; o Omni quer ser o editor-diretor-continuidade, entendendo linguagem, imagem e contexto em conjunto. Para o mercado, isso sinaliza duas linhas de produto complementares: criação “do zero” e edição/iteração inteligente sobre material existente.
Para quem é isso agora
- Criadores de Shorts e Reels: edição por texto e integração com YouTube Shorts/YouTube Create devem reduzir atrito e acelerar publicações.
- Pequenas produtoras: pedir refinamentos rápidos (“clarear a cena”, “trocar o céu por um entardecer”, “estabilizar o take 3”) sem abrir o Premiere pode cortar tempo — e custo.
- Marcas e times internos: avatares autorizados e iteração multimodal criam novos formatos de atendimento e treinamento em vídeo.
Limites práticos (o reality check do editor)
Ferramentas “sem linha do tempo” são ótimas para 80% das mudanças; nos 20% finais (cor de pele fiel, mix fino de áudio, cortes no quadro exato), o editor humano ainda reina. E a promessa de “saber o que vem a seguir” é poderosa, mas pode tropeçar em continuidade complexa, humor sutil e intenção de direção — três coisas que, na prática, exigem sensibilidade. Ou seja: eu vejo o Omni como coeditor acelerador, não como substituto do olhar criativo.
O que vem aí
O Google trabalha em uma versão mais potente, a Omni Pro, “prevista para breve”, sem detalhes divulgados. Traduzindo do gogolês: prepare-se para mais parâmetros, mais minutos de geração e, possivelmente, ferramentas de controle fino para workflows profissionais.
Fechamento
O Gemini Omni aponta para um futuro em que edição de vídeo é conversa — literalmente. Com disponibilidade global para assinantes e uma porta gratuita via Shorts e YouTube Create, o Google joga pesado no ecossistema de criadores. Entre o entusiasmo (menos cliques, mais ideias) e a cautela (avatares, autenticidade, limites de precisão), meu veredito do dia é pragmático: teste cedo, teste muito e mantenha o crédito do diretor. Porque, no fim, se a IA sabe “o que deveria acontecer em seguida”, o público ainda sabe o que quer ver agora. E esse roteiro continua sendo nosso.