FREE-Edit: Using Editing-aware Injection in Rectified Flow Models for Zero-shot Image-Driven Video Editing

O artigo apresenta o FREE-Edit, um método zero-shot para edição de vídeo baseada em imagem que utiliza modelos de Rectified Flow e uma nova técnica de injeção "Editing-aware" (REE) para modular dinamicamente a intensidade da injeção de características, garantindo a preservação do movimento e da estrutura da fonte enquanto aplica edições apenas nas áreas relevantes.

Maomao Li, Yunfei Liu, Yu Li

Publicado 2026-03-03
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você tem um vídeo de uma festa animada e decide editar a primeira foto: você troca a roupa de um amigo, coloca um chapéu engraçado em outro ou muda a cor do céu. O grande desafio é: como fazer com que essa edição se espalhe por todo o vídeo, mantendo o movimento natural das pessoas, mas sem estragar o que não foi alterado?

É aí que entra o FREE-Edit, uma nova tecnologia descrita neste artigo. Vamos explicar como ela funciona usando analogias do dia a dia.

O Problema: O "Copiador" Desajeitado

Antes do FREE-Edit, os métodos de edição de vídeo funcionavam mais ou menos assim:

  1. Eles olhavam para o vídeo original e tentavam "desfazer" tudo até virar ruído (como se apagassem a memória do vídeo).
  2. Depois, eles tentavam "reconstruir" o vídeo usando a sua foto editada como guia.

Para garantir que as pessoas continuassem se movendo da mesma forma (não virando robôs travados), os métodos antigos injetavam informações do vídeo original durante a reconstrução. Mas eles faziam isso de forma cega e uniforme.

A Analogia do Pintor Desajeitado:
Imagine que você é um pintor tentando restaurar um quadro antigo, mas você quer mudar apenas o chapéu de um personagem.

  • O método antigo (Injeção "Vanilla"): O pintor pega a tinta do quadro original e a mistura com a sua nova tinta em toda a tela, sem olhar para onde está.
    • Resultado: Onde você queria mudar o chapéu, a tinta antiga "suja" a sua nova cor (o chapéu fica estranho). Onde você não queria mudar (o rosto), a tinta nova pode estragar a expressão. É um caos de cores conflitantes.

A Solução: O "Pintor Inteligente" (FREE-Edit)

Os autores criaram o FREE-Edit, que usa uma técnica chamada REE (Editing-awaRE). A palavra-chave aqui é "consciente" (aware).

A Analogia do Pintor com Máscara:
O FREE-Edit funciona como um pintor muito esperto que usa uma máscara de papel (um mapa de onde você fez a edição).

  1. Identificar a Edição: O sistema olha para a sua foto editada e compara com a original. Ele cria um mapa (máscara) que diz: "Aqui foi mudado o chapéu, aqui foi mudado o céu".
  2. Seguir o Movimento (Fluxo Óptico): O vídeo tem movimento. O chapéu se move para a esquerda, o céu se move para a direita. O FREE-Edit usa uma tecnologia chamada "fluxo óptico" (como se fosse um GPS visual) para rastrear essa máscara. Ele sabe exatamente para onde o "chapéu editado" vai em cada quadro seguinte.
  3. A Injeção Inteligente:
    • Nas áreas editadas (o chapéu): O sistema não mistura a tinta antiga. Ele deixa sua edição brilhar sozinha, garantindo que o chapéu continue com a cor e forma que você escolheu.
    • Nas áreas não editadas (o rosto, o fundo): Aqui, ele injeta a tinta do vídeo original. Isso garante que o movimento do rosto e do fundo continue perfeitamente natural, como no vídeo original.

O Resultado: Você tem um vídeo onde o chapéu mudou exatamente como você queria, mas a pessoa continua dançando e se movendo de forma natural, sem distorções ou "vazamentos" de cor.

Por que isso é especial?

  1. Não precisa de treinamento (Zero-shot): A maioria das IAs precisa ser "treinada" por dias com milhares de vídeos para aprender a editar. O FREE-Edit é como um kit de ferramentas pronto. Você pega um modelo de IA que já existe (o "LTX-Video") e aplica essa técnica de máscara inteligente. Funciona imediatamente, sem gastar tempo de computador treinando.
  2. Funciona com qualquer edição: Você pode adicionar objetos, remover pessoas, mudar estilos ou fundos. Como o sistema usa a diferença entre as imagens para criar a máscara, ele se adapta a qualquer mudança que você fizer na primeira foto.
  3. Velocidade: Como usa modelos que já são rápidos, a edição acontece em tempo real ou quase isso.

Resumo da Ópera

O FREE-Edit é como ter um assistente de edição de vídeo que:

  • Entende exatamente o que você mudou na primeira foto.
  • Sabe rastrear esses objetos mudados pelo resto do vídeo.
  • É inteligente o suficiente para não mexer no que você não pediu para mudar (preservando o movimento natural).
  • E faz tudo isso sem precisar estudar por meses, apenas usando o que já sabe.

É a diferença entre tentar colar um adesivo em um carro em movimento (o método antigo, que rasga e fica torto) e usar um adesivo magnético inteligente que se ajusta perfeitamente à curvatura do carro enquanto ele anda (o FREE-Edit).