BLM-Guard: Explainable Multimodal Ad Moderation with Chain-of-Thought and Policy-Aligned Rewards

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é o dono de uma grande praça pública (como o TikTok ou o Instagram Reels) onde milhões de pessoas vendem produtos. O problema é que, com a ajuda da Inteligência Artificial, qualquer um pode criar anúncios falsos, exagerados ou enganosos em segundos.

Alguns dizem "compre meu remédio e fique rico", outros mostram um celular "grátis" que na verdade é uma armadilha. Os filtros antigos de segurança eram como guardas que só olhavam para coisas óbvias, como nudez ou violência. Eles não conseguiam perceber a "mentira sutil" de um anúncio comercial.

É aqui que entra o BLM-Guard, o novo "super guarda" criado pelos pesquisadores da Kuaishou. Vamos explicar como ele funciona usando analogias do dia a dia:

1. O Problema: O Anúncio que "Fala uma Coisa e Mostra Outra"

Pense em um vendedor de rua que segura um cartaz escrito "Grátis!" (o texto), mas a voz dele sussurra "pague primeiro" (o áudio), enquanto ele mostra uma foto de um carro de luxo (o vídeo).

Os filtros antigos olhavam só para o cartaz e diziam: "Tudo bem, está escrito grátis".
O BLM-Guard é um detetive que percebe a contradição: "Ei, o texto diz uma coisa, a voz diz outra e a imagem é impossível. Isso é uma armadilha!"

2. A Solução: O "Detetive que Pensa em Voz Alta"

O segredo do BLM-Guard não é apenas dar uma resposta (Sim/Não), mas explicar o raciocínio, como um professor que mostra os cálculos no quadro.

Cadeia de Pensamento (Chain-of-Thought): Imagine que o modelo não é um robô que chuta a resposta. Ele é um detetive que escreve um diário antes de prender o suspeito.
- Passo 1 (Observação): "Vejo um celular novo no vídeo."
- Passo 2 (Análise): "O áudio diz que é grátis, mas o texto na tela pede um clique para 'resgatar'. Isso é contraditório."
- Passo 3 (Conclusão): "Isso viola a regra de 'Marketing Falso'."
  Isso torna a decisão transparente e confiável.

3. Como ele Aprendeu? (O Treinamento em Duas Etapas)

O modelo não nasceu sabendo tudo. Ele passou por um treinamento especial, como um estagiário que vira especialista:

Etapa 1: O "Manual de Regras" (SFT com ICoT)
Antes de aprender sozinho, o modelo recebeu um "livro de regras" gigante. Os pesquisadores criaram milhares de exemplos onde o modelo teve que seguir um roteiro: "Olhe a imagem, ouça o áudio, compare com a regra X e explique por que é proibido".
- Analogia: É como dar a um aluno um caderno de exercícios resolvidos passo a passo, para ele entender a lógica antes de fazer a prova.
Etapa 2: O "Treinamento com Feedback" (Reforço Inteligente)
Depois que ele aprendeu as regras, eles o colocaram em um "campo de batalha" com anúncios reais.
- Se ele acertava e explicava bem, ganhava um ponto.
- Se ele errava ou a explicação não fazia sentido, recebia uma "punição" (menos pontos).
- O Diferencial (Recompensa SCA-R): O modelo tem um "crítico" (um segundo cérebro) que olha o trabalho dele e diz: "Sua explicação foi lógica? Você seguiu a política da empresa?". Isso ajusta o modelo para não ser apenas preciso, mas também justo e consistente.

4. O Que ele Detecta? (O "Banco de Dados de Crimes")

Os pesquisadores criaram um banco de dados chamado BLM-Guard Benchmark, que é como um arquivo de casos criminais organizado por gravidade:

Nível Baixo: Um anúncio um pouco exagerado ("o melhor do mundo").
Nível Médio: Promessas enganosas ("ganhe dinheiro fácil").
Nível Alto: Golpes, superstições perigosas ou invasão de privacidade.
O modelo aprendeu a diferenciar esses níveis, sabendo quando é apenas um exagero e quando é um crime.

5. Os Resultados: Por que é melhor?

Quando testaram o BLM-Guard contra outros modelos famosos (como o LLaVA ou Qwen), ele venceu em tudo:

Precisão: Acertou mais os casos difíceis.
Consistência: Não mudou de opinião do nada (hoje diz "sim", amanhã diz "não" para a mesma coisa).
Generalização: Funcionou bem mesmo em vídeos que ele nunca viu antes, detectando mentiras sutis que outros modelos ignoravam.

Resumo em uma Frase

O BLM-Guard é como um inspetor de qualidade superinteligente que não apenas olha para o anúncio, mas lê a mente do vendedor, compara o que é dito com o que é mostrado, consulta o manual de leis da empresa e escreve um relatório detalhado explicando exatamente por que aquele anúncio é (ou não) seguro para você ver.

Isso garante que, quando você rolar o feed do seu celular, os anúncios sejam criativos, mas não enganosos.

BLM-Guard: Explainable Multimodal Ad Moderation with Chain-of-Thought and Policy-Aligned Rewards

1. O Problema: O Anúncio que "Fala uma Coisa e Mostra Outra"

2. A Solução: O "Detetive que Pensa em Voz Alta"

3. Como ele Aprendeu? (O Treinamento em Duas Etapas)

4. O Que ele Detecta? (O "Banco de Dados de Crimes")

5. Os Resultados: Por que é melhor?

Resumo em uma Frase

Resumo Técnico: BLM-Guard

1. O Problema

2. Metodologia

3. Contribuições Principais

4. Resultados Experimentais

5. Significado e Impacto

BLM-Guard: Explainable Multimodal Ad Moderation with Chain-of-Thought and Policy-Aligned Rewards

1. O Problema: O Anúncio que "Fala uma Coisa e Mostra Outra"

2. A Solução: O "Detetive que Pensa em Voz Alta"

3. Como ele Aprendeu? (O Treinamento em Duas Etapas)

4. O Que ele Detecta? (O "Banco de Dados de Crimes")

5. Os Resultados: Por que é melhor?

Resumo em uma Frase

Resumo Técnico: BLM-Guard

1. O Problema

2. Metodologia

3. Contribuições Principais

4. Resultados Experimentais

5. Significado e Impacto

Mais como este

Conversational Successes and Breakdowns in Everyday Smart Glasses Use

EmbodMocap: In-the-Wild 4D Human-Scene Reconstruction for Embodied Agents

GVGS: Gaussian Visibility-Aware Multi-View Geometry for Accurate Surface Reconstruction

PyEncode: An Open-Source Library for Structured Quantum State Preparation

DOne: Decoupling Structure and Rendering for High-Fidelity Design-to-Code Generation