Unbiased Rectification for Sequential Recommender Systems Under Fake Orders

Each language version is independently generated for its own context, not a direct translation.

Imagine que você tem uma loja online muito popular. Para ajudar os clientes a encontrar o que gostam, você usa um sistema de recomendação inteligente (como o da Netflix ou Amazon). Esse sistema aprende com o que você e seus amigos compraram ou clicaram no passado para prever o que você vai querer comprar amanhã.

Agora, imagine que alguns concorrentes desonestos querem sabotar sua loja. Eles não atacam o sistema diretamente; em vez disso, eles criam "pedidos falsos". Eles entram no histórico de compras de pessoas reais e inserem itens estranhos ou repetem o mesmo produto mil vezes, apenas para confundir o sistema e fazer com que ele recomende os produtos deles, e não os seus.

O artigo que você enviou apresenta uma solução inteligente para esse problema, chamada DITaR. Vamos entender como funciona usando analogias do dia a dia:

1. O Problema: O "Ruído" na Conversa

Pense no seu sistema de recomendação como um detetive que tenta entender o que você gosta ouvindo a história da sua vida (seus cliques e compras).

O que os bandidos fazem: Eles misturam mentiras nessa história. Às vezes, eles dizem que você comprou um "geladeira" logo após "sapatos" (sem sentido), ou repetem "sapatos" 50 vezes seguidas.
O resultado: O detetive fica confuso, acha que você gosta de sapatos gelados e começa a recomendar coisas erradas para você.

2. A Solução Antiga: "Cortar e Colar" (Retreinamento)

Antes, a única maneira de consertar isso era apagar todo o histórico de compras e começar do zero, como se o detetive tivesse amnésia e precisasse reaprender tudo do zero.

O problema: Isso é caro, demorado e você perde informações valiosas. É como jogar fora um livro inteiro só porque uma página foi rasgada.

3. A Solução DITaR: O "Detetive de Dupla Visão"

Os autores criaram um método chamado DITaR (Identificação de Dupla Visão e Retificação Direcionada). Eles usam duas lentes diferentes para olhar a mesma história, como se tivessem dois detetives trabalhando juntos:

A. A Lente 1: O Padrão Social (Visão Colaborativa)

Esta lente pergunta: "As pessoas que compram sapatos geralmente compram geladeiras?"

Se a resposta for "não", mas o histórico diz que sim, a lente 1 levanta uma bandeira vermelha. Ela olha para o que todos fazem em conjunto.

B. A Lente 2: O Significado das Coisas (Visão Semântica)

Esta lente pergunta: "Tem algum sentido lógico comprar uma geladeira depois de um sapato?"

Ela usa inteligência artificial (como o LLM Llama2) para entender o significado das palavras. Se não faz sentido, a lente 2 também levanta uma bandeira.

O Truque: Os pedidos falsos são feitos por robôs. Eles conseguem enganar uma lente, mas é muito difícil enganar as duas ao mesmo tempo de forma consistente. Quando as duas lentes discordam ou veem algo estranho, o sistema sabe: "Isso parece falso!"

4. O Grande Segredo: Nem Tudo que é Falso é Ruim

Aqui está a parte mais genial do artigo. Os autores descobriram que nem todo pedido falso é prejudicial.

Às vezes, um pedido "falso" (como trocar a ordem de dois itens) pode, sem querer, ajudar o sistema a aprender melhor, como um exercício de ginástica mental.
O erro dos outros: A maioria dos métodos antigos apaga tudo o que parece suspeito. Isso é como jogar fora um livro inteiro porque achou uma palavra errada.
O acerto do DITaR: Eles usam uma ferramenta chamada "Função de Influência". Pense nisso como um teste de estresse. O sistema pergunta: "Se eu apagar este pedido falso, o sistema fica melhor ou pior?"
- Se ficar pior: O pedido falso era útil (ou inofensivo). Deixamos ele ficar.
- Se ficar melhor: O pedido falso era venenoso. Apagamos ele.

5. A Cirurgia Precisa (Retificação Direcionada)

Em vez de reescrever todo o livro (retreinar o modelo), o DITaR faz uma microcirurgia.

Ele identifica apenas os "pedidos venenosos" (os que realmente atrapalham).
Ele dá um "empurrãozinho" matemático (gradiente ascendente) apenas nesses pontos específicos para corrigir o erro.
Resultado: O sistema fica limpo, rápido e não perde a memória do que realmente importa.

Resumo da Ópera

Imagine que você tem um jardim cheio de flores (seus dados reais).

Os bandidos jogaram algumas plantas venenosas e algumas pedras entre as flores.
O método antigo diria: "Vamos arrancar todo o jardim e plantar de novo." (Demorado e caro).
O DITaR diz: "Vamos usar dois óculos especiais para encontrar as plantas venenosas. Vamos testar cada uma: se for útil, deixamos; se for venenosa, arrancamos só ela. E fazemos isso sem mexer no resto do jardim."

Por que isso é importante?

Economia: Não precisa gastar milhões de dólares retraindo o sistema.
Justiça: Não apaga informações que poderiam ser úteis (preserva a "verdade" dos dados).
Segurança: Protege os usuários de serem enganados por recomendações manipuladas, mantendo a confiança na plataforma.

Em resumo, o DITaR é como um filtro inteligente e cirúrgico que limpa a sujeira sem estragar a comida.

Each language version is independently generated for its own context, not a direct translation.

1. O Problema: Pedidos Falsos em Sistemas de Recomendação Sequencial

Os sistemas de recomendação sequencial (SRS) modelam o histórico de interações do usuário para prever preferências futuras. No entanto, eles enfrentam uma nova ameaça: pedidos falsos (fake orders).

Definição: Diferente de ataques tradicionais que injetam usuários falsos para degradar o sistema globalmente, os pedidos falsos são interações manipuladas inseridas dentro de sequências de usuários reais.
Mecanismos de Ataque: Incluem click farming (cliques repetitivos), substituições semânticas irrelevantes (trocar itens por outros sem relação contextual) e perturbações sequenciais (alterar a ordem de itens).
Impacto: O objetivo é manipular as taxas de exposição de itens específicos para ganho competitivo, distorcendo as preferências reais do usuário e levando o modelo a aprender padrões errôneos.
Desafios Existentes:
1. Métodos atuais de retificação (correção de dados) são projetados para filtragem colaborativa tradicional e não lidam bem com as dependências temporais complexas dos SRS.
2. A remoção simples de dados (ex: excluir a sequência inteira) quebra a integridade dos dados e a estrutura da sequência.
3. Tratar todos os pedidos suspeitos da mesma forma ignora que alguns podem ter um efeito de aumento de dados (data augmentation) benéfico, enquanto outros são prejudiciais.

2. Metodologia: DITaR (Dual-view Identification and Targeted Rectification)

O artigo propõe o DITaR, um framework de retificação não viciada que opera em duas etapas principais, evitando o custo computacional de re-treinar o modelo do zero.

A. Módulo de Identificação Dual-view (DI)

A premissa central é que pedidos falsos, por serem artificialmente gerados, não conseguem manter consistência simultânea nas dimensões colaborativa e semântica, ao contrário de interações reais.

Visão Semântica: Utiliza um modelo de linguagem pré-treinado (LLaMA2-7B) para extrair embeddings semânticos ( $E_s$ ) baseados em atributos e descrições dos itens. Um adaptador alinha esses embeddings ao espaço de recomendação.
Visão Colaborativa: Aplica Análise de Componentes Principais (PCA) aos embeddings semânticos e os funde com embeddings de ID aprendíveis através de um mecanismo de gate adaptativo para capturar padrões de interação.
Codificadores Separados: Dois codificadores sequenciais distintos processam cada visão independentemente para gerar representações desacopladas ( $R_s$ e $R_c$ ).
Detecção de Anomalias: O sistema compara as duas visões. Pedidos falsos geram inconsistências (divergência de predição e desalinhamento de representação). São calculadas quatro métricas de anomalia:
- Desacordo de representação ( $\delta_r$ ) e divergência de predição ( $\delta_p$ ) entre as visões.
- Anomalia de popularidade ( $\alpha_p$ ) e ruptura de padrão contextual ( $\beta_s$ ).
- Um escore unificado é calculado para identificar pedidos suspeitos.

B. Retificação Direcionada com Gradiente Ascendente (TaR)

Nem todos os pedidos falsos detectados são prejudiciais. Alguns podem atuar como regularização ou aumento de dados.

Filtragem por Função de Influência: Utiliza a Influence Function para estimar o impacto real de cada pedido suspeito no desempenho do modelo em um conjunto de validação limpo.
- Se remover o item reduz a perda (valor positivo de influência), o item é prejudicial.
- Se remover o item aumenta a perda (valor negativo), o item é benéfico e deve ser preservado.
Retificação Direcionada: Apenas os itens confirmados como prejudiciais ( $I_h$ $I_{h}$ ) são alvo de retificação.
- Aplica-se um passo de gradiente ascendente sobre os parâmetros do modelo para "esquecer" o impacto desses itens específicos.
- Uma restrição de regularização (um passo de gradiente descendente em dados limpos) é aplicada para garantir que o modelo mantenha sua capacidade de recomendação geral e não sofra overfitting ou degradação.

3. Contribuições Principais

Novo Cenário de Ameaça: É o primeiro trabalho a focar especificamente em pedidos falsos embutidos em sequências de usuários reais, que manipulam resultados de recomendação sem alterar o volume de dados.
Framework Dual-View: Propõe uma abordagem inovadora que explora lacunas entre representações semânticas e colaborativas para identificar fraudes com alta precisão.
Retificação Não Viciada e Eficiente: Combina filtragem guiada por influência com gradiente ascendente para remover apenas o dano real, preservando informações úteis e mantendo a estrutura original dos dados, sem necessidade de re-treinamento completo.
Descoberta de "Efeito de Aumento de Dados": O estudo revela que certos tipos de pedidos falsos (como a troca de ordem de itens não adjacentes) podem, paradoxalmente, melhorar a generalização do modelo ao introduzir ruído temporal controlado.

4. Resultados Experimentais

Os experimentos foram realizados em três conjuntos de dados reais (MovieLens-1M, Amazon-Beauty, Yelp2018) e comparados com métodos state-of-the-art (Retrain, SISA, RecEraser, UltraRE).

Qualidade de Recomendação: O DITaR superou consistentemente os métodos de base, alcançando desempenho comparável ao de um modelo re-treinado do zero (que é o padrão ouro, mas caro) e, em alguns casos, superando o desempenho dos dados originais limpos.
Eficiência Computacional: Enquanto métodos baseados em sharding (particionamento) exigem muitos épocas de convergência, o DITaR convergiu em apenas 5 épocas em todos os testes, demonstrando uma eficiência superior ao evitar o treinamento a partir do zero.
Robustez e Detecção: O módulo de detecção alcançou alta precisão e recall na identificação de pedidos falsos. A análise de ablação confirmou que a remoção de qualquer uma das visões (semântica ou colaborativa) ou da filtragem por função de influência degrada significativamente o desempenho.

5. Significado e Conclusão

O trabalho do DITaR é significativo porque muda o paradigma de "remover tudo o que é suspeito" para "corrigir apenas o que é prejudicial".

Preservação de Dados: Ao não alterar o volume de dados ou a estrutura da sequência, o sistema mantém a confiança do usuário e a integridade dos dados históricos.
Segurança e Desempenho: Oferece uma solução viável para proteger sistemas de recomendação modernos contra manipulações sutis e comerciais, garantindo que as recomendações reflitam as verdadeiras preferências do usuário.
Viabilidade Prática: A capacidade de retificar modelos comprometidos em poucas épocas de treinamento torna a solução aplicável em ambientes de produção onde o tempo de inatividade para re-treinamento é proibitivo.

Em resumo, o DITaR estabelece um novo padrão para a defesa de sistemas de recomendação sequencial, equilibrando segurança, eficiência computacional e qualidade de recomendação através de uma abordagem de correção de dados inteligente e direcionada.