AudAgent: Automated Auditing of Privacy Policy Compliance in AI Agents

O AudAgent é uma ferramenta que monitora em tempo real a conformidade de agentes de IA com suas políticas de privacidade, utilizando formalização de políticas, anotação de dados e verificação automatizada para detectar violações e bloquear proativamente o processamento de dados sensíveis não autorizado.

Ye Zheng, Yimin Chen, Yidan Hu

Publicado 2026-03-05
📖 5 min de leitura🧠 Leitura aprofundada

Each language version is independently generated for its own context, not a direct translation.

Imagine que você contratou um assistente pessoal superinteligente (um "Agente de IA") para cuidar de suas tarefas diárias: agendar reuniões, pesquisar na internet, organizar seus e-mails e até gerenciar suas finanças.

Esse assistente promete ser discreto. Ele diz: "Eu só vou usar seus dados para ajudar você, não vou vender nada para terceiros e vou apagar tudo depois de 30 dias." Isso é o que chamamos de Política de Privacidade.

O problema? Você não tem como saber se ele está realmente cumprindo essa promessa. Ele pode estar, secretamente, enviando seu número de cartão de crédito ou seu endereço para uma empresa de publicidade, ou mantendo seus dados por anos, tudo sem você perceber. É como se ele tivesse um segredo que você não consegue ver.

É aqui que entra o AudAgent.

O Que é o AudAgent?

Pense no AudAgent como um inspetor de privacidade em tempo real ou um "segurança particular" que você coloca no seu computador. Ele não é o assistente; ele é o vigia que observa o assistente o tempo todo.

O AudAgent faz quatro coisas principais para garantir que o assistente não esteja trapaceando:

1. O Tradutor de Promessas (Formalização da Política)

Primeiro, o AudAgent pega a "Política de Privacidade" do assistente (que é um texto longo e chato, cheio de juridiquês) e a transforma em um mapa de regras claro e digital.

  • Analogia: Imagine que a política é um livro de leis de 100 páginas. O AudAgent usa uma equipe de tradutores (várias IAs diferentes) para ler esse livro e criar um "cartão de regras" simples: "Se o usuário der o e-mail, só pode enviar para o Gmail, e deve apagar em 30 dias."
  • O Truque: Para garantir que a tradução está certa, ele usa várias IAs ao mesmo tempo e faz um "voto". Se 3 de 4 IAs concordam que a regra é essa, o AudAgent confia que está correto.

2. O Detetive de Dados (Anotação em Tempo Real)

Enquanto o assistente trabalha, o AudAgent observa tudo o que entra e sai. Ele usa uma ferramenta chamada Presidio (como um scanner de documentos) para identificar dados sensíveis: nomes, e-mails, números de telefone, SSN (número de segurança social dos EUA), etc.

  • Analogia: É como se o AudAgent tivesse óculos de raio-x. Ele vê: "Ah, o assistente acabou de pegar o e-mail do Bob. Ok, anotado. Agora ele está enviando esse e-mail para o Google. Ok, anotado." Ele marca cada ação com um rótulo: "Coleta direta", "Uso relevante" ou "Divulgação para terceiros".

3. O Juiz Automático (Auditoria de Conformidade)

Agora, o AudAgent compara o que o assistente está fazendo com o que a Política de Privacidade diz que ele deveria fazer.

  • Analogia: Imagine um jogo de "Simon Says" (O Mestre Mandou). O mapa de regras (da etapa 1) é o Mestre. O assistente é o jogador.
    • Se a regra diz: "Só envie e-mails para o Gmail" e o assistente tenta enviar para um site desconhecido, o AudAgent grita: "VIOLAÇÃO!".
    • Ele usa máquinas de estado (como um jogo de tabuleiro) para rastrear se o dado foi coletado, usado e apagado dentro do prazo. Se o dado ficar "preso" em um estado onde não deveria estar, é uma violação.

4. O Painel de Controle Visual (Interface do Usuário)

Finalmente, o AudAgent mostra tudo isso para você em uma tela bonita, no seu navegador.

  • Analogia: É como um mapa de tráfego em tempo real ou um diagrama de fluxo. Você vê setas verdes quando o assistente age corretamente e setas vermelhas piscando quando ele tenta fazer algo proibido. Você pode clicar na seta vermelha e ver: "Atenção! O assistente tentou enviar seu número de segurança social para uma ferramenta de busca não autorizada."

O Que Eles Descobriram?

Os pesquisadores usaram o AudAgent para testar assistentes reais (como os da Claude, Gemini e DeepSeek) e descobriram coisas preocupantes:

  1. Promessas Vazias: Muitos assistentes dizem que protegem seus dados, mas suas políticas de privacidade não mencionam explicitamente como proteger dados super sensíveis, como números de segurança social (SSN).
  2. O "Disfarce" Perigoso: Se você pedir para um assistente "salvar seu número de segurança social em um arquivo", ele pode recusar. Mas, se você pedir para "salvar em um arquivo" usando uma ferramenta que parece um salvador, mas na verdade é uma ferramenta de busca disfarçada, muitos assistentes aceitam e enviam os dados sem piscar. Eles são enganados pelo disfarce.
  3. O AudAgent é o Herói: O AudAgent conseguiu bloquear essas ações. Mesmo que o assistente original quisesse enviar os dados, o AudAgent interveio e disse: "Não! Isso viola a regra de segurança. Parado!".

Por Que Isso é Importante?

Hoje, confiamos em IAs para fazer quase tudo. Mas a confiança cega é perigosa. O AudAgent muda o jogo:

  • Para você (o usuário): Você ganha transparência. Você não precisa mais confiar cegamente na promessa da empresa. Você pode ver o que está acontecendo e bloquear o que não gosta.
  • Para as empresas: É uma ferramenta de diagnóstico. Se o AudAgent mostra que o assistente está vazando dados, a empresa sabe que precisa consertar o código ou melhorar a política.

Resumo em uma Frase

O AudAgent é como um guarda-costas digital que lê as regras do jogo, vigia o assistente o tempo todo e pita o apito (ou bloqueia o jogo) se o assistente tentar trapacear e expor seus segredos, garantindo que a tecnologia sirva a você, e não o contrário.