Malicious Or Not: Adding Repository Context to Agent Skill Classification

Este artigo apresenta a maior análise empírica de segurança do ecossistema de habilidades de agentes de IA, demonstrando que a incorporação do contexto do repositório GitHub reduz drasticamente as classificações falsas de habilidades maliciosas de 46,8% para 0,52% e revela vetores de ataque reais, como o sequestro de habilidades em repositórios abandonados.

Florian Holzbauer, David Schmidt, Gabriel Gegenhuber, Sebastian Schrittwieser, Johanna Ullrich

Publicado 2026-03-18
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que os Agentes de IA (como o Claude Code ou o OpenClaw) são como cozinheiros robôs muito inteligentes. Eles sabem pensar e planejar, mas para fazer coisas do mundo real — como enviar um e-mail, mexer em um banco de dados ou executar um código — eles precisam de ferramentas.

Neste mundo digital, essas ferramentas são chamadas de "Skills" (Habilidades). Pense nelas como receitas de bolo ou caixas de ferramentas que os cozinheiros robôs podem baixar de uma "loja de aplicativos" para aprender novas tarefas.

Aqui está o que os pesquisadores descobriram, explicado de forma simples:

1. O Grande Medo: "A Loja está Cheia de Veneno?"

Recentemente, alguns "caçadores de vírus" (escaneadores de segurança) começaram a analisar essas receitas e ferramentas. Eles ficaram alarmados! Alguns disseram que quase metade (46%) das habilidades eram perigosas. Outros diziam que eram 23% ou 6%.

Isso gerou um pânico: "Será que todas essas lojas de habilidades estão cheias de hackers tentando roubar nossos dados ou dinheiro?"

2. A Grande Investigação: Olhando Além da Capa

Os autores deste estudo decidiram não confiar apenas no primeiro aviso de perigo. Eles fizeram o maior estudo já feito sobre o assunto, coletando 238.180 habilidades de várias lojas e do GitHub (que é como um "Google Drive" gigante para programadores).

Eles usaram uma analogia simples: Olhar apenas para a capa do livro não diz se a história é boa ou ruim.

  • O Erro dos Antigos: Os escaneadores antigos olhavam apenas para a descrição da habilidade (a capa do livro). Se a descrição parecia suspeita, eles diziam "PERIGO!" e bloqueavam tudo.
  • A Nova Abordagem: Os pesquisadores olharam para o contexto. Eles foram até a "loja" (o repositório no GitHub) onde a habilidade estava hospedada. Eles olharam para a história do projeto, quem o criou, se o código faz sentido com a descrição e se o projeto é antigo e confiável.

3. A Grande Surpresa: A Maioria é Inocente!

Quando eles olharam para o contexto completo, a história mudou completamente.

  • O Resultado: Aqueles 46% de "habilidades maliciosas" caíram drasticamente. Na verdade, apenas 0,52% eram realmente perigosas.
  • A Analogia: Imagine que você vê um homem com um canivete suíço na mão. O alarme toca: "Ele tem uma arma!". Mas, se você olhar ao redor, vê que ele é um carpinteiro trabalhando em uma mesa de marcenaria, você percebe que o canivete é uma ferramenta de trabalho, não uma arma.
  • Conclusão: A maioria das habilidades que os escaneadores antigos chamavam de "maliciosas" eram, na verdade, ferramentas legítimas que apenas pareciam suspeitas porque foram analisadas isoladamente.

4. O Novo Perigo Real: O "Fantasma" da Loja Abandonada

Embora a maioria fosse inocente, os pesquisadores encontraram um perigo real e novo que ninguém tinha visto antes: O Sequestro de Lojas Abandonadas.

  • A Metáfora: Imagine que você tem uma loja de ferramentas em um shopping. Você decide se mudar e deixa a loja vazia, mas esquece de avisar o shopping. Um malandro entra, coloca suas próprias ferramentas perigosas lá dentro e espera que os clientes (os robôs) continuem entrando na loja achando que é a sua.
  • O Que Aconteceu: Os pesquisadores descobriram que, em algumas plataformas, as habilidades apontam para repositórios no GitHub que foram abandonados pelos donos originais. Hackers podem criar contas com os mesmos nomes antigos e "sequestrar" essas lojas, injetando código malicioso. Eles encontraram 121 habilidades que poderiam ser sequestradas dessa forma.

5. Resumo Final

  • O Medo Era Exagerado: A maioria das habilidades não é má. Os sistemas de segurança antigos estavam "gritando lobo" o tempo todo, criando muitos falsos positivos (acusações erradas).
  • A Solução: Para saber se uma habilidade é segura, não olhe apenas para o que ela diz que faz. Olhe onde ela vive (o repositório), quem a criou e se o ambiente ao redor faz sentido.
  • O Alerta Real: O perigo real não está na maioria das ferramentas, mas na forma como algumas plataformas deixam "casas vazias" (repositórios abandonados) abertas para invasores.

Em suma: O ecossistema de habilidades de IA é muito mais seguro do que se pensava, mas precisamos de "vigias" mais inteligentes que olhem para o contexto todo, e não apenas para a etiqueta do produto.

Afogado em artigos na sua área?

Receba digests diários dos artigos mais recentes que correspondam às suas palavras-chave de pesquisa — com resumos técnicos, no seu idioma.

Experimentar Digest →