Malicious Or Not: Adding Repository Context to Agent Skill Classification

Each language version is independently generated for its own context, not a direct translation.

Imagine que os Agentes de IA (como o Claude Code ou o OpenClaw) são como cozinheiros robôs muito inteligentes. Eles sabem pensar e planejar, mas para fazer coisas do mundo real — como enviar um e-mail, mexer em um banco de dados ou executar um código — eles precisam de ferramentas.

Neste mundo digital, essas ferramentas são chamadas de "Skills" (Habilidades). Pense nelas como receitas de bolo ou caixas de ferramentas que os cozinheiros robôs podem baixar de uma "loja de aplicativos" para aprender novas tarefas.

Aqui está o que os pesquisadores descobriram, explicado de forma simples:

1. O Grande Medo: "A Loja está Cheia de Veneno?"

Recentemente, alguns "caçadores de vírus" (escaneadores de segurança) começaram a analisar essas receitas e ferramentas. Eles ficaram alarmados! Alguns disseram que quase metade (46%) das habilidades eram perigosas. Outros diziam que eram 23% ou 6%.

Isso gerou um pânico: "Será que todas essas lojas de habilidades estão cheias de hackers tentando roubar nossos dados ou dinheiro?"

2. A Grande Investigação: Olhando Além da Capa

Os autores deste estudo decidiram não confiar apenas no primeiro aviso de perigo. Eles fizeram o maior estudo já feito sobre o assunto, coletando 238.180 habilidades de várias lojas e do GitHub (que é como um "Google Drive" gigante para programadores).

Eles usaram uma analogia simples: Olhar apenas para a capa do livro não diz se a história é boa ou ruim.

O Erro dos Antigos: Os escaneadores antigos olhavam apenas para a descrição da habilidade (a capa do livro). Se a descrição parecia suspeita, eles diziam "PERIGO!" e bloqueavam tudo.
A Nova Abordagem: Os pesquisadores olharam para o contexto. Eles foram até a "loja" (o repositório no GitHub) onde a habilidade estava hospedada. Eles olharam para a história do projeto, quem o criou, se o código faz sentido com a descrição e se o projeto é antigo e confiável.

3. A Grande Surpresa: A Maioria é Inocente!

Quando eles olharam para o contexto completo, a história mudou completamente.

O Resultado: Aqueles 46% de "habilidades maliciosas" caíram drasticamente. Na verdade, apenas 0,52% eram realmente perigosas.
A Analogia: Imagine que você vê um homem com um canivete suíço na mão. O alarme toca: "Ele tem uma arma!". Mas, se você olhar ao redor, vê que ele é um carpinteiro trabalhando em uma mesa de marcenaria, você percebe que o canivete é uma ferramenta de trabalho, não uma arma.
Conclusão: A maioria das habilidades que os escaneadores antigos chamavam de "maliciosas" eram, na verdade, ferramentas legítimas que apenas pareciam suspeitas porque foram analisadas isoladamente.

4. O Novo Perigo Real: O "Fantasma" da Loja Abandonada

Embora a maioria fosse inocente, os pesquisadores encontraram um perigo real e novo que ninguém tinha visto antes: O Sequestro de Lojas Abandonadas.

A Metáfora: Imagine que você tem uma loja de ferramentas em um shopping. Você decide se mudar e deixa a loja vazia, mas esquece de avisar o shopping. Um malandro entra, coloca suas próprias ferramentas perigosas lá dentro e espera que os clientes (os robôs) continuem entrando na loja achando que é a sua.
O Que Aconteceu: Os pesquisadores descobriram que, em algumas plataformas, as habilidades apontam para repositórios no GitHub que foram abandonados pelos donos originais. Hackers podem criar contas com os mesmos nomes antigos e "sequestrar" essas lojas, injetando código malicioso. Eles encontraram 121 habilidades que poderiam ser sequestradas dessa forma.

5. Resumo Final

O Medo Era Exagerado: A maioria das habilidades não é má. Os sistemas de segurança antigos estavam "gritando lobo" o tempo todo, criando muitos falsos positivos (acusações erradas).
A Solução: Para saber se uma habilidade é segura, não olhe apenas para o que ela diz que faz. Olhe onde ela vive (o repositório), quem a criou e se o ambiente ao redor faz sentido.
O Alerta Real: O perigo real não está na maioria das ferramentas, mas na forma como algumas plataformas deixam "casas vazias" (repositórios abandonados) abertas para invasores.

Em suma: O ecossistema de habilidades de IA é muito mais seguro do que se pensava, mas precisamos de "vigias" mais inteligentes que olhem para o contexto todo, e não apenas para a etiqueta do produto.

Malicious Or Not: Adding Repository Context to Agent Skill Classification

1. O Grande Medo: "A Loja está Cheia de Veneno?"

2. A Grande Investigação: Olhando Além da Capa

3. A Grande Surpresa: A Maioria é Inocente!

4. O Novo Perigo Real: O "Fantasma" da Loja Abandonada

5. Resumo Final

Título: Malicious Or Not: Adicionando Contexto de Repositório à Classificação de Habilidades de Agentes

1. Problema e Motivação

2. Metodologia

3. Contribuições Principais

4. Resultados Chave

5. Significado e Conclusão

Malicious Or Not: Adding Repository Context to Agent Skill Classification

1. O Grande Medo: "A Loja está Cheia de Veneno?"

2. A Grande Investigação: Olhando Além da Capa

3. A Grande Surpresa: A Maioria é Inocente!

4. O Novo Perigo Real: O "Fantasma" da Loja Abandonada

5. Resumo Final

Título: Malicious Or Not: Adicionando Contexto de Repositório à Classificação de Habilidades de Agentes

1. Problema e Motivação

2. Metodologia

3. Contribuições Principais

4. Resultados Chave

5. Significado e Conclusão

Mais como este

Exploration and Exploitation Errors Are Measurable for Language Model Agents

SciFi: A Safe, Lightweight, User-Friendly, and Fully Autonomous Agentic AI Workflow for Scientific Applications

Numerical Instability and Chaos: Quantifying the Unpredictability of Large Language Models

Optimizing Earth Observation Satellite Schedules under Unknown Operational Constraints: An Active Constraint Acquisition Approach

WebXSkill: Skill Learning for Autonomous Web Agents