NOTAI.AI: Explainable Detection of Machine-Generated Text via Curvature and Feature Attribution

O artigo apresenta o NOTAI.AI, um framework explicável para detecção de texto gerado por IA que combina sinais de curvatura, recursos neurais e estilométricos em um classificador XGBoost, utilizando SHAP e uma camada de LLM para gerar atribuições de recursos e explicações em linguagem natural acessíveis aos usuários.

Oleksandr Marchenko Breneur, Adelaide Danilov, Aria Nourbakhsh, Salima Lamsiyah

Publicado 2026-03-09
📖 5 min de leitura🧠 Leitura aprofundada

Each language version is independently generated for its own context, not a direct translation.

🕵️‍♂️ O Que é o NOTAI.AI?

Imagine que você é um detetive tentando descobrir se uma carta foi escrita por uma pessoa real ou por um robô (Inteligência Artificial). Antigamente, bastava olhar para a gramática perfeita para suspeitar de um robô. Mas hoje, os robôs escrevem tão bem que é quase impossível dizer só "olhando".

O NOTAI.AI é uma nova ferramenta criada por pesquisadores da Universidade de Luxemburgo que funciona como um detetive super-observador. Ele não apenas diz "é humano" ou "é robô", mas explica o porquê, mostrando as pistas que encontrou.

🧩 Como Funciona a "Mágica"? (As 3 Camadas do Detetive)

O sistema usa uma combinação de três tipos de inteligência para tomar sua decisão, como se fosse uma equipe de especialistas reunida em uma sala:

1. O "Geômetra" (Análise de Curvatura)

  • A Analogia: Imagine que escrever é como caminhar por uma paisagem.
    • Humanos: Nossa mente é caótica e criativa. Às vezes escolhemos palavras estranhas, fazemos pausas inesperadas ou mudamos o ritmo. Nossa "paisagem" de escrita tem muitas curvas, buracos e montanhas (é irregular).
    • Robôs: Eles tendem a escolher o caminho mais fácil e seguro, sempre seguindo a trilha mais provável. A "paisagem" deles é muito lisa e plana.
  • O que o NOTAI.AI faz: Ele usa uma ferramenta chamada Fast-DetectGPT para medir a "curvatura" do texto. Se o texto for muito liso e previsível, o sistema levanta a mão: "Ei, isso parece robô!".

2. O "Estilista" (Análise de Estilo e Leitura)

  • A Analogia: Pense em um alfaiate que analisa a roupa de alguém.
    • Ele olha para o tamanho das frases, a variedade de palavras usadas (vocabulário rico vs. repetitivo), a pontuação e até o uso de clichês.
    • Robôs muitas vezes usam palavras muito comuns, frases de tamanho muito igual e evitam erros ou variações estranhas. Humanos são mais "desleixados" e variados.
  • O que o NOTAI.AI faz: Ele conta 17 pistas diferentes, como "quantas palavras únicas existem?" ou "quantas vírgulas foram usadas?".

3. O "Especialista em Cérebro" (Rede Neural)

  • A Analogia: É como ter um professor de literatura que leu milhões de livros.
    • Ele usa um modelo de IA chamado ModernBERT que foi treinado para sentir o "cheiro" de um texto gerado por IA. Ele não olha apenas para a superfície, mas para o contexto e a fluidez semântica.

🧠 O "Juiz" e a "Tradução" (Como a decisão é tomada)

Depois que esses três especialistas coletam as pistas, eles enviam tudo para um Juiz (um algoritmo chamado XGBoost). O Juiz pondera todas as informações e decide: "É Humano" ou "É IA".

Mas aqui está a grande inovação do NOTAI.AI:
A maioria dos detectores só dá um número (ex: "90% de chance de ser IA"). Isso é confuso e assustador. O NOTAI.AI vai além:

  1. O Tradutor (SHAP + LLM): Ele pega a decisão matemática do Juiz e a traduz para uma linguagem humana.
  2. O Relatório: Em vez de números frios, ele gera um texto explicativo.
    • Exemplo: "O texto foi classificado como IA porque a pontuação de curvatura foi muito baixa (muito liso) e o vocabulário era repetitivo, embora a gramática estivesse perfeita."

🖥️ A Experiência do Usuário (O Painel de Controle)

O sistema é apresentado como um aplicativo na web interativo:

  • Você cola um texto.
  • O sistema analisa em tempo real.
  • Você vê um medidor (como um velocímetro) mostrando a probabilidade.
  • O mais legal: Você pode ver exatamente quais pistas pesaram mais. E, se quiser ser um "cientista louco", pode desligar uma pista (ex: "ignore a pontuação") e ver se a decisão muda. Isso ajuda a entender como a máquina pensa.

📊 Os Resultados (Funciona mesmo?)

Os pesquisadores testaram o sistema em um grande banco de dados (RAID).

  • Sozinho: Cada especialista (o Geômetra, o Estilista ou o Professor) acertava cerca de 85% a 89% das vezes.
  • Juntos (O Time Completo): Quando eles trabalham juntos, a precisão sobe para 96%.
  • A Lição: É como um time de futebol. Um jogador é bom, mas o time todo é imbatível.

🚧 Limitações e Futuro

O sistema é muito bom, mas não é perfeito. Se alguém tentar enganar o robô mudando o texto de forma muito agressiva (adversarial) ou se o texto for de um domínio muito diferente do que o robô treinou, ele pode errar. Além disso, os pesquisadores querem no futuro conseguir apontar exatamente qual palavra ou qual frase fez o robô suspeitar, e não apenas o texto todo.

💡 Resumo Final

O NOTAI.AI é como um tradutor de confiança. Ele não apenas diz "isso é falso", mas mostra o "processo de pensamento" por trás da acusação, usando uma combinação de matemática avançada e linguagem simples para que qualquer pessoa (professores, jornalistas, curiosos) possa entender e confiar na decisão.