Multilingual Financial Fraud Detection Using Machine Learning and Transformer Models: A Bangla-English Study

Este estudo investiga a detecção de fraude financeira em contextos multilíngues (Bangla e Inglês), demonstrando que modelos clássicos de aprendizado de máquina, como SVM Linear, superam arquiteturas baseadas em transformers em precisão geral, embora os transformers apresentem maior capacidade de recuperação de fraudes, ao mesmo tempo em que destacam padrões linguísticos distintivos e os desafios impostos pela diversidade linguística e codificação mista.

Mohammad Shihab Uddin, Md Hasibul Amin, Nusrat Jahan Ema, Bushra Uddin, Tanvir Ahmed, Arif Hassan Zidan

Publicado 2026-03-13
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que o mundo financeiro digital é como uma praça movimentada e gigante. Nela, milhões de pessoas trocam dinheiro todos os dias. Mas, infelizmente, nessa mesma praça, existem muitos golpistas tentando enganar as pessoas com mensagens falsas, prometendo prêmios que não existem ou pedindo dados bancários sob ameaça.

O objetivo deste estudo foi criar um detetive digital capaz de ler essas mensagens em duas línguas ao mesmo tempo: Inglês (a língua universal das finanças) e Bangla (a língua falada por mais de 250 milhões de pessoas, mas que muitas vezes é ignorada pela tecnologia).

Aqui está a história da pesquisa, explicada de forma simples:

1. O Problema: O Detetive que só fala uma língua

Até hoje, a maioria dos sistemas de segurança contra fraudes foi treinada apenas para entender mensagens em Inglês. É como ter um guarda de segurança que só sabe identificar ladrões que falam inglês, mas deixa passar todos os golpistas que falam bengali ou misturam as duas línguas. Como o Bangla é uma língua com menos recursos digitais (menos livros, menos dados na internet para a IA aprender), os modelos de inteligência artificial costumam ter dificuldade com ela.

2. A Missão: Testar dois tipos de "olhos"

Os pesquisadores decidiram testar dois tipos de "olhos" para ver quem detecta melhor o golpe nessa praça multilíngue:

  • O Detetive Clássico (Máquinas Tradicionais): Imagine um detetive experiente que usa uma lupa e uma lista de palavras-chave. Ele não "entende" a emoção da frase, mas sabe que se a mensagem tiver palavras como "URGENTE", "AGORA", ou se tiver um número de telefone e um link (URL) estranho, é provavelmente um golpe. Ele usa uma técnica chamada TF-IDF, que é basicamente contar e pesar essas palavras importantes.
  • O Detetive Moderno (Transformadores/IA Avançada): Imagine um detetive superinteligente, como um super-herói da leitura, que leu quase tudo na internet. Ele tenta entender o contexto, o tom e a intenção da frase, mesmo que as palavras estejam misturadas (inglês com bengali).

3. O Que Eles Encontraram? (As Pistas)

Antes de escolher o vencedor, eles olharam para as mensagens e notaram padrões curiosos, como se estivessem analisando a "impressão digital" dos golpistas:

  • Tamanho: As mensagens de golpe tendem a ser mais longas e chatas, tentando convencer você com muitos detalhes.
  • Urgência: Golpistas usam palavras de pânico ("Corra!", "Agora!", "Renove já!").
  • A "Arma" Secreta: Quase 97% das mensagens de golpe continham um número de telefone e 32% continham um link. Mensagens legítimas (de bancos reais) raramente usam isso; elas costumam confirmar transações específicas ("Seu pagamento de 500 Taka foi feito").

4. O Resultado da Batalha: Quem venceu?

Aqui vem a surpresa! Esperávamos que o "Super-Herói" (o modelo de IA moderno) ganhasse fácil. Mas não foi bem assim:

  • O Vencedor (O Detetive Clássico): O modelo Linear SVM (o detetive com a lupa e a lista de palavras) venceu com 91,59% de precisão. Ele foi muito bom em não confundir pessoas inocentes com golpistas.
  • O Vice (O Super-Herói): O modelo de IA moderna (Transformer) ficou em segundo lugar com 89,49%.

Por que o Super-Herói perdeu?
O Super-Herói era muito "paranoico". Ele detectava quase todos os golpistas (o que é bom), mas também acusava muitas pessoas inocentes de serem golpistas (falsos positivos). Ele estava tão focado em encontrar fraudes que, às vezes, gritava "Fogo!" quando só havia fumaça. O Detetive Clássico, por outro lado, era mais equilibrado: acertava mais vezes no geral e não incomodava os clientes honestos tanto quanto o outro.

5. A Lição Final

A pesquisa nos ensina uma lição valiosa: Às vezes, a tecnologia mais simples e bem feita é melhor do que a mais complexa, especialmente quando lidamos com línguas menos comuns ou misturadas (como inglês com bengali).

O modelo antigo, que apenas contava palavras suspeitas e verificava a presença de números e links, funcionou melhor do que a inteligência artificial mais avançada neste cenário específico. Isso mostra que, para proteger o dinheiro das pessoas em países com línguas diversas, não precisamos necessariamente da tecnologia mais cara; precisamos de ferramentas que entendam as pistas simples que os golpistas deixam para trás.

Resumo em uma frase:
Para pegar golpistas que falam inglês e bengali misturados, um "detetive" que sabe contar palavras suspeitas e verificar números de telefone funcionou melhor do que um "super-herói" de inteligência artificial que tentava entender tudo, provando que às vezes o básico bem feito é o caminho mais seguro.