Predictive Authoring for Brazilian Portuguese Augmentative and Alternative Communication

Este artigo propõe o uso do modelo BERTimbau, finetunado em um corpus específico de AAC em português brasileiro, para prever pictogramas em sistemas de comunicação alternativa, demonstrando que representá-los por meio de legendas resulta na maior acurácia, embora sinônimos ofereçam menor perplexidade.

Jayr Pereira, Rodrigo Nogueira, Cleber Zanchettin, Robson Fidalgo

Publicado 2026-03-04
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

🗣️ O Problema: A "Caixa de Brinquedos" Gigante

Imagine que você precisa se comunicar, mas não consegue falar ou escrever com facilidade. Você usa um sistema especial (chamado AAC) que funciona como uma caixa de brinquedos gigante. Dentro dessa caixa, em vez de blocos de montar, você tem cartões com desenhos (pictogramas) que representam coisas como "comida", "brincar", "dormir" ou "água".

Para dizer "Eu quero comer bolo", você precisa pegar o cartão "Eu", depois o "Quero", depois "Comer" e por fim "Bolo".

O problema é que, conforme o vocabulário cresce, essa caixa de brinquedos fica imensa. Encontrar o cartão certo no meio de milhares de opções é como tentar achar uma agulha em um palheiro. Isso cansa e deixa a pessoa frustrada.

🤖 A Solução: Um "Adivinho" Inteligente

Os autores deste artigo queriam criar um assistente inteligente (uma IA) que olhasse para o que você já escolheu e dissesse: "Ei, você já escolheu 'Eu' e 'Quero'. O que vem a seguir? Talvez 'Comer' ou 'Beber'?".

Isso é chamado de Previsão de Pictogramas. É como quando o seu celular de texto sugere a próxima palavra, mas aqui, em vez de palavras, ele sugere desenhos.

🇧🇷 O Desafio: Falta de "Livros de História"

Para ensinar essa IA a ser inteligente, você precisa de muitos exemplos de frases que pessoas reais usam. O problema é que, para o Português Brasileiro, não existia um "livro de histórias" (um banco de dados) grande o suficiente com frases feitas por pessoas que usam esses sistemas.

A Estratégia Criativa:
Os pesquisadores fizeram uma mistura genial:

  1. Pediram ajuda a especialistas: Conversaram com fonoaudiólogos e pais para coletar frases reais que eles usam no dia a dia.
  2. Convidaram um "Robô Escritor": Usaram uma inteligência artificial poderosa (o GPT-3) para ler essas frases e criar milhares de novas frases parecidas. Foi como ter um aluno muito estudioso que leu 100 livros e agora consegue escrever histórias novas no mesmo estilo.

Assim, eles criaram um corpus (conjunto de dados) enorme e personalizado para o português, pronto para treinar a IA.

🎨 O Grande Mistério: Como "Ensinar" a IA a Ver um Desenho?

Aqui está a parte mais interessante do artigo. Para a IA prever o próximo desenho, ela precisa entender o que aquele desenho significa. Os pesquisadores testaram quatro maneiras diferentes de "traduzir" o desenho para a linguagem da máquina:

  1. A Legenda (O Rótulo): A IA lê apenas a palavra escrita embaixo do desenho (ex: "Gato").
    • Analogia: É como ler o nome de um prato no cardápio.
  2. Os Sinônimos (Os Amigos): A IA lê a palavra e também palavras parecidas (ex: "Gato", "Felino", "Bichano").
    • Analogia: É como ter várias dicas de um quebra-cabeça para adivinhar a peça.
  3. A Definição (A Explicação): A IA lê uma explicação do que é o desenho (ex: "Gato: animal doméstico que mia").
    • Analogia: É como ler a biografia completa do personagem.
  4. A Imagem (O Desenho em Si): A IA tenta "ver" a imagem diretamente.
    • Analogia: É como mostrar a foto do prato para a IA, em vez de ler o nome.

🏆 O Resultado: Quem Ganhou?

Os pesquisadores testaram todas essas abordagens e descobriram coisas importantes:

  • A Imagem não foi a campeã: Tentar fazer a IA "ver" o desenho foi difícil e demorado, e não funcionou tão bem quanto ler o texto. É como tentar ensinar alguém a cozinhar mostrando apenas a foto do prato pronto, sem dar a receita.
  • A Legenda vs. Sinônimos:
    • Usar Sinônimos fez a IA ficar mais "segura" e entender melhor o contexto (menor perplexidade).
    • Usar apenas a Legenda (a palavra simples) fez a IA acertar mais vezes o próximo item exato (maior precisão).

A Conclusão Prática: Não existe uma resposta única de "melhor". Depende do que você precisa. Se você quer que a IA seja muito precisa em acertar a palavra exata, use a legenda. Se quer que ela entenda bem o contexto geral, use sinônimos.

💡 Por que isso importa?

Este trabalho é como abrir uma porta para o futuro da comunicação. Ao criar um método que funciona bem para o Português Brasileiro, os pesquisadores estão ajudando a desenvolver sistemas que:

  • Fazem a comunicação ser mais rápida (menos cliques).
  • Reduzem a frustração de quem não consegue falar.
  • Permitem que crianças e adultos com dificuldades de comunicação expressem seus desejos, vontades e sentimentos com mais facilidade e autonomia.

Em resumo: eles ensinaram uma máquina a "adivinhar" o que você quer dizer usando desenhos, tornando a vida de quem precisa desses sistemas muito mais leve e eficiente.