Each language version is independently generated for its own context, not a direct translation.
Imagine que você tem um gênio da lâmpada (um Modelo de Linguagem Grande, ou LLM, como o ChatGPT) que sabe tudo sobre o mundo: literatura, história, como cozinhar e como escrever poemas. Ele é brilhante em conversar.
Mas, se você der a ele um gráfico de ações da bolsa, um registro de batimentos cardíacos de um paciente ou dados de tráfego de uma cidade, esse gênio fica um pouco perdido. Ele vê números e linhas, mas não consegue "sentir" o ritmo, o padrão ou a história que esses dados contam ao longo do tempo. É como tentar explicar uma sinfonia para alguém que só conhece a teoria musical, mas nunca ouviu a música.
O paper "Thoth" apresenta uma solução genial para esse problema. Vamos descomplicar como eles fizeram isso:
1. O Problema: O Gênio que não entende "Tempo"
Os modelos atuais são treinados com trilhões de palavras. Eles são ótimos em prever a próxima palavra em uma frase. Mas dados de séries temporais (como o preço do Bitcoin ou a temperatura diária) não são palavras; são sequências de números que mudam com o tempo.
Quando tentamos ensinar esses modelos a entender esses dados apenas no final do treinamento (como um "estágio final"), eles tendem a esquecer o que já sabiam ou precisam de muitos exemplos específicos para aprender uma única tarefa. É como tentar ensinar um adulto a tocar piano apenas para ele passar em uma prova de música específica, sem nunca ter deixado ele tocar por diversão antes.
2. A Solução: O "Curso de Meio de Caminho" (Mid-Training)
Os autores propõem uma etapa intermediária, chamada Mid-Training (Treinamento de Meio de Caminho).
Pense no treinamento de um modelo como uma jornada escolar:
- Pré-treinamento: É a educação básica e geral (ler livros, aprender a falar).
- Mid-Training (O Pulo do Gato): É como um curso de especialização universitário antes de escolher a profissão. É aqui que o modelo aprende a "falar a língua" dos dados temporais, sem esquecer o que já sabia sobre o mundo.
- Pós-treinamento: É a especialização final para uma tarefa específica (como prever o clima de amanhã).
O modelo Thoth é o resultado desse "curso de especialização". Ele foi treinado para entender que os dados têm um "ritmo", "sazonalidade" (como estações do ano) e "tendências".
3. O Segredo: O "Livro de Thoth" (Book-of-Thoth)
Para fazer esse curso funcionar, eles precisavam de um material didático incrível. Eles criaram o Book-of-Thoth.
Imagine que, em vez de apenas mostrar gráficos, eles criaram um dicionário bidirecional:
- Do Gráfico para o Texto: O modelo vê um gráfico de temperatura subindo e aprende a escrever: "Aqui temos uma tendência de aquecimento com picos no verão."
- Do Texto para o Gráfico: O modelo lê a frase "Uma onda suave subindo e descendo" e aprende a imaginar ou gerar o gráfico correspondente.
Eles usaram inteligência artificial para criar milhões desses pares (gráficos + descrições) de forma automática, cobrindo desde finanças até saúde. É como se eles tivessem escrito um livro gigante onde cada página tem um gráfico e sua história explicada, e o modelo leu tudo isso para entender a lógica do tempo.
4. O Teste: O "KnoTS" (O Exame de Nível Avançado)
Para provar que o Thoth realmente aprendeu, eles criaram um novo teste chamado KnoTS.
Diferente dos testes antigos que perguntavam coisas simples como "o gráfico subiu ou desceu?", o KnoTS é como um caso de detetive.
- Exemplo: "Olhe este gráfico de CO2 no solo. Sabendo que a chuva bloqueia a saída de gases e que a pressão do ar empurra o gás para cima, explique por que o gás subiu repentinamente e depois parou."
O modelo precisa usar o gráfico E o conhecimento do mundo (que chuva afeta o solo) para responder. O Thoth passou nesse teste muito melhor que os gigantes da tecnologia atuais.
5. O Resultado: O "Aquecimento" Perfeito
A grande descoberta é que o Thoth funciona como um aquecedor para tarefas futuras.
Se você pegar o Thoth e der a ele apenas um pouquinho de dados novos (poucos exemplos) para uma tarefa específica, ele aprende muito rápido e com muita precisão.
- Analogia: Se o modelo original é um atleta que nunca correu, o Thoth é o atleta que já fez maratonas de treinamento. Quando você pede para ele correr uma prova específica, ele já tem a resistência e a técnica. O modelo antigo, sem esse treinamento, tropeçaria ou precisaria de meses de treino para chegar ao mesmo nível.
Resumo em uma frase
O Thoth é um modelo de inteligência artificial que passou por um "curso intensivo" especial, aprendendo a ler a história contada pelos números ao longo do tempo, tornando-se um especialista em entender dados do mundo real (como saúde e finanças) muito melhor do que qualquer modelo atual, e tudo isso sem esquecer como conversar normalmente.
Por que o nome Thoth?
Thoth é o deus egípcio da sabedoria, da escrita e do tempo. Ele é frequentemente retratado com a cabeça de um íbis e é creditado por inventar o calendário. Um nome perfeito para um modelo que aprendeu a "ler o tempo" nos dados!
Receba artigos como este na sua caixa de entrada
Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.