MoHETS: Long-term Time Series Forecasting with Mixture-of-Heterogeneous-Experts

O MoHETS é um modelo encoder-only baseado em Transformer que utiliza uma mistura de especialistas heterogêneos para capturar dinâmicas temporais multiescala e não estacionárias, alcançando desempenho state-of-the-art em previsões de séries temporais de longo prazo com maior eficiência e estabilidade.

Evandro S. Ortigossa, Guy Lutsker, Eran Segal

Publicado 2026-03-16
📖 5 min de leitura🧠 Leitura aprofundada

Each language version is independently generated for its own context, not a direct translation.

Imagine que você precisa prever o tempo, o preço das ações ou o consumo de energia elétrica para os próximos meses. Isso é o que chamamos de previsão de séries temporais. O problema é que os dados do mundo real são bagunçados: têm tendências de longo prazo (como o clima esquentando ano a ano), ciclos curtos (como o trânsito ficando pesado às 18h) e mudanças repentinas (como uma tempestade ou uma crise econômica).

Os modelos de inteligência artificial antigos tentavam usar a mesma "ferramenta" para tudo, como se tentasse consertar um relógio, um carro e um computador usando apenas um martelo. Eles não conseguiam entender a diferença entre o ritmo constante e as mudanças bruscas.

O artigo que você enviou apresenta o MoHETS, uma nova inteligência artificial que resolve esse problema de forma brilhante. Vamos explicar como ele funciona usando analogias do dia a dia:

1. A Grande Ideia: A Equipe de Especialistas (MoE)

Imagine que você tem um time de consultores para resolver um problema complexo.

  • Os modelos antigos tinham um time onde todos eram iguais: todos eram "generalistas" que usavam o mesmo método de pensar (chamado de MLPs). Se o problema fosse sobre ritmo, eles tentavam resolver como se fosse sobre tendência.
  • O MoHETS cria uma equipe de especialistas heterogêneos. Ele sabe que precisa de tipos de mentes diferentes para problemas diferentes.

2. Como o MoHETS Organiza sua Equipe?

O MoHETS divide o trabalho em duas frentes principais, usando uma técnica chamada Mixture-of-Heterogeneous-Experts (MoE):

  • O Especialista "Fluxo Contínuo" (O Convolutional Expert):
    Imagine um marceneiro que entende como a madeira cresce e se move ao longo do tempo. Ele é especialista em ver a "trajetória" geral, as tendências de longo prazo e a continuidade da história. No MoHETS, esse especialista usa convoluções (uma técnica matemática que olha para a vizinhança dos dados) para entender o que está acontecendo de forma suave e contínua. Ele cuida da "história" do dado.

  • Os Especialistas "Ritmo e Frequência" (Os Fourier Experts):
    Imagine um músico ou um engenheiro de som que consegue ouvir uma música e separar o baixo, a bateria e o violino. Eles são especialistas em identificar padrões que se repetem (como o dia e a noite, ou a semana e o fim de semana). No MoHETS, esses especialistas usam Fourier (uma técnica que transforma dados em ondas sonoras/frequências) para pegar os ciclos rápidos e as repetições. Eles cuidam dos "ritmos" do dado.

O Mestre de Cerimônias (O Roteador):
O MoHETS tem um "gerente" inteligente. Quando um pedaço de dados chega, o gerente olha para ele e diz: "Isso parece uma tendência de longo prazo, vá para o marceneiro!" ou "Isso parece um ciclo de fim de semana, vá para o músico!".
Isso é muito mais eficiente do que fazer todos trabalharem em tudo. É como chamar o encanador só para o cano e o eletricista só para a fiação, em vez de contratar dois eletricistas para consertar a casa inteira.

3. O "GPS" Externo (Covariadas)

Às vezes, o dado por si só não é suficiente. Se você quer prever o consumo de energia, saber que é "segunda-feira de Natal" ajuda muito.
O MoHETS tem um módulo especial que lê informações externas (como calendário, clima ou feriados) e as mistura com os dados históricos. É como se o modelo tivesse um GPS que diz: "Ei, estamos em um feriado, então o padrão de trânsito vai mudar, ajuste a previsão!". Isso ajuda o modelo a não se perder quando o mundo muda de repente.

4. O Tradutor Final (Decoder)

Muitos modelos antigos tentavam "chutar" o futuro ponto por ponto, o que causava erros que se acumulavam (como uma torre de cartas caindo).
O MoHETS usa um decodificador de "manhã". Em vez de tentar adivinhar um ponto de cada vez, ele olha para o bloco inteiro de dados que acabou de processar e "desenha" o futuro de uma vez só, como se estivesse completando um desenho já iniciado. Isso torna a previsão mais estável e precisa.

Por que isso é importante?

O MoHETS foi testado em 7 conjuntos de dados reais (como tráfego em São Francisco, consumo de energia e clima) e venceu todos os concorrentes, reduzindo o erro de previsão em cerca de 12%.

Resumo da Ópera:
O MoHETS é como uma orquestra bem regida. Em vez de todos os músicos tocando a mesma nota (o que soa chato e impreciso), ele tem um maestro que sabe exatamente quando chamar o violino (para os ritmos rápidos), o contrabaixo (para as tendências lentas) e o flautista (para os detalhes externos), criando uma previsão do futuro muito mais harmoniosa e precisa.

Isso significa que, no futuro, poderemos prever crises de energia, otimizar o tráfego de cidades e planejar o clima com muito mais confiança, economizando dinheiro e recursos.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →