Causal Structure Learning in Hawkes Processes with Complex Latent Confounder Networks

Each language version is independently generated for its own context, not a direct translation.

Imagine que você está tentando entender por que uma multidão em um estádio começa a gritar, aplaudir ou cantar ao mesmo tempo. Você tem câmeras que gravam apenas alguns setores da arquibancada (os processos observados), mas sabe que existem milhares de outras pessoas em setores que você não consegue ver (os processos latentes).

Essas pessoas invisíveis podem estar influenciando o que você vê. Se você não levar em conta quem está "no escuro", pode concluir erroneamente que o setor A está gritando porque o setor B gritou, quando na verdade ambos estavam reagindo a um jogador invisível no meio do campo.

Este artigo, apresentado na conferência ICLR 2026, propõe uma nova maneira de desenhar o "mapa de influências" (causalidade) em sistemas complexos, mesmo quando parte do sistema está escondida.

Aqui está a explicação simplificada, usando analogias do dia a dia:

1. O Problema: O "Fantasma" na Máquina

A maioria dos métodos atuais para entender causa e efeito em dados que acontecem ao longo do tempo (como tweets, batimentos cardíacos ou alarmes de incêndio) assume que vemos tudo. Eles olham para os dados e dizem: "Ah, o evento X aconteceu antes do Y, então X causou Y".

Mas, na vida real, isso é como tentar entender o trânsito de uma cidade olhando apenas para uma rua, sem saber que há um semáforo quebrado em outra rua que está causando o engarrafamento. Esse semáforo é o processo latente (invisível). Se ignorarmos ele, criamos conexões falsas no nosso mapa.

2. A Grande Ideia: Transformar Tempo Contínuo em "Frames" de Filme

O processo Hawkes (o modelo matemático usado aqui) é como um rio contínuo de eventos. É difícil analisar um rio que nunca para.

Os autores tiveram uma ideia brilhante: E se a gente congelar o tempo?
Eles mostram que, se você dividir o tempo em intervalos muito pequenos (como os quadros de um filme), o comportamento complexo e contínuo do rio se transforma em algo simples e linear. É como se você transformasse um filme de ação em uma sequência de desenhos animados simples.

Nessa versão "congelada" (discreta), as regras da matemática ficam mais fáceis de seguir. Eles conseguem tratar esses eventos como se fossem uma conversa onde cada pessoa fala baseada no que as outras disseram nos últimos segundos.

3. A Detetive do "Rank" (A Escada de Influência)

A parte mais genial do trabalho é como eles encontram os fantasmas (os processos latentes) sem precisar vê-los.

Imagine que você tem duas pessoas, A e B, que estão gritando ao mesmo tempo.

Cenário 1: A gritou, e B gritou porque ouviu A. (Causa direta).
Cenário 2: Um terceiro, invisível (C), gritou, e tanto A quanto B ouviram C e gritaram juntos. (Causa oculta).

Como saber a diferença? Os autores usam uma ferramenta matemática chamada teste de "Rank" (que pode ser pensado como medir a "complexidade" ou o número de "fios" que conectam as coisas).

Se A e B estão conectados apenas entre si, a "complexidade" da conexão é baixa.
Se existe um fantasma (C) conectando os dois, a matemática revela um padrão específico: a conexão parece ter um "fio extra" invisível que não pode ser explicado apenas pelo que A e B dizem um para o outro.

É como se, ao analisar a música que A e B estão fazendo, você percebesse que a harmonia só funciona se houver um terceiro instrumento invisível tocando junto. O "Rank" baixo (ou a falta de complexidade esperada) é a assinatura do fantasma.

4. O Algoritmo: O Jogo de "Descoberta em Duas Fases"

O método proposto funciona como um jogo de detetive em dois passos, repetido até o caso ser resolvido:

Fase 1 (Mapear o Visível): O algoritmo olha para todos os eventos que ele consegue ver e tenta desenhar as conexões diretas entre eles. Ele pergunta: "Quem causou quem entre os que eu vejo?"
Fase 2 (Caçar os Invisíveis): Se o algoritmo percebe que há uma "sombra" (uma conexão estranha que não se encaixa), ele diz: "Algo invisível está causando isso!". Ele cria um "fantasma" no mapa, dá um nome a ele e tenta descobrir quem esse fantasma está influenciando.

Depois de criar o fantasma, ele volta para a Fase 1 para ver se, agora que o fantasma está no mapa, as conexões fazem mais sentido. Ele repete esse ciclo (descobrir visíveis -> descobrir invisíveis -> voltar para visíveis) até que todo o quebra-cabeça esteja montado.

5. Por que isso é importante?

Imagine que você é um médico tentando entender por que um paciente teve um ataque cardíaco.

Método antigo: "O paciente comeu sal e depois teve o ataque. Logo, o sal causou o ataque." (Ignora que o paciente tinha estresse no trabalho, que não foi medido).
Método novo: "O sal e o estresse (invisível) causaram o ataque. Mesmo que não tenhamos medido o estresse, o padrão dos dados nos diz que algo invisível está ligando o sal ao coração."

Resumo em uma frase

Os autores criaram um "detetive matemático" que consegue transformar dados contínuos e complexos em quadros simples, e usa padrões escondidos na música desses dados para desenhar um mapa completo de causa e efeito, revelando até mesmo os culpados que estão invisíveis.

Eles testaram isso em dados sintéticos (simulados) e em dados reais de uma rede de telefonia celular (onde alarmes de falha ocorrem), e o método conseguiu encontrar a estrutura correta muito melhor do que as técnicas atuais, mesmo quando parte do sistema estava escondida.

Each language version is independently generated for its own context, not a direct translation.

Resumo Técnico: Aprendizado de Estrutura Causal em Processos de Hawkes com Redes Complexas de Confundidores Latentes

1. O Problema

Os processos de Hawkes multivariados são ferramentas poderosas para modelar dependências temporais e interações baseadas em eventos em sistemas complexos (ex: redes sociais, neurociência, finanças). No entanto, a maioria dos métodos existentes para aprendizado de estrutura causal assume causalidade suficiente, ou seja, que todos os subprocessos relevantes (sequências de eventos) são observados.

Na prática, muitos sistemas são apenas parcialmente observáveis. A presença de subprocessos latentes (não medidos) que atuam como confundidores pode criar arestas causais espúrias entre subprocessos observados, levando a conclusões incorretas sobre a dinâmica do sistema. O desafio central abordado neste trabalho é:

Recuperar a estrutura causal completa (incluindo subprocessos observados e latentes) em processos de Hawkes contínuos.
Fazer isso sem conhecimento prévio sobre a existência, o número ou a localização das conexões dos subprocessos latentes.

2. Metodologia

A abordagem proposta baseia-se em três pilares fundamentais:

A. Representação Discretizada Linear
Os autores demonstram que, à medida que o intervalo de tempo ( $\Delta$ ) tende a zero, um processo de Hawkes contínuo pode ser representado como um modelo causal linear de séries temporais discretas (uma representação autorregressiva).

A contagem de eventos em uma janela de tempo $n$ é uma combinação linear das contagens de janelas passadas de todos os subprocessos (observados e latentes), mais ruído branco.
Isso permite transformar o problema de inferência em dados de contagem discretos, onde testes estatísticos de segunda ordem (covariância) podem ser aplicados.

B. Identificabilidade via Restrições de RANK
O núcleo da metodologia utiliza as propriedades de rango (rank) das matrizes de covariância cruzada entre variáveis discretizadas para identificar confundidores latentes.

Princípio: A presença de um subprocesso latente que afeta múltiplos subprocessos observados cria um padrão de deficiência de rango (rank deficiency) nas matrizes de covariância cruzada.
Condições de Identificabilidade: O artigo estabelece condições necessárias e suficientes baseadas em:
1. Função de Excitação: Assume-se uma forma separável $\phi_{ij}(s) = a_{ij}w(s)$ , onde $w(s)$ é uma função de decaimento comum.
2. Fidelidade de Rango: Assume-se que as relações de rango observadas refletem a estrutura causal subjacente (sem cancelamentos patológicos).
3. Situação de Caminho Simétrico: Para que um confundidor latente seja identificável, os caminhos dele até seus efeitos observados devem ser simétricos (mesmo número de subprocessos latentes intermediários, sem ciclos nesses caminhos).

C. Algoritmo Iterativo de Duas Fases
Os autores propõem um algoritmo que alterna entre duas fases para reconstruir o grafo causal completo:

Fase I (Identificação de Relações Causais): Para cada subprocesso (observado ou latente já descoberto), o algoritmo testa subconjuntos de outros subprocessos para encontrar o conjunto mínimo de "pais-causa" que satisfazem as condições de independência local (verificadas via testes de rango).
Fase II (Descoberta de Novos Latentes): Quando a Fase I não consegue mais resolver subprocessos, o algoritmo verifica pares de subprocessos para detectar a assinatura de rango que indica a existência de um novo confundidor latente. Se detectado, um novo nó latente é introduzido no grafo, e seus "surrogados observados" (efeitos observados) são usados para inferir suas conexões futuras.

3. Principais Contribuições

Primeira Estrutura Principiada para Latentes em Hawkes: É o primeiro trabalho a fornecer um framework teoricamente fundamentado para identificar subprocessos latentes e recuperar a estrutura causal em processos de Hawkes contínuos sem pré-requisitos sobre o número de latentes.
Teoremas de Identificabilidade: Derivação de condições necessárias e suficientes para identificar subprocessos latentes e influências causais, mapeando o processo contínuo para um modelo linear discreto e utilizando restrições de rango.
Algoritmo de Descoberta Automática: Desenvolvimento de um algoritmo iterativo que descobre tanto as relações entre subprocessos observados quanto a existência e as conexões de subprocessos latentes, sem necessidade de intervenção humana para especificar o número de latentes.
Uso de Surrogados Observados: Uma inovação conceitual onde os efeitos observados de um latente são tratados como "surrogados" para inferir as relações causais do próprio latente com o restante do sistema.

4. Resultados Experimentais

O método foi avaliado em dados sintéticos e em um conjunto de dados do mundo real:

Dados Sintéticos:
- Comparado com seis baselines fortes (métodos baseados em verossimilhança como SHP, THP, NPHC; e métodos baseados em rango para dados i.i.d. como Hier. Rank, RLCD; e LPCMCI para séries temporais).
- O método proposto superou consistentemente todas as baselines em termos de F1-score, especialmente em cenários com confundidores latentes complexos.
- Demonstrou robustez a violações de fidelidade de rango e sensibilidade ao tamanho da janela de discretização ( $\Delta$ ).
- Escalabilidade testada em grafos maiores (14 subprocessos) com recuperação precisa.
Dados do Mundo Real (Rede Celular):
- Utilizado um conjunto de dados público de alarmes de rede celular (18 tipos de alarmes, 55 dispositivos).
- Foco em um subgrafo onde um alarme específico (id=7) foi tratado como latente (excluído manualmente).
- O método recuperou com sucesso o subprocesso latente e suas influências principais, superando significativamente os baselines (F1-score de 0.76 vs. ~0.49 dos melhores baselines).

5. Significado e Impacto

Este trabalho preenche uma lacuna crítica na literatura de descoberta causal e processos pontuais.

Viabilidade Prática: Permite analisar sistemas reais onde a observação completa é impossível (ex: neurociência, onde não se pode registrar todos os neurônios), evitando conclusões errôneas sobre causalidade.
Fundamentação Teórica: Ao conectar processos de Hawkes contínuos a modelos lineares discretos e utilizar restrições de rango, oferece garantias teóricas de identificabilidade que faltavam em abordagens anteriores baseadas apenas em verossimilhança.
Generalização: O framework é aplicável a qualquer sistema modelado por processos de Hawkes onde a dinâmica temporal é endógena e a observação é parcial, abrindo caminho para aplicações em finanças, epidemiologia e monitoramento de infraestrutura.

Em resumo, o artigo apresenta uma solução robusta e teoricamente garantida para o problema de "causalidade em sombras", permitindo que pesquisadores descubram a estrutura causal completa de sistemas complexos mesmo quando partes cruciais desses sistemas permanecem invisíveis aos sensores.

Causal Structure Learning in Hawkes Processes with Complex Latent Confounder Networks

1. O Problema: O "Fantasma" na Máquina

2. A Grande Ideia: Transformar Tempo Contínuo em "Frames" de Filme

3. A Detetive do "Rank" (A Escada de Influência)

4. O Algoritmo: O Jogo de "Descoberta em Duas Fases"

5. Por que isso é importante?

Resumo em uma frase

Resumo Técnico: Aprendizado de Estrutura Causal em Processos de Hawkes com Redes Complexas de Confundidores Latentes

1. O Problema

2. Metodologia

3. Principais Contribuições

4. Resultados Experimentais

5. Significado e Impacto

Mais como este

A Comparative Study of Penalised, Bayesian, Spatial, and Tree-Based Models for Provincial Poverty in Indonesia: Small Samples and High Collinearity

Identification and Inference in Nonlinear Dynamic Network Models

Learning Nonlinear Regime Transitions via Semi-Parametric State-Space Models

Bayesian Global-Local Shrinkage with Univariate Guidance for Ultra-High-Dimensional Regression

StrADiff: A Structured Source-Wise Adaptive Diffusion Framework for Linear and Nonlinear Blind Source Separation