A Consensus-Driven Multi-LLM Pipeline for Missing-Person Investigations

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é um detetive tentando encontrar uma criança desaparecida. As primeiras 72 horas são cruciais, como uma corrida contra o relógio. Você tem muitas pistas: relatos de testemunhas, mapas, dados de transporte, clima e fotos. Mas tudo isso está misturado, desorganizado e às vezes contraditório.

O Guardian é um sistema de inteligência artificial criado para ajudar os detetives a organizar esse caos e encontrar a criança mais rápido. Mas, em vez de confiar em um único "super-robô" para tomar todas as decisões (o que seria arriscado), o Guardian usa uma abordagem diferente: o Consenso.

Aqui está como funciona, explicado de forma simples:

1. A Grande Reunião de Especialistas (O Pipeline Multi-LLM)

Imagine que você tem três especialistas diferentes sentados em uma mesa para analisar o mesmo caso:

Especialista A (Modelo Qwen): Um analista rápido e detalhista.
Especialista B (Modelo Llama): Um analista criativo e observador.
O Juiz (Modelo Gemini): Um árbitro experiente que não cria novas pistas, mas apenas decide qual das duas opiniões anteriores é a mais confiável.

Em vez de deixar um único robô ler o relatório e dar a resposta, o Guardian pede que todos leiam o caso e escrevam suas próprias versões do que aconteceu.

2. O Juiz e a "Câmara de Consenso"

Aqui entra a parte mágica. Se o Especialista A diz que a criança foi vista em uma praça e o Especialista B diz que foi em um parque, o sistema não entra em pânico.

O Juiz (Consensus Engine) entra em ação. Ele compara as duas versões.
Se houver um erro de digitação ou um formato estranho em uma das respostas, o Juiz conserta isso (como um editor de texto super-rápido).
Se as opiniões divergirem, o Juiz escolhe a versão que tem mais apoio nos fatos do relatório original, descartando suposições arriscadas.

A analogia: Pense nisso como um júri em um tribunal. Em vez de um único jurado decidir o destino do caso, vários jurados debatem, e só quando há um consenso claro (ou uma decisão muito bem fundamentada) é que o veredito é dado. Isso evita que um "alucinação" de uma máquina (quando a IA inventa fatos) leve os detetives para o lugar errado.

3. O Treinamento Especializado (QLoRA)

Para que esses especialistas sejam bons, eles foram treinados especificamente para esse trabalho. Os criadores usaram uma técnica chamada QLoRA.

Analogia: Imagine que você tem um professor universitário muito inteligente (a IA base), mas ele sabe de tudo, desde culinária até física quântica. Para ajudar a encontrar crianças, você não quer que ele fale sobre culinária. Você "cola" um pequeno adesivo de treinamento (o QLoRA) nele que ensina apenas como ler relatórios policiais e extrair informações importantes. Isso torna o especialista muito bom no que faz, sem precisar reconstruir todo o cérebro dele.

4. A Segurança e a "Caixa Preta"

O sistema é projetado para ser auditorável. Isso significa que, se o sistema decidir que a criança deve ser procurada em uma área específica, ele deixa um rastro claro de como chegou a essa conclusão.

Ele não diz apenas "vá para o norte". Ele diz: "O relatório diz que a criança foi vista perto da praça X, e dois dos três especialistas concordaram que ela pode ter ido para o norte. Portanto, priorizamos o norte."
Isso é vital porque, em casos de desaparecimento, um erro pode custar muito tempo e recursos. O sistema prefere ser conservador e seguro a ser rápido e errado.

5. O Resultado Final

No final, o Guardian entrega aos investigadores:

Um resumo limpo do que se sabe (sem enrolação).
Uma lista de pistas organizadas (onde, quando, quem).
Um mapa de probabilidade (onde é mais provável que a criança esteja).

Por que isso é importante?

A maior lição deste trabalho é que, em situações de vida ou morte, confiar em um único modelo de IA é perigoso. O Guardian mostra que, quando você usa múltiplas IAs, faz com que elas debatam entre si e tenha um "juiz" para resolver as brigas, você cria um sistema muito mais confiável, seguro e útil para salvar vidas.

É como ter uma equipe de detetives experientes trabalhando juntos, em vez de confiar a vida de uma criança a um único oráculo mágico que pode estar sonhando acordado.

A Consensus-Driven Multi-LLM Pipeline for Missing-Person Investigations

1. A Grande Reunião de Especialistas (O Pipeline Multi-LLM)

2. O Juiz e a "Câmara de Consenso"

3. O Treinamento Especializado (QLoRA)

4. A Segurança e a "Caixa Preta"

5. O Resultado Final

Por que isso é importante?

Resumo Técnico: Pipeline Guardian para Investigações de Pessoas Desaparecidas

1. O Problema

2. Metodologia: O Sistema Guardian

3. Principais Contribuições

4. Resultados e Avaliação

5. Significado e Impacto

A Consensus-Driven Multi-LLM Pipeline for Missing-Person Investigations

1. A Grande Reunião de Especialistas (O Pipeline Multi-LLM)

2. O Juiz e a "Câmara de Consenso"

3. O Treinamento Especializado (QLoRA)

4. A Segurança e a "Caixa Preta"

5. O Resultado Final

Por que isso é importante?

Resumo Técnico: Pipeline Guardian para Investigações de Pessoas Desaparecidas

1. O Problema

2. Metodologia: O Sistema Guardian

3. Principais Contribuições

4. Resultados e Avaliação

5. Significado e Impacto

Mais como este

MASEval: Extending Multi-Agent Evaluation from Models to Systems

LDP: An Identity-Aware Protocol for Multi-Agent LLM Systems

Quantifying the Accuracy and Cost Impact of Design Decisions in Budget-Constrained Agentic LLM Search

Interpretable Markov-Based Spatiotemporal Risk Surfaces for Missing-Child Search Planning with Reinforcement Learning and LLM-Based Quality Assurance

AgentOS: From Application Silos to a Natural Language-Driven Data Ecosystem