OrgForge: A Multi-Agent Simulation Framework for Verifiable Synthetic Corporate Corpora

O artigo apresenta o OrgForge, um framework de simulação multiagente de código aberto que gera corpora corporativos sintéticos verificáveis e temporalmente consistentes, combinando um motor determinístico de eventos com modelos de linguagem para criar dados realistas de múltiplos formatos (como Slack e JIRA) com ground truth imutável para avaliação de pipelines RAG.

Jeffrey Flynt

Publicado 2026-03-17
📖 5 min de leitura🧠 Leitura aprofundada

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é um treinador de futebol tentando preparar sua equipe para a Copa do Mundo. Para treinar, você precisa de um campo de simulação onde você possa criar cenários perfeitos: "E se o goleiro se machucar no minuto 10? E se chover torrencialmente no segundo tempo?".

O problema é que, na vida real, você não consegue controlar tudo. E se você pedir para um robô (uma Inteligência Artificial) escrever esses cenários para você, ele pode inventar coisas que não fazem sentido, como dizer que o jogo começou às 14h, mas o gol foi marcado às 13h. Isso chamamos de "alucinação". Se você treinar sua equipe com dados errados, eles vão falhar na vida real.

É exatamente aqui que entra o OrgForge, o sistema apresentado por Jeffrey Flynt.

O Que é o OrgForge?

Pense no OrgForge como um "Simulador de Empresa com Regras de Física".

Em vez de deixar a Inteligência Artificial (IA) inventar a história inteira de uma empresa, o OrgForge separa o trabalho em duas partes distintas, como se fosse uma peça de teatro:

  1. O Diretor de Cena (O Motor Determinístico): É um programa de computador rígido e lógico. Ele decide o que acontece de verdade.
    • Exemplo: "O servidor caiu às 14:00. O engenheiro João foi chamado. O ticket foi aberto."
    • Ele mantém um "diário de bordo" (Ground Truth) imutável. Nada pode mudar o que está escrito lá.
  2. Os Atores (As IAs de Texto): São as IAs generativas (como o GPT). Elas só escrevem o que as pessoas dizem e escrevem com base no que o Diretor de Cena decidiu.
    • Exemplo: O Diretor diz "João está estressado". A IA escreve: "João manda uma mensagem no Slack: 'Estou exausto, preciso de ajuda!'".
    • A Regra de Ouro: A IA não pode inventar fatos. Ela só pode escrever o "texto" (a prosa) baseado no fato que o Diretor já validou.

Como Funciona a "Física" da Empresa?

O OrgForge não é apenas um gerador de texto; ele simula como as pessoas se sentem e se relacionam, usando três "leis da física" corporativa:

  • A Lei do Estresse (Propagação): Imagine que o estresse é como um vírus. Se o "engenheiro-chave" (aquele que todo mundo conhece) entra em pânico, o estresse dele "vaza" para os colegas próximos. O sistema calcula quem é mais importante na rede e espalha o estresse de forma lógica.
  • A Lei do Relacionamento (Decaimento e Reforço): Se dois colegas trabalham juntos em um projeto, a "amizade" (ou conexão) entre eles fica mais forte. Se eles não se falam por dias, a conexão enfraquece. O sistema atualiza esses laços todos os dias.
  • A Lei da Escalada (O Caminho Mais Curto): Quando algo dá muito errado (um P1), o sistema não escolhe aleatoriamente quem chamar. Ele usa um mapa mental (como o GPS) para encontrar o caminho mais rápido através das conexões mais fortes até chegar no chefe certo.

O Relógio Mágico (Causalidade)

Um dos maiores problemas em simulações antigas era o tempo. O sistema podia dizer que um e-mail foi enviado antes do problema ser descoberto.

O OrgForge usa um "Relógio Local". Cada funcionário tem seu próprio relógio interno.

  • Se o João está trabalhando em duas coisas ao mesmo tempo, o relógio dele avança para frente.
  • Se a Maria responde ao João, o relógio dela só avança depois que o relógio do João mostrou que ele enviou a mensagem.
    Isso garante que a linha do tempo nunca quebre. Nada acontece antes de ter uma causa.

Para Que Serve Tudo Isso?

O objetivo final é criar um "Campo de Treino Perfeito" para testar sistemas de IA que ajudam empresas a encontrar informações (chamados de RAG - Retrieval-Augmented Generation).

Hoje, testamos essas IAs com dados reais (que têm segredos e erros) ou com dados falsos (que têm contradições). Com o OrgForge, temos:

  1. Verdade Absoluta: Sabemos exatamente o que aconteceu, quando e por quê.
  2. Ruído Realista: O sistema gera conversas inúteis (como "almoço de sexta-feira") misturadas com trabalho sério, para ver se a IA consegue filtrar o que é importante.
  3. Buracos Detectáveis: O sistema pode simular um e-mail que foi enviado e nunca respondido. A IA de teste precisa saber dizer: "Ninguém respondeu a esse e-mail", em vez de inventar uma resposta.

O Resultado

Os autores testaram o sistema e criaram uma base de dados com mais de 1.000 documentos (e-mails, tickets, mensagens de chat) de uma empresa fictícia de 43 pessoas.

Eles descobriram que:

  • Métodos simples de busca (como procurar palavras-chave) funcionam bem para encontrar a causa de um problema.
  • Métodos mais complexos (que entendem o significado das frases) ainda têm dificuldade em entender a lógica de "quem foi escalado para resolver o problema" ou "o que estava acontecendo em uma data específica".

Resumo em Uma Frase

O OrgForge é como um "videogame de gestão empresarial" onde o código do jogo garante que a história faça sentido lógico, enquanto os personagens (IAs) falam de forma natural, criando um banco de dados perfeito para treinar e testar a inteligência artificial das empresas do futuro.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →