Proximity Measure of Information Object Features for Solving the Problem of Their Identification in Information Systems

O artigo propõe uma nova medida quantitativa-qualitativa de proximidade para características de objetos de informação, que utiliza abordagens probabilísticas e de possibilidade para lidar com erros de determinação e permitir a identificação de objetos físicos sem a necessidade de transformação prévia dos dados.

Volodymyr Yuzefovych

Publicado 2026-04-08
📖 5 min de leitura🧠 Leitura aprofundada

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é um detetive tentando descobrir se duas pessoas que você viu em lugares diferentes são, na verdade, a mesma pessoa.

Uma pessoa diz: "Vi um homem de 1,80m, de camisa azul, perto do banco."
Outra pessoa diz: "Vi um cara de 1,78m, de camisa azul-claro, perto do caixa eletrônico."

Será que é o mesmo sujeito? Ou são dois vizinhos parecidos?

O artigo que você pediu para explicar trata exatamente desse problema, mas no mundo dos computadores e sistemas de informação. Quando dados chegam de várias fontes (como câmeras de segurança, sensores de tráfego ou relatórios manuais), eles muitas vezes descrevem o mesmo objeto real (um carro, um avião, uma pessoa) de formas ligeiramente diferentes.

Aqui está a explicação simples do que os autores propõem:

1. O Problema: "Quase" não é "Igual"

Em sistemas antigos, se o computador recebesse dois dados que não batiam 100% (um carro a 50km/h e outro a 52km/h), ele pensava: "São dois carros diferentes". Isso cria uma bagunça: o sistema duplica informações, gasta memória e pode tomar decisões erradas (como achar que há dois carros onde só há um).

O problema é que nenhum sensor é perfeito. Eles têm "erros" ou "tolerâncias". Um sensor pode medir 50km/h e o outro 52km/h, mas ambos estão olhando para o mesmo carro.

2. A Solução: Uma "Medida de Proximidade" Inteligente

O autor, V.V. Yuzefovych, criou uma nova fórmula matemática para calcular o quão "parecidos" dois objetos são, levando em conta que os dados podem estar um pouco errados. Ele divide os dados em dois tipos e usa "ferramentas" diferentes para cada um:

A. Para Números (Dados Quantitativos)

Exemplo: A velocidade do carro, a temperatura, a distância.

  • A Analogia: Imagine que cada medição é como atirar uma flecha em um alvo. O centro do alvo é o valor real, mas a flecha pode cair um pouco para o lado (o erro).
  • Como funciona: Em vez de apenas medir a distância física entre as flechas (que pode enganar), o sistema calcula a probabilidade. "Qual a chance de essas duas flechas terem sido atiradas no mesmo alvo, considerando que minhas mãos tremem um pouco?"
  • Se os sensores são muito precisos (mãos firmes), uma pequena diferença já significa que são objetos diferentes. Se os sensores são ruins (mãos trêmulas), o sistema é mais tolerante e aceita que sejam o mesmo objeto mesmo com uma diferença maior.

B. Para Palavras ou Categorias (Dados Qualitativos)

Exemplo: A cor do carro ("Azul" vs "Azul-claro"), o tipo de veículo ("Caminhonete" vs "Picape"), ou o nível de perigo.

  • A Analogia: Imagine que as categorias não são caixas rígidas, mas sim nuvens de fumaça.
    • Se alguém diz "Azul", a "nuvem" de fumaça cobre o azul escuro, o azul claro e talvez um pouco de verde-azulado.
    • Se outra pessoa diz "Azul-claro", a nuvem dela se sobrepõe à primeira.
  • Como funciona: O sistema usa uma teoria chamada "Conjuntos Fuzzy" (Lógica Difusa). Ele verifica o quanto as "nuvens" se sobrepõem. Se as nuvens se tocam muito, é provável que seja o mesmo objeto. Se elas estão separadas, são objetos diferentes.
  • O Fator "Confiança": O sistema também pergunta: "Quão certo você está?". Se a pessoa diz "É provavelmente um caminhão", a nuvem de fumaça fica mais espalhada (menos definida). Se ela diz "Tenho certeza absoluta", a nuvem é pequena e precisa. Isso ajuda a decidir se dois relatos contraditórios são o mesmo objeto ou não.

3. O Grande Truque: A Multiplicação

O autor sugere que, para decidir se dois objetos são o mesmo, não devemos apenas somar as similaridades. Devemos multiplicá-las.

  • A Analogia: Imagine que você tem duas chaves para abrir uma porta.
    • Se a chave da cor (qualitativo) encaixa perfeitamente, mas a chave do tamanho (quantitativo) não encaixa nem um pouco, a porta não abre.
    • O sistema diz: "Se um dos dados for totalmente diferente, não importa o quão parecidos sejam os outros, são objetos diferentes."
    • Isso evita que o sistema confunda um "carro vermelho pequeno" com um "caminhão vermelho grande" só porque a cor é a mesma.

4. Por que isso é importante?

Hoje, muitos sistemas de inteligência artificial e vigilância sofrem com "duplicidade". Eles acham que um objeto é dois, ou três, porque os dados chegam de formas diferentes.

Com essa nova medida:

  1. Menos Bagunça: O sistema limpa a duplicidade de dados automaticamente.
  2. Decisões Melhores: Se um sistema de defesa aérea ou de trânsito sabe que é o mesmo carro em vez de dois carros, ele toma decisões mais seguras.
  3. Sem "Tradução" Chata: Antigamente, era preciso transformar todos os dados para a mesma unidade de medida antes de comparar. Essa nova medida aceita números e palavras misturados, entendendo os erros de cada um naturalmente.

Resumo Final

Pense nisso como um filtro de realidade. O mundo real é imperfeito e os nossos sensores também são. Em vez de exigir que os dados batam perfeitamente (o que nunca acontece), esse método pergunta: "Dado o quanto esses sensores costumam errar, qual a chance de que esses dois relatos sejam sobre a mesma coisa?"

Se a chance for alta, o sistema une as informações. Se for baixa, ele mantém separados. É uma maneira mais inteligente e humana de fazer computadores entenderem o mundo real.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →