Proximity Measure of Information Object Features for Solving the Problem of Their Identification in Information Systems

El artículo propone una nueva medida cuantitativa-cualitativa de proximidad para identificar objetos físicos a partir de múltiples fuentes de datos, utilizando enfoques probabilísticos y de posibilidad que permiten comparar valores de características sin necesidad de transformaciones previas.

Volodymyr Yuzefovych

Publicado 2026-04-08
📖 5 min de lectura🧠 Análisis profundo

Each language version is independently generated for its own context, not a direct translation.

¡Claro que sí! Imagina que estás intentando resolver un rompecabezas gigante, pero las piezas te llegan de diferentes cajas, y cada caja tiene un poco de polvo o está un poco desenfocada. Eso es básicamente lo que este artículo trata de resolver.

Aquí tienes la explicación de este trabajo técnico, traducida a un lenguaje sencillo, con analogías de la vida real:

🕵️‍♂️ El Problema: "¿Es el mismo perro o dos diferentes?"

Imagina que tienes un sistema de seguridad (como una app de clima o un radar de tráfico) que recibe información de muchas fuentes diferentes: cámaras, sensores, reportes de gente, satélites, etc.

A veces, dos fuentes diferentes reportan el mismo objeto (por ejemplo, un coche rojo), pero lo describen de forma ligeramente distinta:

  • La Cámara A dice: "El coche está a 100 metros, es rojo y va rápido".
  • El Sensor B dice: "Hay un coche a 105 metros, es rojo y va rápido".

¿Son el mismo coche o son dos coches distintos?

  • Si dices que son dos coches, tu sistema se llena de "basura" (datos duplicados) y confunde la realidad.
  • Si dices que es el mismo coche, pero en realidad son dos, podrías tomar decisiones erróneas.

El problema es que ningún sensor es perfecto. Todos cometen pequeños errores. Los métodos antiguos decían: "Si no es idéntico al 100%, son dos cosas distintas". Eso es muy estricto y no funciona bien en el mundo real.

💡 La Solución: Una "Regla de Confianza" Inteligente

El autor del artículo, V.V. Yuzefovych, propone una nueva forma de medir la "proximidad" (qué tan parecidos son dos objetos) que tiene en cuenta esos errores. Imagina que en lugar de una regla rígida, usas una lupa mágica que entiende que los datos pueden tener "niebla" alrededor.

El sistema divide los datos en dos tipos y usa herramientas diferentes para cada uno:

1. Para los Números (Datos Cuantitativos) 📏

Ejemplo: La distancia, la velocidad, la temperatura.

Imagina que dos personas miden la altura de un edificio.

  • La persona A usa una cinta métrica vieja y dice: "100 metros".
  • La persona B usa una cinta nueva y dice: "102 metros".

En lugar de decir "¡Son diferentes!", el nuevo método usa las leyes de la probabilidad (como si fuera un juego de dardos).

  • Si la cinta vieja es muy imprecisa, su "dardo" puede caer en un área grande.
  • Si la cinta nueva es precisa, su "dardo" cae en un área pequeña.
  • El sistema calcula: "¿Qué probabilidad hay de que ambos dardos estén apuntando al mismo punto real?".

Si las cintas son muy buenas (precisas) y las medidas son diferentes, el sistema dice: "¡Alto! Son dos edificios distintos". Pero si las cintas son malas (imprecisas) y las medidas son cercanas, el sistema dice: "Probablemente es el mismo edificio, solo que las cintas fallaron un poco".

2. Para las Palabras o Categorías (Datos Cualitativos) 🗣️

Ejemplo: El color, el tipo de animal, el nivel de peligro.

Aquí es donde entra la Lógica Difusa (Fuzzy Logic). Imagina que no es blanco o negro, sino un espectro de grises.

  • Si un sensor dice "Es un perro" y otro dice "Es un gato", son muy diferentes.
  • Pero, ¿qué pasa si uno dice "Probablemente es un perro" y el otro "Es un perro"?

El autor sugiere tratar estas palabras como sombras. Si la sombra de "perro" de un sensor se superpone mucho con la sombra de "perro" del otro, entonces son el mismo objeto. Si las sombras no se tocan, son objetos distintos. Además, si el sensor dice "Estoy dudoso de que sea un perro", la sombra se hace más pequeña y difusa, lo que hace que sea más difícil que coincida con otro.

🧩 El Gran Rompecabezas: Uniendo Todo

Una vez que el sistema ha comparado cada característica (distancia, color, tipo) por separado, necesita decidir si todo el conjunto es el mismo objeto.

El autor propone una regla muy estricta y lógica: Multiplicación.
Imagina que tienes 5 pistas para identificar a un sospechoso. Si en una sola pista (por ejemplo, la altura) hay una diferencia enorme e imposible de ignorar, entonces no es el mismo sospechoso, sin importar que las otras 4 pistas coincidan perfectamente.

  • Método antiguo (Suma): Si 4 pistas coinciden y 1 falla un poco, el promedio sigue siendo "parecido". (Peligroso: podrías confundir a dos personas).
  • Método nuevo (Multiplicación): Si una pista falla mucho, el resultado total se vuelve cero. "No es el mismo objeto". Esto es mucho más seguro para evitar errores.

🌟 ¿Por qué es importante esto?

  1. Menos Basura: El sistema no guarda dos copias del mismo coche o persona. Ahorra espacio y memoria.
  2. Mejores Decisiones: Al tener una imagen más clara y sin duplicados, los sistemas (como radares de tráfico o apps de clima) toman decisiones más acertadas.
  3. Adaptabilidad: Funciona incluso si los sensores son de mala calidad, siempre que sepamos cuánto suelen equivocarse.

En Resumen

Este artículo nos enseña que para saber si dos cosas son iguales, no debemos buscar una coincidencia perfecta (que casi nunca existe), sino calcular cuán probable es que sean lo mismo, teniendo en cuenta lo "torpes" o precisos que son los sensores que nos dan la información. Es como decir: "No es que los datos sean diferentes, es que mis gafas están un poco sucias, así que voy a ajustar mi cálculo para ver la verdad".

Recibe artículos como este en tu bandeja de entrada

Resúmenes diarios o semanales personalizados según tus intereses. Gists o resúmenes técnicos, en tu idioma.

Probar Digest →