Analysis of individual identification and age-class classification of wild female macaque vocalizations without pitch- and formant-based acoustic parameter measurements

Este estudio demuestra que el uso de espectrogramas mel, procesados automáticamente mediante algoritmos de aprendizaje automático como Random Forest y SVM, permite identificar individuos y clasificar grupos de edad en vocalizaciones de macacos japoneses salvajes con alta precisión, incluso con conjuntos de datos pequeños.

Kimpara, R., Kakuta, F., Koda, H., Matsuda, I., Hanya, G.

Publicado 2026-02-19
📖 5 min de lectura🧠 Análisis profundo
⚕️

Esta es una explicación generada por IA de un preprint que no ha sido revisado por pares. No es consejo médico. No tome decisiones de salud basándose en este contenido. Leer descargo de responsabilidad completo

Each language version is independently generated for its own context, not a direct translation.

¡Claro que sí! Imagina que eres un detective en la selva, pero en lugar de buscar huellas dactilares, estás buscando voces.

Aquí tienes la explicación de este estudio sobre los macacos salvajes, contada como si fuera una historia:

🎙️ El Problema: ¿Quién está hablando?

Imagina que estás en un parque lleno de gente hablando a la vez. Si cierras los ojos, ¿podrías distinguir la voz de tu mejor amigo de la de un extraño? ¿Podrías decir si alguien es un niño o un abuelo solo por cómo habla?

Los científicos han intentado hacer esto con los macacos japoneses durante décadas. Antes, para "escuchar" a los monos, los investigadores tenían que actuar como ingenieros de audio muy estrictos. Tenían que medir cosas específicas:

  • ¿Qué tan agudo es el tono? (Como medir la altura de una nota musical).
  • ¿Cómo suena la resonancia? (Como medir el tamaño de una caja de resonancia).

El problema es que esto es como intentar adivinar quién es alguien midiendo solo la longitud de su nariz. A veces funciona, pero es difícil, lento y a veces se equivocan porque cada mono es un poco diferente. Además, en la naturaleza, el viento y el ruido de los ríos hacen que estas mediciones sean muy complicadas.

🤖 La Nueva Solución: El "Oído" de la Inteligencia Artificial

En este estudio, los investigadores (liderados por Kimpara) decidieron probar algo nuevo. En lugar de medir notas musicales específicas, usaron una Inteligencia Artificial (un cerebro de computadora) que funciona como un chef experto.

En lugar de pedirle al chef que mida exactamente cuánta sal o pimienta hay en la sopa, le dieron un retrato completo de la sopa (llamado espectrograma de mel).

  • ¿Qué es un espectrograma? Imagina que es una foto de sonido. En lugar de ver ondas, ves un mapa de colores donde los colores brillantes son sonidos fuertes y las formas muestran cómo cambia la voz con el tiempo. Es como ver la "huella dactilar visual" de un grito.

La computadora aprendió a mirar estas "fotos de sonido" y decir: "¡Esa foto parece a la macaca Sasa!" o "¡Esa otra foto parece a una macaca vieja!".

🐒 La Misión: Dos Retos

Los científicos probaron a la computadora con dos juegos diferentes usando 651 llamadas de "coo" (un sonido suave que usan los monos para decir "estoy aquí, no te preocupes") de 6 hembras adultas en la isla de Yakushima.

1. El Juego de "¿Quién soy yo?" (Identificación Individual)

  • El reto: La computadora tenía que adivinar de cuál de las 6 hembras provenía la voz.
  • El resultado: ¡Lo hizo genial! Acertó el 81-82% de las veces.
  • La analogía: Es como si le mostraran 6 fotos de amigos a un niño y le dijeran: "Escucha este audio, ¿quién es?". El niño acertaría en 8 de cada 10 intentos.
  • El detalle curioso: A algunas macacas (como "Kapa") les costó más distinguirlas porque sus voces son muy parecidas a las de sus amigas, o quizás porque a veces imitan a las otras. Pero en general, la IA pudo separarlas muy bien.

2. El Juego de "¿Joven o Vieja?" (Clasificación por Edad)

  • El reto: Separar a las macacas jóvenes (menos de 10 años) de las ancianas (más de 20 años).
  • El resultado: ¡Fue aún mejor! Acertó el 91-93% de las veces.
  • La analogía: Imagina que las voces de los jóvenes son como instrumentos de madera nuevos: suenan limpios y brillantes. Las voces de las ancianas son como instrumentos viejos que han sido tocados mucho tiempo: tienen un poco de "áspero" o "rasposo" (como un papel de lija suave).
  • El secreto: La computadora no midió la "edad" directamente. Simplemente vio en la "foto de sonido" ese rasgo áspero que aparece cuando los monos envejecen y lo usó para separar a los jóvenes de los mayores. ¡Fue tan bueno que casi nunca se equivocó!

💡 ¿Por qué es esto importante?

Antes, para estudiar a los monos, los científicos tenían que ir a la selva, grabar, medir notas musicales una por una y pasar horas en el laboratorio. Era como intentar contar las estrellas con una lupa.

Con este nuevo método:

  1. Es más fácil: La computadora hace todo el trabajo pesado de "medir".
  2. Funciona con poco: Normalmente, la Inteligencia Artificial necesita millones de datos para aprender. Pero aquí, con solo unas pocas cientos de llamadas, la computadora aprendió muy bien. ¡Es como si un estudiante aprendiera a tocar el piano en una semana en lugar de años!
  3. Es para la vida real: Funciona con grabaciones reales de la selva, con viento y ruido de fondo, no solo en un laboratorio silencioso.

🌟 En resumen

Este estudio nos dice que la inteligencia artificial puede escuchar a los animales salvajes y reconocerlos como si fuera un amigo muy cercano, sin necesidad de ser un experto en física del sonido.

Es como darles a los científicos unas gafas mágicas que les permiten ver la identidad y la edad de los monos solo mirando sus voces. Esto abrirá la puerta para estudiar a muchos más animales en la naturaleza, ayudándonos a protegerlos mejor sin molestarlos. ¡Es una victoria para la ciencia y para los monos! 🐒🎉

Recibe artículos como este en tu bandeja de entrada

Resúmenes diarios o semanales personalizados según tus intereses. Gists o resúmenes técnicos, en tu idioma.

Probar Digest →