Explora unam global tv
Explora unam global tv
explorar
Explora por categoría
regresar

Monitoreo automatizado de aves, más efectivo ver su canto que escucharlo

La mejor estrategia para monitorear las aves en su hábitat es registrar los sonidos del lugar —de forma automatizada, sin presencia humana para no espantar a los animales— y luego escudriñar la grabación con un algoritmo que ayude a determinar las especies presentes. Para lograr mejores resultados, en vez de escuchar, la tendencia es traducir esos sonidos a imágenes, señaló el doctor Iván Meza Ruiz, del Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas (IIMAS), con sede en Ciudad Universitaria.

De visita en las instalaciones del IIMAS en Mérida, en la Unidad Académica de Ciencia y Tecnología de la UNAM dentro del Parque Científico y Tecnológico, el experto en inteligencia artificial compartió cómo se involucró con la bioacústica y la ornitología a finales de 2012 cuando un alumno de la FES Zaragoza, Esaú Villarreal Olvera, tocó a su cubículo en busca de asesoría para construir un robot capaz de identificar al llamado mirlo primavera con tan sólo oír su canto.

“Ése era su proyecto de tesis de licenciatura y la especie a detectar era el Turdus migratorius, muy común en la Ciudad de México al cual en inglés se le conoce como American robin y sí, es el pájaro que da nombre al joven compañero de Batman”, explicó.

Entonces el proceso lo realizaban con un extractor de huellas acústicas, un silabificador y un clasificador, con lo que el aparato, tras escuchar los gorjeos, señalaba si se trataba de ese mirlo en específico. Sobre la importancia de estos esfuerzos, el académico señaló que resulta una herramienta útil para diagnosticar la biodiversidad en ciertas zonas.

“La idea era sacar las métricas de los diferentes cantos de Turdus y, a partir de ellas, realizar caracterizaciones e introducirlas a una máquina de aprendizaje automático a fin de determinar si se trataba de esa especie, aunque ello nos dejaba con la duda de si había algunas que habíamos dejado fuera y que, de añadirlas, hubieran perfeccionado nuestro algoritmo”, acotó Villarreal Olvera.

Evolución acelerada

No obstante, en estos cinco años la tecnología ha evolucionado y ahora empleamos redes neuronales convolucionales o de aprendizaje profundo (modelo basado en el funcionamiento de las neuronas de la corteza visual primaria), las cuales han dado buenos resultados al trabajar con imágenes, refirió Meza Ruiz.

Como el canto de las aves genera vectores específicos y anchos de banda representables de forma gráfica, es posible extraer imágenes y presentárselas a los nuevos algoritmos, los cuales consiguen sus propias métricas y se autoentrenan, de manera constante, hasta estabilizarse y alcanzar su mejor desempeño.

Para probar la efectividad de estos sistemas, cada año se realiza el certamen Bird Task Identification LifeCLEF, cuyo objetivo es identificar el mayor número de cantos a partir de grabaciones de 999 especies de pájaros sudamericanos, justa donde han participado Meza Ruiz y Villarreal Olvera al lado de Adrián Espino y Frine Solano.

“La propuesta triunfadora de la edición pasada tuvo una precisión del 54 por ciento y se espera una efectividad cada vez mayor. La idea de estos modelos es que aprendan a ver los espectrogramas y que, al detectar ciertos procesos, generen una descripción”, indicó Meza.

Por su parte y después de trabajar con múltiples grabaciones para su tesis, Esaú Villarreal describió como magia el ver cómo, a partir de una imagen con el fragmento de un canto, la máquina comienza a trabajar sola, a autoentrenarse y aprender para ofrecer una diagnosis y discriminar si se trata de tal o cual especie.

Se precisan más grabaciones

Para optimizar este sistema y que aprenda cada vez más, es necesario contar con mayor número de grabaciones. “En lo particular, a lo que me gustaría llegar es a recopilar suficiente información sobre el comportamiento de las aves para decodificar automáticamente su lenguaje y saber cuál variedad está cantando”, apuntó Meza Ruiz.

Además de ayudar en la detección de diversos tipos de esto ayudaría a conseguir algo que aún no se explora formalmente, pero que representaría un avance importante: establecer cuántos individuos de una especie hay en un mismo lugar.

“De lograrlo podríamos incluso determinar si un pájaro insultó a un rival por disputarse el terreno o a la misma novia”, bromeó el académico.

A la fecha, este sistema trabaja con matemática de optimización y para que funcione con mayor rapidez empleamos computadores GPU, muy usados para videojuegos, pero que por su gran poder de procesamiento hacen que el proceso de aprendizaje se acelere.

¿Por qué hacer esto? Si automatizamos esto le quitaríamos una gran carga al experto, que hasta ahora debe desplazarse grandes distancias, aplicar ciertas técnicas y abocarse a un grupo ornitológico, lo cual lo lleva a no poner atención en otros espectros de aves. Hacer que todo se realice de forma automática nos permitirá monitorear áreas más extensas de manera independiente, concluyó.