Siempre hemos tenido la inquietud por analizar el comportamiento humano, de ahí emerge la “ciencia social computacional”. Ya no sólo nos quedamos con las ciencias sociales tradicionales, ahora saltan a la parte digital. La pandemia nos ha encerrado en el mundo digital, desde las redes sociales es más fácil analizar el comportamiento humano, señaló Carlos Piña, con estudios de posdoctorado en el Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas de la UNAM.
Esto no quiere decir que toda la vida de los usuarios esté reflejada ahí, pero la mayoría de las personas utilizan alguna de las redes sociales para compartir su rutina, información importante y hasta información falsa, de ahí el interés por las redes sociales que nos permiten conocer el comportamiento humano.
Debemos tener cuidado con la información que circula en las redes sociales. Siempre hay que buscar y verificar la fuente para no quedarnos sólo con el encabezado. Muchos de ellos están diseñados para atraer (“enganche”), para darle clic a sus contenidos y leer sus páginas.
Sí es importante la medición porque eso nos va a dar un panorama real de lo que sucede. No es lo mismo que una persona ponga un tuit y consideremos que tiene la verdad absoluta. Hay jerarquías y ponderaciones en las redes sociales, de ahí la importancia de medir. Cuando medimos realmente, comparativamente, podemos saber si tiene un impacto significativo, consideró.
Indicó que los dueños de los sitios buscan monetizar la noticia aunque no sea sólida. Hay que tener mucho cuidado con ese tipo de “charlatanería digital”.
¿Cuál es la importancia de la ciencia de datos?
La ciencia de datos ha adquirido una relevancia importante a partir del impacto que han tenido las redes sociales. A partir del 2012 o 2013 surgen movimientos en redes sociales, pero la ciencia de datos como tal se forma a partir de 2015, comentó.
A partir de ese año, en Europa, principalmente en Reino Unido, se crean laboratorios científicos de big data, o ciencia de datos, que están enfocados al análisis estadístico de esta cantidad de información.
Posteriormente, en 2016 y 2017, llega a México esta temática. La UNAM abrió una licenciatura en ciencia de datos, tendencia que alcanzó a otras universidades, tanto privadas como públicas, las cuales abrieron y adaptaron sus planes de estudio. Algunas sólo tenían estadística, ahora son estadística aplicada encaminada a la ciencia de datos.
A la par se están abriendo posgrados y laboratorios a nivel nacional que ya hablan de ciencia de datos, sin embargo, aún hay un déficit de “científicos de datos” a nivel nacional, y hasta internacional, considera el doctor Piña García.
Algoritmos en redes sociales
Cada red social utiliza un algoritmo. Las redes sociales como Facebook, Tik-Tok, Instagram, entre otros, no van a decir cómo funcionan sus algoritmos porque son “cajas negras” y porque son el negocio de estas plataformas. Por ejemplo, Google no ha revelado el algoritmo que utiliza para acelerar las búsquedas cuando navegamos en internet.
Lo que sí podemos tener son pistas de cómo funcionan, por ejemplo, cuando se genera un hashtag y hay muchas cuentas conversando alrededor de este tema, la tendencia va a subir, pero si alrededor de esta etiqueta sólo hay retuits (réplicas) sin conversación, la tendencia puede subir o bajar porque está amplificada artificialmente.
¿Cuál ha sido la conversación más difícil?
Los temas políticos resultan los más difíciles, no en el sentido técnico sino en el imaginario de las personas, quienes podrían considerar que los datos pueden ser manipulados. La dificultad va desde el punto de vista sociopolítico, más que la dificultad técnica. El tema es complejo.
¿Qué dificultades hay al trabajar en la ciencia de datos?
La mayor dificultad es la poca transparencia que tienen las plataformas digitales, sobre todo donde Facebook es el dueño, como Instagram, Whatsapp y el mismo Facebook, que son redes muy cerradas que no permiten explorar o recolectar información.
Una de las formas más abiertas y amigables para los investigadores es Twitter, el cual es un poco más abierto.
¿Qué aconsejarías a quienes desean estudiar o dedicarse a la ciencia de datos?
La lectura siempre será recomendable para todas las áreas de investigación. Lectura y práctica. La lectura de artículos científicos o de revistas bien posicionadas van a brindar ideas, y después ir a la práctica para mejorar las técnicas de programación, los lenguajes mejorarán nuestro desempeño.