Aula 2
Métodos para la explotación de grandes datos
Modera: José Luis de Piero
Descripción:
Los sistemas de recomendación de las plataformas de contenidos (como Spotify, Netflix o YouTube) les brindan a los usuarios sugerencias acerca de qué contenidos consumir a partir de la consideración de múltiples variables, que incluyen, al menos, la historia de los consumos de ese mismo usuario (lo que comprende la consideración de las propiedades o categorías de las obras que ese usuario ya ha consumido), sus acciones concretas que dan cuenta de sus preferencias ("Me gusta", calificaciones, suscripciones, etc.) y lo que han consumido otros usuarios de un perfil similar al suyo, entre muchas otras cuestiones. Estas recomendaciones son realizadas en buena medida por algoritmos de machine learning, y dan como resultado una suerte de curaduría automatizada, al menos parcialmente, de los contenidos de esas plataformas.
Este trabajo busca caracterizar algunas de las lógicas que guían la actividad de esos algoritmos desde una perspectiva semiótica, en la línea inaugurada por Charles Sanders Peirce. Se atiende así a aspectos tales como los tipos de razonamiento observables (abductivo, inductivo, deductivo), los presupuestos e hipótesis que pueden identificarse en estos sistemas y los procedimientos informáticos que siguen una lógica de "investigación experimental" (Peirce). Hacia el cierre del trabajo se discute cuáles son, en un sistema que parece tender siempre a proponer consumos similares a los ya realizados, los lugares para la novedad.
Descripción:
La obesidad es una enfermedad crónica, heterogénea y multifactorial que suele estar acompañada por un incremento del peso corporal y actúa como factor de riesgo para el desarrollo de las enfermedades no transmisibles. Su prevalencia ha aumentado tanto a nivel mundial como local en los últimos años como resultado de la influencia de distintos factores, incluidos los socioambientales y el ineficaz abordaje desde las políticas sanitarias que se han implementado.
Dadas estas características, resulta relevante estudiar los determinantes y representaciones sociales (RS) de la obesidad, con el propósito de profundizar el conocimiento sobre esta problemática y mejorar la efectividad del sistema de salud. En esta línea de pensamiento, recientemente surgieron herramientas innovadoras que permiten abordar los procesos de salud-enfermedad desde otros enfoques. La teoría de las RS nos indica que el lenguaje es una dimensión básica de la vida en sociedad, por lo que puede constituirse como un elemento de gran importancia para pensar en la cuestión del cruce de las humanidades digitales y la salud, poniendo el foco sobre el problema de la obesidad. Según Moscovici (1988), las RS son redes de conceptos e imágenes que interactúan entre sí y modifican su contenido, en función de la complejidad y la velocidad que posean los procesos de interacción social. Estudiar el modo en que las redes sociales y otros medios de comunicación activan nuevos procesos de interacción social y habilitan la construcción de representaciones sociales, es uno de los tantos problemas que se derivan del encuentro entre las humanidades y lo digital. Así, el objetivo de este trabajo es proponer y describir una metodología para el análisis de los discursos que los/as usuarios/as de Twitter Argentina construyen en torno a la obesidad, mediante la aplicación de Procesamiento del Lenguaje Natural (PLN)
En este sentido, siguiendo los pasos de algunos especialistas en el campo de las RS, se implementó una metodología de carácter cuantitativo para la recolección de los datos. En primer lugar, se recolectaron tweets desde agosto 2021 a abril 2022, utilizando como filtro palabras clave relacionadas a la problemática, seleccionadas mediante un proceso sistemático a partir de las palabras semilla “obesidad”, “obeso” y “obesa”. En un segundo momento, se procesó el cuerpo de los mensajes, obteniendo una muestra de 1021361 tweets. En un tercer momento, generamos 3 submuestras tomando como eje cada palabra semilla del proceso de recolección. En cada una de ellas se aplicó PLN (con la librería Spacy) para recuperar los adjetivos, sustantivos y palabras más usadas. De esta forma se identifican los términos más frecuentes relacionados a los discursos de la obesidad y sus distintas flexiones. Posteriormente, se realizó un muestreo aleatorio de los tweets que contenían los términos más frecuentes a fin de reconocer sus contextos. Es así que se pueden identificar ejes temáticos potencialmente discutidos y que podrán ser utilizados como el núcleo inicial para un posterior análisis de modelado de tópicos. Su reconocimiento e incorporación en la planificación de las políticas sanitarias para el abordaje de esta problemática nutricional permitiría optimizar su implementación.
Descripción:
A partir de un análisis computacional Cheng, Dale & Liu (2007) lograron establecer algunas características de YouTube como Red Social pese a la resistencia de algunos sectores que la consideraban sólo una plataforma para subir contenido. A partir del análisis de comportamientos de usuarios del sitio presentan una argumentada caracterización de YouTube como Red (Cheng, Dale, & Liu, 2007). Sin embargo, este análisis proviene de una perspectiva exclusivamente computacional y evalúa el componente de “red” más que el componente social.
Las Redes Sociales digitales ofrecen otros mecanismos para poder evaluar el comportamiento de los usuarios a partir de los distintos tipos de “interacciones” que realizan entre ellos. En el caso particular de YouTube se pueden vincular a los usuarios a partir de los seguidores, de los enlaces a otros sitios o canales, de los comentarios y las respuestas, de los “me gusta” y “no me gusta”.
Tomando como ejemplo un modelo de análisis de una red de usuarios de Twitter que busca las relaciones que mejor definen el carácter de “red social” de esta plataforma (Grandjean, 2016), nos inspiramos para un análisis diferente de la Red de YouTube: considerar el peso de los YouTubers más influyentes en Argentina en el período 2012-2016, conocido como la segunda generación de YouTubers argentinos, a partir de una construcción y visualización de las redes de influencia y de contactos entre ellos. Para ello a partir de un corpus de canales de usuarios se evaluaron las apariciones, invitaciones y colaboraciones de unos youtubers en los canales de otros, se construyó una base de datos de estas relaciones y se trabajó con la herramienta Gephi para elaborar una representación visual de estas redes.
Entre los resultados preliminares de este estudio se observan algunas cuestiones importantes: la red de youtubers es bastante cerrada con segmentos inconexos entre sí y con una gran predominancia masculina. Consideramos, no obstante, que la aparentemente escasa colaboración inicial entre sus usuarios ha ido creciendo en el tiempo ya que en el presente puede verse a la colaboración como un mecanismo muy empleado para construir comunidades de seguidores más grandes. Esta señal es una marca de cómo ha mutado también el género videoblog en Argentina, separándose de tendencias en otras latitudes para dejar de ser un “diario personal en video” para convertirse en espacios de colaboración para la creación de contenidos y una fuente de trabajo para varios de los usuarios.