Dime qué posteas y te diré quién eres

p-07aCon el paso de los años internet se ha consolidado como un medio interactivo y masivo de comunicación, permitiendo el intercambio de información entre personas de distinta área geográfica, edad, estatus social, etcétera. Recientemente, este medio de comunicación ha ganado una impactante popularidad gracias a algunos servicios que invitan a compartir fácilmente información como son: redes sociales, mensajería, chats, blogs, entre otros. Ejemplo de ello es Facebook que en marzo de 2016 reportó tener aproximadamente 1090 millones de usuarios activos al día, y también lo es Twitter que en esa misma fecha reportó tener 320 millones de usuarios activos al mes.

Los medios sociales como facebook y Twitter han propiciado nuevos modelos de comunicación y han cambiado —seguramente para siempre— la forma en que las personas nos relacionamos. Pero su impacto no queda ahí, este tipo de medios también han abierto un sinfín de posibilidades en áreas como el comercio electrónico y seguridad informática. Por ejemplo, en el caso que se lograra inferir distintos rasgos de los usuarios de estas redes entonces se podría usar esta información para hacer recomendaciones de productos y contenidos de manera mucho más precisa, además, el reconocimiento de estos atributos también permitiría desenmascarar a usuarios que, aprovechando el anonimato, se valen de este tipo de medios para realizar actos ilícitos o engañosos, como por ejemplo acoso sexual y extorsiones.

Dado el tamaño de las redes sociales, realizar manualmente un análisis de sus usuarios es impensable, surge así la idea de realizar este análisis de forma automática, utilizando tecnologías computacionales. En particular, la determinación automática del perfil de los usuarios, conocida en inglés como author profiling, es una tarea que consiste en extraer conocimiento sobre éstos a partir del contenido que comparten. Trabajos recientes se enfocan en identificar rasgos de los usuarios, como por ejemplo su edad, género, nivel de educación, nacionalidad, lenguaje materno, e incluso personalidad.

En el Laboratorio de Tecnologías del Lenguaje del INAOE venimos trabajando en el tema de author profiling desde hace algunos años. El objetivo es determinar el género o el rango de edad de un autor con sólo los mensajes que ha compartido a través de, por ejemplo, su cuenta de Twitter. La idea es observar los temas que ha compartido, así como las palabras que ha usado para escribir sus mensajes. De esta manera,  únicamente con los mensajes que un autor comparte, hemos logrado identificar sus rasgos. Ahora bien, nuestras investigaciones más recientes consisten en aprovechar toda la información que se comparte a través de los mensajes, en especial, al incluir las imágenes. Los teléfonos y tabletas actuales han simplificado la forma en que se pueden compartir imágenes, ya sea de fotos que acabamos de tomar o de fotos de eventos o sucesos de interés que otros miembros de nuestra red nos comparten. En nuestros experimentos preliminares, hemos comprobado que este enfoque multimodal —al combinar información textual y visual—tiene mejores resultados que usar una sola modalidad. Lo que resulta de gran interés es que no sólo los mensajes que escribimos, sino las imágenes que compartimos, dicen cosas de nosotros que permiten inferir rasgos como nuestro género y rango de edad.

Figura 2

Figura 2

p-07b

 

 

 

Como puede observarse, al menos para este caso, los hombres están más interesados en temas relacionados a la tecnología y a los deportes; mientras que las mujeres en temas asociados a las redes sociales y a los alimentos. Entre las imágenes que se compartieron, también se observan temas de interés dependiendo del género. En el caso de las mujeres, se comparten imágenes con flores y mascotas, y entre las imágenes que más comparten los hombres, están fotos de automóviles, tal como las imágenes que se muestran en la figura 2.

Pero nuestras investigaciones no se detienen ahí. Continuamos buscando nuevos modelos que nos permitan obtener mayores detalles del perfil de un autor. Aspectos sobre su profesión, sus preferencias políticas, su nivel de satisfacción de vida o incluso aspectos sobre su personalidad, por ejemplo, qué tan extrovertido, responsable o qué tan neurótico o inestable emocionalmente es.

Así que no te sorprendas cada vez que te llega publicidad específica, ya sea a tu edad o tu género, pues cada vez que compartes un mensaje en las redes sociales, no sólo compartes una opinión o un comentario; también compartes tus intereses con los cuales es posible inferir tu perfil.

 

villasen@inaoep.mx, mmontesg@inaoep.mx, hugojair@inaoep.mx, miguelangel.alvarezcarmona@gmail.com