Twitter, así como muchas otras páginas, ofrece acceso a sus datos a través de su API. Si miramos la documentación, veremos cómo acceder a los endpoints directamente después de registrarnos. Sin embargo, Twitter es ilustrativo de API alrededor de las cuales los desarrolladores ofrecen paquetes que gestionan inteligentemente las conexiones y los datos, pensando en los usos más frecuentes. Dicho de otro modo, aunque sea posible acceder a la Twitter de API a través de estructuras como las que hemos visto antes, es más práctico usar paquetes como, por ejemplo twitteR.

library(twitteR)

Antes de nada, tenemos que completar el registro de una nueva aplicación. Para eso, nos dirigimos a la página de desarrolladores asociada a nuestra cuenta y obtenemos las credenciales. Como siempre, guardaremos las credenciales en un archivo separado de nuestro código

creds <- readLines("./credentials-twitter.txt")
consumer_key <- creds[1]
consumer_secret <- creds[2]
access_token <- creds[3]
access_secret <- creds[4]

Ahora podemos conectar nuestra sesión a nuestra cuenta de Twitter:

setup_twitter_oauth(consumer_key,
                    consumer_secret,
                    access_token,
                    access_secret)

Con eso, podemos acceder a varios tipos de funciones. Por ejemplo, podemos acceder a un endpoint de la Search API que recupera tweets que contienen los términos que pasamos en el argumento.

tweets <- searchTwitter("Lacalle Pou", n=20)
tweets[[1]]

Aquí es donde vemos el valor de usar un paquete como twitteR. Si por ejemplo pedimos más información sobre el objeto, vemos que en realidad contiene más que simplemente el tweet que hemos recuperado. Al inspeccionar el objeto vemos que en realidad contiene los datos relativos al tweet, como cuándo fue escrito, por quién, a qué hora, …

str(tweets[[1]])

No solo eso, también nos ofrece un grupo de funciones para interactuar con esa información sin tener que buscar a través de la lista de datos. Por ejemplo, nos permite acceder al número de gente que ha hecho favorite a este tweet, la identidad de los usuarios que lo han retuiteado, o a través de qué plataforma se ha emitido el tweet. Es importante tener en cuenta la peculiar forma de acceder a esta información, como método aplicado a cada objeto de la lista:

tweets[[1]]$getFavoriteCount()
tweets[[1]]$statusSource

También tenemos funciones especializadas en capturar información acerca de usuarios:

myself <- getUser("griverorz")
myself
str(myself)

que nos ofrecen también la posibilidad de acceder a información adicional sobre ese tipo de objeto

myself$getDescription()

Lo más interesante es ver cómo es posible “encadenar” este tipo de funciones. Por ejemplo, podemos recuperar quiénes son mis seguidores en Twitter

followers <- myself$getFollowerIDs()
head(followers)

y ver que el nuevo objeto followers nos permite acceder a información de cada uno de ellos como usuario

getUser(followers[123])

lo cual nos da la posibilidad de reconstruir la red de mis seguidores y sus seguidores. En la próxima sesión veremos las herramientas necesarias para llevar a cabo este tipo de análisis.

Finalmente, twitteR también nos da acceso a los timelines a través de userTimeline con la posibilidad de controlar cuántos tweets recuperar, si incluir retweets, o replies.

mytm <- userTimeline("griverorz")
length(mytm)
mytm[[1]]

Y también nos permite interactuar con la lista de trending topics, para lo cual tenemos que seleccionar la geografía en la que estamos interesados

head(availableTrendLocations())
head(getTrends(468739)) ## Buenos Aires