Vivir sin privacidad ni anonimato
28 February 2016

Mis lecturas de estas últimas semanas son casi todas sobre privacidad y anonimato en Internet. Hay varias dimensiones del tema que me interesan y sobre las que espero escribir en las próximas semanas en Politikon. Por ejemplo, tengo una entrada a medio preparar sobre la presentación de uno mismo en redes sociales y los incentivos para comunicar estratégicamente información individual, especialmente en el contexto del online dating. Por supuesto, el aspecto de más actualidad y seguramente el que tenga mayor relevancia práctica es el del equilibrio entre seguridad y privacidad y sobre qué alternativas son técnicamente factibles y socialmente deseables en ese contínuo. Sobre esto, Miguel Gil Biraud nos escribía esta semana una excelente pieza de contexto que aclara muy bien los diferentes elementos tecnológicos y de política pública que están involucrados en el debate.

Sin embargo, el aspecto que más me preocupa tiene que ver con el digital footprint y la posibilidad de recuperar información personal a través de la actividad online mediante la combinación de diferentes fuentes de datos. En concreto, me interesa la cuestión de la desanonimización y sobre cómo es posible identificarnos individualmente a través de nuestro comportamiento online.

Hay muchas anécdotas sobre la capacidad de las empresas de predecir nuestro comportamiento mirando a nuestros patrones de uso. Quizás el caso de la adolescente a la que Target le enviaba ofertas sobre productos prenatal provocando las protestas de sus padres hasta que descubrieron que estaba embarazada sea la más conocida. Hay muchos más ejemplos cómo ese, aunque quizás menos llamativos. Pero todas estas historias nos hablan de cómo capturar el comportamiento de un grupo que comparte determinadas características independientemente de quién lo lleve a cabo. El proceso que el algoritmo intenta replicar es un razonamiento simple: si una cliente es mujer, en edad fértil y tiene un determinado historial de compra, es probable que esté embarazada. Sin embargo, el algoritmo puede funcionar de forma aislada sin ver nunca información personalmente identificable como su nombre o su número de teléfono. La habilidad del algoritmo para hacer predicción puede ser llamativa, pero no es preocupante.

La situación realmente inquietante tiene que ver cuando el objetivo del analista es recuperar esa información personal e identificar a un sujeto en concreto. Bruce Schneier pone el siguiente ejemplo en su libro Data and Goliath:

In 2008, Netflix published 10 million movie rankings by 500,000 anonymized customers, as part of a challenge for people to come up with better recomendation systems than the one the company was using at that time. Researchers were able to de-anonymize people by comparing rankings and timestamps with public rankings and timestamps in the Internet Movie Database.

Es solo un ejemplo, y quizás uno bastante inofensivo, pero apunta en una dirección en la que el problema que se nos plantea a cada uno de los consumidores es imposible de resolver. Cada uno de nosotros tenemos incentivos a compartir nuestra información con diferentes productos en Internet para mejorar su servicio: nuestras lecturas en Pocket, nuestros viajes en Uber, nuestras compras en Amazon, nuestro historial de búsquedas en Google, … Incluso podemos tomar decisiones estratégicas de limitar la información que revelamos usando cuentas asociadas a correos diferentes, añadiendo ruido a nuestro comportamiento u optando por no usar algunas funcionalidades. Sin embargo, es imposible para cada usuario determinar en qué medida diferentes combinaciones de distintas fuentes serán suficientes para revelar datos sobre nosotros mismos incluso aunque activamente estemos intentando protegerlos.

No tengo muy claras cuales son las alternativas viables ni qué herramientas puede usar el gobierno para regular el mercado secundario de datos entre empresas tecnológicas –en buena medida porque el gobierno es un agente estratégico en esta decisión. Tengo curiosidad por ver cómo evoluciona la agenda política y la opinión pública sobre este tema en los próximos años.