Los 98 rasgos que utiliza Facebook para servir publicidad

He dejado claro en mas de una ocasión que el negocio de Facebook es la publicidad: ofrecer una audiencia receptiva a los anunciantes. Para ello, utiliza los datos que los usuarios les proveen, a base de minar la información. Pero, ¿os habéis planteado alguna vez cómo clasifica a sus usuarios? Los primeros valores de la lista son normales y no tienen por qué plantearnos especial problema, pero conforme vamos progresando, se va volviendo más y más curioso. Los voy a ir agrupando temáticamente.

Los 98 rasgos que utiliza Facebook para servir publicidad

1. Lugar donde está
2. Edad
3. Generación
4. Género
5. Idioma
6. Nivel de educación
7. Campo de estudio
8. Escuela
9. Afinidad étnica

10. Salario y valor de su red de contactos
11. Si posee una casa, y de qué tipo
12. Valor de su casa
13. Tamaño de su casa
14. Metros cuadrados de su casa
15. Año en que se construyó su casa
16. Composición de su casa

17. Usuarios cuyo aniversario es en 30 días
18. Usuarios que se han desplazado de su ciudad natal, o están lejos de su familia
19. Usuarios que son amigos de alguien que próximamente cumplirá años, será su aniversario, se acaba de casar o comprometer,  o se acaba de mudar.
20. Usuarios con relaciones a larga distancia
21. Usuarios con una nueva relación
22. Usuarios que tienen un nuevo trabajo
23. Usuarios que acaban de comprometerse
24. Usuarios que acaban de casarse
25. Usuarios que acaban de mudarse
26. Usuarios cuyo cumpleaños será próximamente
27. Padres
28. Va a ser padre pronto
29. Madres, divididas por tipo (modernas, deportistas)
30. Usuarios que podrían meterse en política
31. Conservadores y liberales
32. Estatus de su relación

33. Empresario que busca contratar
34. Negocio
35. Título de trabajo
36. Tipo de oficina

37. Intereses

38. Posee una moto
39. Planean comprar un coche (de qué tipo, cuando…)
40. Han comprado piezas o accesorios de coche recientemente
41. Si probablemente necesitarán nuevas piezas de coche pronto
42. Estilo y marca del coche que condice
43. Año en que se compró el coche
44. Años que tiene el coche
45. Cuánto dinero podría invertir el usuario en su próximo coche
46. Dónde comprará probablemente su próximo coche

47. Cuántos empleados tiene su compañía
48. Pseen un pequeño negocio
49. Es gerente o ejecutivo

50. Usuarios que donan a obras de caridad (separados por tipo)
51. Sistema operativo
52. Usuarios que juegan
53. Usuarios que tienen una videoconsola
54. Usuarios que han creado un evento en Facebook
55. Usuarios que han usado pagos con Facebook
56. Usuarios que han gastado mas de la media en pagos con Facebook

57. Usuarios que administran una página de Facebook
58. Usuarios que han subido fotos recientemente a Facebook
59. Navegador web
60. Servicio de correo
61. Adoptan la nueva tecnología pronto o tarde
62. Expatriados
63. Usuarios que pertenecen a un banco o al sector de préstamos
64. Usuarios que son inversores
65. Cantidad de cuentas bancarios

66. Usuarios que usan tarjeta de crédito de forma activa
67. Tipo de tarjeta de crédito
68. Usuarios que tienen una tarjeta de débito
69. Usuarios que llevan un balance de su tarjeta de crédito
70. Usuarios que escuchan la radio
71. Preferencias en programas de televisión
72. Usuarios que emplean un dispositivo móvil
73. Tipo de conexión a Internet
74. Usuarios que han comprado un teléfono o tablet recientemente
75. Usuarios que se conectan a Internet mediante el teléfono o el tablet

76. Si usan cupones de compra
77. Tipo de material de casa que compra
78. Época del año en que compra mas material para la casa
79. Consumo de alcohol
80. Según tipo de comestibles que compran
81. Si compran productos cosméticos
82. Si usa medicamentos para la alergia, resfriado, dolor o contramedicación

83. Invierte dinero en material para la casa
84. Tiene mascota, invierte dinero en ella
85. Usuarios que gastan mas de la media en compras para su casa
86. Compra online
87. Tipo de restaurante en el que come
88. Tipo de tiendas que frecuenta
89. Receptivo a ofertas de compañías de seguros, hipotecas,  gastos de educación, tarjetas de prepago
90. Periodo de tiempo que ha vivido en una casa
91. Si se mudará pronto
92. Si le interesan los deportes
93. Si viaja frecuentemente (negocios o placer)
94. Usuarios que usan el transporte público
95. Tipo de vacaciones de las que suele disfrutar
96. Si ha vuelto recientemente de un viaje
97. Si han usado una aplicación de viajes recientemente
98. Si ha usado Facebook Timeshare

 ¿Cómo recopila todo esto?

  • Por los datos que les das directamente a ellos: lo que escribes, tus contactos, las fotos que subes (se puede localizar el dónde y cuándo son, tus hábitos de comida, si tienes mascota, tu coche).
  • Mientras navegas por la red logeado (estando conectado con tus credenciales a una plataforma), usa las cookies y lee por donde navegas.
  • Si tienes la geolocalización puesta y te conectas desde diferentes lugares, se puede cruzar el dato con mapas, y por ejemplo, saber por ejemplo dónde trabajas si no se lo has dicho tu mismo al poder monitorizar tu rutina.
  • Los datos bancarios los puede cruzar juntando los perfiles con el número de teléfono (por eso compró Whatsapp por una inmensa cantidad de dinero: el identificador de cuenta original es el número de teléfono, que lo pueden juntar con un perfil de un banco de cuando éstos, si así lo has aceptado, usan tus datos para ofertas con terceras partes).
  • Algunas apps (aplicaciones móviles) leen los contactos, los SMS, o incluso escuchan las conversaciones telefónicas. Y recomiendo una especiala atención para las versiones Lite de las redes sociales, que no son nada claras especificando por dónde se meten. Leed a dónde estáis dando permiso, o capadle el acceso mediante los ajustes de aplicación del sistema operativo.

Esto que esté incitando a dejar Facebook u otro servicio (si os da miedo lo que tiene Facebook, echad una ojeada a Google), pues probablemente os aporte algo o no estaríais allí. Simplemente os invito a tener una cierta prudencia, porque el producto de estas empresas sois vosotros y vuestra privacidad. Es triste ver cómo el mundo se está segmentando en 2 grupos: los que pueden pagar, y los que pagan con su privacidad. La privacidad no debería ser un privilegio, de ahí que os invite a un cierto boicot del sistema mediante acciones sencillas que no implican el que dejéis de usar el servicio:

  • evitad estar logados salvo en lo necesario mientras navegais
  • si no es así, usad contenedores o un bloqueador de rastreo
  • revisad los permisos de las aplicaciones y bloquead todo lo innecesario en los ajustes (acceso a red, interconexión con otros servicios que no necesitéis en ese momento)
Anuncios

Rastreando a los rastreadores: Lightbeam

En la línea del tema de privacidad que hablé la semana pasada basado en Facebook, hoy os hablaré de cómo visualizar fácilmente cuando navegamos por la web. Existe una extensión de Firefox llamada Lightbeam, basada en Collusion, que nos muestra cuando entramos en una página, que otros servicios también están allí. No todo lo que vemos allí tiene por qué ser malo, pero  es bueno que tengamos conocimiento de qué está sucediendo con nuestros datos, lo que la convierte en una herramienta de divulgación muy interesante.

Pero así como el internet ha abierto el mundo a todos nosotros, también nos muestra a todos nosotros al mundo. Y cada vez más, el precio que debemos pagar por el hecho de estar conectados es nuestra privacidad. Hoy en día, a muchos de nosotros nos gustaría creer que el internet es un lugar privado; no lo es. Y con cada clic y cada toque de la pantalla, estamos como Hansel y Gretel dejando migas de pan de nuestra información personal por todos los sitios que visitamos en los bosques digitales. Dejamos nuestros cumpleaños, direcciones, nuestros intereses y preferencias, nuestras relaciones, nuestras historias financieras, y así sucesivamente.

Permítanme hablarles un poco más de esta industria al acecho. La imagen que se está formando detrás de mí se llama Collusion y es un complemento experimental para navegador que se puede instalar en Firefox y que ayuda a ver a dónde van nuestros datos en la red y quién nos está siguiendo. Los puntos rojos que ven allí arriba son sitios de seguimiento del comportamiento que no he navegado, pero que me están siguiendo. Los puntos azules son los sitios que sí he navegado directamente. Y los puntos grises son los sitios que también me están siguiendo, pero no tengo ni idea de quiénes son. Todos ellos están conectados, como se puede ver, para formar una imagen de mí en la red. Y este es mi perfil.

Reflexiones sobre la web en el 2018 y el GDPR

La llegada de la instauración del GDPR (General Data Protection Regulation), o la nueva ley de protección de datos que entra en vigor esta semana, me ha hecho mirar las cosas en retrospetiva. Para quien no esté informado de lo que es esa nueva ley de cara al día a día del usuario medio, a partir del día 25  los europeos debemos dar nuestro consentimiento explítico e inequívoco para que un servicio online utilice nuestros datos. El cómo cambiará las cosas aún es una gran duda para mí, ¿será como pasó con las cookies, que se ha convertido en un banner molesto y no ha cambiado absolutamente nada, o era algo más? Al menos hay una cosa que nos asegura, y es que los términos de servicio (eso que todos dicen haber leído) a partir de ahora tienen que venir en una versión adicional legible que todos, y no únicamente los abogados (o algunos de ellos), podamos entender. Además hay una larga cantidad de medidas extra a implantar en el caso de las empresas, con políticas de acciones a realizar en caso de fugas de datos y un largo etcétera que para la mayoría de quienes me leen no les viene a cuento.

Es muy curioso ver cómo ha evolucionado la tecnología en los últimos 10 años. En el 2008 aún era la época del dominio de blogosfera: lo habitual era que la presencia online se midiera mediante weblogs (o blog) en lo que llamábamos la Web2.0. Se había pasado de la web unidireccional a la bidireccional, permitiendo la participación: aparecieron los comentarios y la interacción entre el autor y sus lectores, cambiando el paradigma. En aquella época también estaban empezando a ser relevantes en España la llamadas redes sociales con Tuenti (amistades de colegio), Viadeo y Xing (en lo profesional), Minube (viajes), y acababa de llegar Facebook en español. Esto marcó otro cambio: una época de rápida difusión, con la fiebre del compartir y aumentar el número de seguidores. También se hablaba de la que web 3.0 sería la web semántica, de manera que podríamos introducir contextos en el código de las páginas para poder procesar lenguaje natural y hacer preguntas a los buscadores sin tener que hacer uso de palabras clave.

Where do those ads come from?

10 años después la cosa ha cambiado. Algunos blogueros irreductibles aún seguimos aquí, mientras que otros migraron hacia otras plataformas, y con ese cambio llegaron cuestiones de términos de servicio. Quien migró sus publicaciones a redes sociales o servicios mas especializados (por ejemplo, Medium), para ganar difusión, ¿qué precio ha pagado? ¿El contenido sigue siendo del autor o la compañía  dueña de la plataforma puede hacer con él lo que quiera? Tomemos por ejemplo cuando Facebook compró Instagram, y cómo muchos usuarios abandonaron la plataforma por las dudas de la propiedad de las imágenes.

Esta no es la única una cuestión preocupante, sino también el incremento desmedido de los anuncios (que ha llevado al boicot mas grande jamás habido, quizás incosnciente para muchos, mediante el uso extendido de bloqueadores de publicidad) y la aparición del concepto de la publicidad segmentada. La actividad de los usuarios se rastrea para crear anuncios mas relevantes para ellos, pues de toda la vida o se ha pagado el sitio web o se tiene una versión gratuita costeada mediante la  inclusión de anuncios, ¿pero desde cuando se rastrea a los usuarios sin consentimiento explícto de estos? ¿Y qué se hace después con esos datos? Yo no tengo ni he tenido (ni planeo tener) perfil de Facebook, pero sé que pueden tener un perfil fantasma (shadow profile) de mí, basado en mi actividad navegando por webs que contienen el botón “me gusta” (a día de hoy, ¿qué sitio no lo tiene?) mediante mi IP. Yo nunca he aceptado sus términos e irónicamente para ver esos datos recopilados tendría que crearme un perfil en su red. Ahí es uno de los sitios donde espero que actúe la GDPR.

Lo que no esperaba para nada era que el avance de la semántica no está siendo en el código de la web, sino en el procesamiento de voz, pues ésta está sustituyendo poco a poco a la entrada de información mediante teclado. Los asistentes de Microsoft (Cortana), Google (Google Home), Amazon (Alexa) y Apple (Siri) nos escuchan y cada vez nos dan mejores respuestas… y la gran pregunta es, ¿cuándo y cuánto nos escuchan? En teoría debería ser cuando pulsamos el botón de activación o si lo tenemos configurado como tal, cuando escuchan la famosa frase de activación (el típico “OK Google”), en la práctica no siempre ha estado tan claro, como pasó con aquella infame televisión de Samsung. Precisamente por eso los términos y condiciones claros son importantes.

Nunca pensé que la privacidad sería un tema tan importante a día de hoy, y me alegra que se esté intentando hacer algo al respecto, lo triste es que estas leyes fragmentarán los servicios de Internet en dos, la de los países con legislación al respecto y el de los que no la tienen.

¿Sabías que Windows 10 incluye un keylogger (y por razones totalmente correctas)?

Nada como un parche de Windows 10 para tener que hacer una revisión completa de la configuración del equipo, lo que me llevó por casualidad a la configuración de teclado en pantalla. Allí tenemos los controles habituales de los dispositivos táctiles, lo que es completamente normal, pues Windows 10 ese concedió como un sistema híbrido para PC y tablet, y entre otras cosas tenemos el corrector ortográfico y la escritura predictiva.

¿Sabías que Windows 10 incluye un keylogger (y por razones totalmente correctas)?

La escritura predictiva de por sí es algo normal, escribir en el teclado de pantalla es incómodo y por lo tanto usamos las sugerencias. Este tema me parece curioso, pues originalmente es una herramienta que se creó por temas de accesibilidad (pensad por ejemplo en gente con dificultades motoras como Stephen Hawking y cómo estas funcionalidades le facilitaron seguir adelante con su trabajo, os recomiendo este artículo de Wired hablando de sus sistemas, aunque aviso que como casi todo lo realmente bueno en esta materia está en inglés), y ahora es algo muy habitual. Esta herramienta se basa en registrar nuestras entradas de texto mas habituales, para así predecir que es lo siguiente que solemos añadir, y en consecuencia ayudar a trabajar mas rápido. Ahora, a diferencia de los móviles que son de uso mas personal y tendemos a tener las sesiones de los diversos servicios (correo, redes sociales) guardadas, en los ordenadores tendemos a salir de las sesiones, pues suelen ser de uso compartido. En consecuencia este sistema de keylogger (almacenamiento de pulsaciones de teclas) registra nuestros usuarios y contraseñas.

Como veis, el uso es completamente legítimo y bien intencionado y que por lo que veo a día de hoy no se sincroniza entre dispositivos, pero podría verse como una brecha de seguridad en ciertas circunstancias si en alguna ocasión futura se sincronizase en nube. Es bueno saber que está allí por actualizaciones futuras y así tenerlo monitorizado por si acaso los criterios a de la empresa cambian, pero si por tranquilidad queréis desconectarlo ya en el equipo de sobremesa es un proceso sencillo. Sólo hay que ir desde la configuración a la sección de teclado y desconectar la predicción y la ortografía. Otra vía mas rápida de localizarlo es usar la caja de búsqueda del menú de configuración e introducir la palabra “ortografía”.

El timeline de Windows 10… y el predeterminado

Llegó la cacareada (y en mi caso temida) actualización de abril de Windows 10 con su nueva funcionalidad, el timeline. Para citar a Microsoft:

“Continuar con tus actividades recientes al instante en la línea de tiempo. Selecciona “Vista de tareas” en la barra de tareas o presiona la tecla del logotipo de “Windows + tabulador”.

El hecho de que el nuevo icono sea animado ya de por sí me molesta, utilizo el ordenador para trabajar y las cosas que se mueven distraen, a ver si lo ponen estático. Lo segundo es que esta funcionalidad se sincroniza con otros equipos… y si se sincroniza con otros equipos, eso es que Microsoft se podría quedar con los datos de, por enumerar los ficheros que abres, tu estructura de carpetas, las páginas por las que navegas… Luego ví que lo que visito desde Firefox no se  lo queda, es solo con Microsoft Edge, que es un navegador que toco nunca, excepto porque es el visor preconfigurado de PDFs e eBooks. Supongo que es otra pieza más que tendré que sustituir visto esto. Así que vámonos a la configuración del sistema.

El timeline de Windows 10... pues a mí me incomoda

Desde el menún inicio vamos a configuración con su nuevo look en “Fluent design”, y efectivamente allí está el timeline, preconfigurado para enviar mis datos a Microsoft, cosa que curiosamente han obviado al preguntarme tras la instalación de la última actualización. La ubicación, los datos de teclado y la recopilación de datos de sistema (de la que te deja ponerla de completa a básica, pero no “ninguna”), pero esto, que es lo más intrusivo no. Así que a desconectarlo todo y quitar toda aplicación que tenga relación de Edge.

Supongo que las prisas de sacar la actualización al final de abril y no retrasarla (se suponía que tendría mas cosas, pero ) es para colarnos esto antes de que entre en vidor el GDPR, ley europea por la cual la recopilación de datos de usuarios sin consentimiento explícito por parte de estos se multa. Para entonces esto cambiará, pero hasta entonces, ¿cuánto habrán recopilado?

Pd: la otra víctima de esta actualización ha sido la app de la Microsoft Store de Twitter. Pasamos de tener una apliación Windows nativa basada en API a ese desastre de la versión webapp oficial “Twitter Lite” sobre Microsoft Edge: adiós tema oscuro, adiós información ordenada limpiamente en el orden temporal correcto y hola espionahe de Microsoft. En resumen, han destruído todo el valor de la aplicación y en consecuencia ha sido desinstalada.