Reflexiones sobre la web en el 2018 y el GDPR

La llegada de la instauración del GDPR (General Data Protection Regulation), o la nueva ley de protección de datos que entra en vigor esta semana, me ha hecho mirar las cosas en retrospetiva. Para quien no esté informado de lo que es esa nueva ley de cara al día a día del usuario medio, a partir del día 25  los europeos debemos dar nuestro consentimiento explítico e inequívoco para que un servicio online utilice nuestros datos. El cómo cambiará las cosas aún es una gran duda para mí, ¿será como pasó con las cookies, que se ha convertido en un banner molesto y no ha cambiado absolutamente nada, o era algo más? Al menos hay una cosa que nos asegura, y es que los términos de servicio (eso que todos dicen haber leído) a partir de ahora tienen que venir en una versión adicional legible que todos, y no únicamente los abogados (o algunos de ellos), podamos entender. Además hay una larga cantidad de medidas extra a implantar en el caso de las empresas, con políticas de acciones a realizar en caso de fugas de datos y un largo etcétera que para la mayoría de quienes me leen no les viene a cuento.

Es muy curioso ver cómo ha evolucionado la tecnología en los últimos 10 años. En el 2008 aún era la época del dominio de blogosfera: lo habitual era que la presencia online se midiera mediante weblogs (o blog) en lo que llamábamos la Web2.0. Se había pasado de la web unidireccional a la bidireccional, permitiendo la participación: aparecieron los comentarios y la interacción entre el autor y sus lectores, cambiando el paradigma. En aquella época también estaban empezando a ser relevantes en España la llamadas redes sociales con Tuenti (amistades de colegio), Viadeo y Xing (en lo profesional), Minube (viajes), y acababa de llegar Facebook en español. Esto marcó otro cambio: una época de rápida difusión, con la fiebre del compartir y aumentar el número de seguidores. También se hablaba de la que web 3.0 sería la web semántica, de manera que podríamos introducir contextos en el código de las páginas para poder procesar lenguaje natural y hacer preguntas a los buscadores sin tener que hacer uso de palabras clave.

Where do those ads come from?

10 años después la cosa ha cambiado. Algunos blogueros irreductibles aún seguimos aquí, mientras que otros migraron hacia otras plataformas, y con ese cambio llegaron cuestiones de términos de servicio. Quien migró sus publicaciones a redes sociales o servicios mas especializados (por ejemplo, Medium), para ganar difusión, ¿qué precio ha pagado? ¿El contenido sigue siendo del autor o la compañía  dueña de la plataforma puede hacer con él lo que quiera? Tomemos por ejemplo cuando Facebook compró Instagram, y cómo muchos usuarios abandonaron la plataforma por las dudas de la propiedad de las imágenes.

Esta no es la única una cuestión preocupante, sino también el incremento desmedido de los anuncios (que ha llevado al boicot mas grande jamás habido, quizás incosnciente para muchos, mediante el uso extendido de bloqueadores de publicidad) y la aparición del concepto de la publicidad segmentada. La actividad de los usuarios se rastrea para crear anuncios mas relevantes para ellos, pues de toda la vida o se ha pagado el sitio web o se tiene una versión gratuita costeada mediante la  inclusión de anuncios, ¿pero desde cuando se rastrea a los usuarios sin consentimiento explícto de estos? ¿Y qué se hace después con esos datos? Yo no tengo ni he tenido (ni planeo tener) perfil de Facebook, pero sé que pueden tener un perfil fantasma (shadow profile) de mí, basado en mi actividad navegando por webs que contienen el botón “me gusta” (a día de hoy, ¿qué sitio no lo tiene?) mediante mi IP. Yo nunca he aceptado sus términos e irónicamente para ver esos datos recopilados tendría que crearme un perfil en su red. Ahí es uno de los sitios donde espero que actúe la GDPR.

Lo que no esperaba para nada era que el avance de la semántica no está siendo en el código de la web, sino en el procesamiento de voz, pues ésta está sustituyendo poco a poco a la entrada de información mediante teclado. Los asistentes de Microsoft (Cortana), Google (Google Home), Amazon (Alexa) y Apple (Siri) nos escuchan y cada vez nos dan mejores respuestas… y la gran pregunta es, ¿cuándo y cuánto nos escuchan? En teoría debería ser cuando pulsamos el botón de activación o si lo tenemos configurado como tal, cuando escuchan la famosa frase de activación (el típico “OK Google”), en la práctica no siempre ha estado tan claro, como pasó con aquella infame televisión de Samsung. Precisamente por eso los términos y condiciones claros son importantes.

Nunca pensé que la privacidad sería un tema tan importante a día de hoy, y me alegra que se esté intentando hacer algo al respecto, lo triste es que estas leyes fragmentarán los servicios de Internet en dos, la de los países con legislación al respecto y el de los que no la tienen.

Anuncios

Breve (e imprecisa) lista de las consecuencias imprevistas por Facebook

Ante los comentarios recibidos por no ser capaz de leer el contenido enlazado del post de hace una semana, traduzco al castellano un segmento del artículo de Techcrunch:

Breve (e imprecisa) lista de las consecuencias imprevistas por Facebook

Una breve (e incompleta) lista de las consecuencias imprevistas por Facebook:

  • Beacon = se revelan las compras de los usuarios: uno de los primeros errores de cálculo de Facebook fue la reacción de los usuarios a Beacon en el 2007. La prestación permitía que otras webs que visitase el usuario, inicialmente 44 socios, publicasen flujos de noticias sobre su comportamiento al comprar y navegación en su perfil a menos que indicasen lo contrario. Los usuarios a veces no notaban esas publicaciones, y los sitios daban a Facebook datos de publicidad segmentada. Tras varias quejas de privacidad, historias de infidelidades matrimoniales sacadas a la luz y una demanda judicial, Zuckerberg eventualmente se disculpó y Beacon fue cerrado.
  • Engagement Ranked Feed (Feed por relevancia segmentada) = Noticias falsas sensacionalistas: Facebook construyó un flujo de noticias para mostrar primero el contenido mas relevante para que viésemos lo mas interesante que les sucedía a nuestros amigos, pero la medida de relevancia se apoyaba principalmente en los comentarios, “me gusta”, clicks, “vistos” y “compartidos”, y esas actividades cebaron las noticias falsas, sensacionalistas y exageradamente partidistas, permitiendo permitiendo que muchas se viralizasen mientras sus autores ganaban dinero por publicidad y financiaban sus operaciones mediante el tráfico enviado por enlaces y referencias de Facebook. Facebook minimizó la importancia de este problema hasta que no le quedó mas remedio que confesar su existencia y tener que pelear actualmente para intentar solucionarlo.
  • Engagement Priced Ad Auctions (Subasta de precios de anuncios) = Anuncios polarizados: Facebook ofrece un descuento a los anuncios que son atractivos como incentivo de negocios de cara a producir contenido de marketing que no aburra o moleste a los usuarios hasta el punto de que salgan de la red social. Pero la campaña de Trump diseñó a propósito anuncios divisivos y polarizados de manera que atrayesen a su nicho de partidarios y consiguiesen de forma fácil y barata los clicks necesarios y se compartiesen esos anuncios de forma mas viral.
  • App Platform (Plataforma de aplicaciones) = Game Spam (Correo basura de juegos): otro encuentro temprano con consecuencias imprevistas llegó en el 2009 con el lanzamiento de su plataforma de apps. La compañía esperaba ayudar a los desarrolladores a construir utilidades útiles que se viralizasen gracias a publicaciones automáticas especiales a los flujos de noticias. Pero los desarrolladores de juegos asediaron la plataforma y sus canales de crecimiento viral, engendrando compañías como Zynga que convirtió optimizar el spam en los flujos de noticias en una ciencia. LAs constantes invitaciones a unirse para ayudar a un amigo abrumaron los flujos de noticias, amenazando a ahogar las comunicaciones reales entre usuarios y arruinar la experiencia para aquellos que no jugaban hasta que Facebook cerró los canales de crecimiento, hundiendo a los desarrolladores.
  • Nuevos controles de privacidad = Se empuja a compartir públicamente: en el 2010 cuando Facebook desplegó su muy necesitados controles de privacidad granulares, también colocó en la configuración por defecto “publicar las actualizaciones de forma pública” en lugar de “compartir sólo con tus amigos”. Para poder competir en tráfico con el contenido de Twitter, Facebook empujó de forma agresiva a los usuarios a aceptar el nuevo sistema de privacidad con una colección de configuraciones “recomendadas” que fue criticada por dirigir a los usuarios a compartir estados y fotos con todo el mundo. En el 2011, Facebook se vería obligado a firmar un acuerdo con la FTC y la Oficina de Privacidad de la Unión Europea comprometiéndose a no cambiar las configuraciones de privacidad de los usuarios sin un aviso adecuado y que ellos eligiesen cambiar a su opción, y Zuckerberg pidió disculpas (de nuevo).
  • Academic Research (Investigación Académica) = Manipulación emocional: Facebook permitió a equipos de investigadores internos y externos realizar estudios sobre sus usuarios esperando ayudar a producir nuevos descubrimientos en el área de la sociología. Pero en algunos casos esos estudios pasaron de la observación a interferir sigilosamente en las condiciones mentales de los usuarios. En el 2012, miembros del equipo científico de datos de Facebook manipularon el número de publicaciones emocionalmente positivas o negativas de los flujos de 689.000 usuarios para estudiar sus actualizaciones de estados y ver si dichas emociones eran contagiosas. Facebook publicó la actualización, no previendo escándalo que llegó cuando el público descubrió que a algunos usuarios, incluyendo a adolescentes emocionalmente vulnerables que podían haber estado sufriendo depresión, se les mostraron de forma deliberadas publicaciones mas tristes.
  • Ethnic Affinity Ad Targeting (Publicidad segmentada con afinidad étnica) = Exclusión racista: el sistema de anuncios de Facebook anteriormente permitía a los negocios accediesen a segmentos de usuarios en grupos de “afinidad técnica” como “afroamericanos” o “hispanos” basándose en su comportamiento dentro de la aplicación como búsqueda de un segmento racial. La idea era que los negocios encontrasen con más facilidad usuarios interesados en sus productos, pero la herramienta fue utilizada para permitir la exclusión racial de grupos con cierta afinidad étnica de forma que no pudiesen llegar a oportunidades legalmente protegidas como empleos, préstamos y viviendas. Desde entonces Facebook ha deshabilitado este tipo de segmentació y aún está investigando la situación.
  • Real Name Policy (Política de nombres reales) = Permitir situaciones de acoso: durante años, Facebook requirió estrictamente usar los nombres reales para reducir el comportamiento incívico y abusivo de quienes se ocultaban tras el anonimato. Pero las víctimas de acoso, violencia doméstica, y crímenes de odio discutieron que quienes abusan de ellos podían emplear Facebook para rastrearlos y acosarlos. Sólo tras las fuertes críticas de la comunidad transgénero Facebook relajó esta política en el 2015, aunque algunos aún considera penoso el tener que tratar con pseudónimos o peligroso generar la red de contactos sin uno.
  • Internet.org = Preocupación por la Neutralidad internacional en la red: el plan de Facebook de dar acceso gratuito a Internet a naciones en desarrollo ha sido muy criticado como una forma de ocultar una estrategia de crecimiento de negocio tras una obra filantrópica. La app de Internet.org inicialmente ofrecía un número limitado de servicios gratuitos, excluyendo algunas redes sociales competidoras y ofreciendo de forma especial algunos productos de Facebook. Mientras algunos piensan que dar acceso a Internet de forma gratuita a una parte de la red es mejor para aquellos que no pueden permitírselo, otros creen que es el punto de origen del colonialismo digital diseñado para enganchar a los pobres a una cierta versión del Internet controlada por una única compañía. El nombre de la marca no ayudó a disipar esa cuestión. Los socios de telecomunicaciones les abandonaron en la India, llevando a Facebook a abrir el programa a todos los desarrolladores y renombrarlo como “Free Basics”. Una prohición del gobierno les forzó a retirar la app de la India, aunque sigue disponible en 50 países.
  • Self-Serve Ads (Autoservicio de anuncios) = Anuncios cuestionables: para ganar dinero de forma eficiente, Facebook permite comprar anuncios a través de sus apps sin siquiera tratar con un representante de ventas. Pero la interfaz de autoservicio ha mostrado de forma repetida que se puede usar de forma nefasta. ProPublica descubrió que los negocios podían marcar como objetivo a aquellos que seguían páginas cuestionables creadas por usuarios e intereses tales como “gente que odia a los judíos” y otras palabras clave perturbadoras de Facebook. Y los operativos políticos rusos usaron de forma bastante famosa los anuncios de Facebook para difundir memes divisivos en Estados Unidos y enfrentar a la población, promoviendo la desconfianza entre ciudadanos. Únicamente ahora Facebook está cerrando la larga lista de parámetros de segmentación basada en palabras clave cuestionables, contratando mas moderadores y mayor exhaustividad en política y documentación de compra.
  • Developer Data Access (Acceso de desarrollador a datos) = Abuso de datos: muy recientemente, Facebook ha descubierto que su confianza en los desarrolladores de aplicaciones no adecuada. Durante años ofreció una API (acceso por peticiones) que premitía a los creadores de aplicaciones obtener un perfil robusto de sus usuarios y una cierta información limitada sobre sus amigos para ofrecer productos personalizados. Por ejemplo, uno podía mostrar cuáles eran los grupos preferidos de sus amigos, para saber a quién invitar a un concierto. Pero Facebook carecía de un mecanismo fuerte de control en sus políticas para prevenir que los desarrolladores compartiesen o vendiesen los datos a otros. Ahora el público está encontándose que el truco de Cambridge Analytica de recibir 70.000 usuarios de la app del test de personalidad del Dr. Aleksandr Kogan y convertirlos en los datos de cerca de 50 millones de personas para generar perfiles psicográficos obtenidos de forma ilegal que ayudaron a difundir e influir en las campañas de Trump y el Brexit. Es bastante probable que otros desarrolladores hayan violado las endebles políticas de Facebook contra almacenar, vender o compartir los datos recogidos de los usuarios, y seguirán emergiendo mas informes de uso inadecuado.

Black widow’s web

Con todo lo que está sucediendo a día de hoy con las noticias y privacidad en redes sociales Angra lo ha clavado en su canción “Black Widow’s Web”. Y nos llamaban conspiranoicos…

Let me tell a little tale
Maybe you have heard about
Black widow spider’s on the wall
Weaving a silken web
Patiently works her thread
Quiet she lies there waiting
For your time to fall

I was fooled by your false adulation
Just another bait that fell into your trap
Stop your whining of victimization
‘Cause you know well how to differ dirt from gold

The black widow’s web
She silently waits for a chance
Once you’re caught she gets hold of your life
(You are mine)
Then her poison will make you blind
The black widow’s web
She’ll be carefully spreading her net
You have nowhere to hide, she will find you
(Better run from me)
Tempting your worse desires

When I turned on my device of alienation
You were draining out all my identity
You’re not obligated, social isolation
And you are trapped by your own vanity

The black widow’s web
She silently waits for a chance
Once you’re caught she gets hold of your life
(Better run from me)
Then her poison will make you blind
(You can’t hide)
The black widow’s web
She’ll be carefully spreading her net
You have nowhere to hide, she will find you
(You can’t hide)
Tempting your worse desires
(‘Cause you’re mine)

Your need of attention made your blind
Now your identity is mine

She may look so innocent
You were fooled by charming eyes
Better face the consequence
From her reckless heart
Don’t be frightened, little one
I never meant to harm you
Trust me now come closer here
And taste my kiss of death

The black widow’s web
She silently waits for a chance
Once you’re caught she gets hold of your life
(Better run from me)
Then her poison will make you blind
(You can’t hide)
You better face the fact
That no matter how fast you react
She will always be there to strike you
You can’t run from her
Enticing your worst desire
‘Cause you’re mine

Black widow spider’s on the wall
Weaving a fragile web
Patiently works her thread
Quiet she lies there waiting
For your time to fall

Angra: Black Widow’s web

Como nos rastrean las redes sociales: un experimento local con “Data Selfie”

Al ser alguien que ha trabajado procesando datos de páginas web y la API de Twitter, se puede decir que he tenido un asiento en lugar privilegiado para ver el desarrollo de la algorítmica de los datos de usuario recogido. Muchas veces he intentado explicarlo, y comentar por qué me intereso tanto por los bloqueadores de rastreo por encima de los de publicidad, pero una imagen vale más que 1000 palabras, y por eso hoy os hablaré de la extensión de navegador educativa Data Selfie.

Antes que nada, siendo este un post de los que varios conocidos calificarían como “conspiranoico”, indico que la extensión es de código abierto, de manera que podemos verificar que no hay envio de datos a terceros y todo el procesamiento sucede en local, de forma que es segura.

El objetivo de esta extensión es comportarse como lo hace Facebook con nuestros datos: al entrar en el muro comienza a registrar lo que tenemos en pantalla y por cuánto tiempo, para intentar precisar qué leemos. También sigue el ratón para ver donde clickamos (acción, por ejemplo, qué nos gusta) o lo dejamos reposar (leemos o pensamos) para determinar intereses o con quién interactuamos. Con esta información se efectua un procesamiento con inteligencia artificial para inferir relaciones, e intentar determinar nuestro perfil: quiénes somos, con quien nos relacionamos, intereses, preferencias políticas, etcétera, que es lo que utilizan después los recomendadores de contenidos.

Como nos rastrean las redes sociales: un experimento local con "Data Selfie"

Con esto, la extensión nos puede presentar un informe con gráficos de nuestra actividad presentándonos un “autorretrato via datos”: eres una persona de tal franja de edad, que se dedica a tal, interactúa con cual, su rango salarial es este, políticamente se inclina hacia este grupo y sus intereses son tales o cuáles, lo que resulta muy interesante de comparar con los reales y ver cuánto ha acertado.

¿Qué podemos aprender de esto? Pues tras unos días de uso podemos ver un retrato de lo que Facebook ve de nuestro usuario, de manera que podemos ser plenamente conscientes de cómo ira polarizando progresivamente el muro con contenido que considera que “podría interesarnos”, sesgando progresivamente la información y construyendo una burbuja de información a nuestro alrededor. Por este motivo considero tan importante la existencia de un motor de búsqueda como DuckDuckGo, que no tiene filtro y permite ver las diferentes perspectivas. Su contenido no estará tan depurado, pero es muy positivo poder confrontar diferentes visiones en lugar de quedar encerradisen un rincón de la red que elija el algoritmo de una gran corporación.

¿Aun usando el blog?

Sé que vivimos en la época de las redes sociales, y que muchos consideran el clásico blog personal como un medio digital obsoleto. Que sí, que Facebook hoy en día puede tener mas relevancia, Medium mas visibilidad, Linkedin mejor SEO (posicionamiento en la red) en cuestiones profesionales… Pero mas allá de lo que se puede considerar nostalgia hay 3 motivos principales por lo que todo lo que escribo suele acabar en este sitio, y que siga siendo el centro neurálgico de mi actividad online.

¿Aun usando el blog?
Originalmente en npr.org: deceptive cadence
  • La primera es control del contenido: lo que está en este blog es mío, no estoy cediendo derechos. Aparece en el orden que yo quiero (eso va por tí, Medium), e incluso puedo controlar lo que enlaza y cómo (posts relacionados, usar categorías para tener distintos blogrolls o RSS, o JSON).
  • La segunda es que no sea tan efímero: esto va a desaparecer cualquier día sin avisar en una limpieza de verano, ni se va a perder en una marea de información: todo el contenido en red social tiene un un tiempo de vida breve. Lo mismo pasa cuando te publican en una web externa: siempre es bueno tener una copia accesible.
  • La tercera y generalmente menos advertida es la accesibilidad: en los blogs podemos controlar la apariencia del contenido y asegurarnos de mantener actualizado la apariencia o tema para cumplir con estándares de la web. Si bien Medium, que se precia de ser una gran plataforma para la palabra escrita, tiene un buen sistema de embebidos que deja todo en un formato visualmente estupendo, os sugiero que probeis a visualizar el “modo lectura” en el navegador, o intentéis leer por RSS su contenido, a ver cuánto se os ha perdido en el camino en cuanto contenido, embebidos de código con coloreado sintáctico… porque recientemente me ha hecho notar que puede ser una ruina desde fuera de su propio sistema.

Así que puede ser en ocasiones caótico o incómodo el pasarlo todo a la nostálgicamente llamada “bitácora personal” intentando mantener una cierta organización, pero definitivamente merece la pena invertir tiempo en seguir manteniendo todo mi contenido escrito en un sitio estable (de ahí la categoría “bóveda”, donde va la información publicada originalmente en otro medio), porque nunca se sabe lo que puede priorizar (o no) la tercera parte. Esto no significa dejar de usar las otras plataformas, la difusión que ofrecen siempre es valiosa, solo es tener en cuenta todo el abanico de posibilidades.