- Jueves, 17 Julio 2014
Los metadatos para teléfonos móviles han estado en las noticias últimamente, pero la Agencia de Seguridad Nacional Americana no es la única organización que recopila información sobre el comportamiento online de las personas.
Nuevas aplicaciones descargables de forma rutinaria para telefonía móvil piden para acceder a su información de ubicación, su libreta de direcciones u otras aplicaciones, y por supuesto, los sitios web como Amazon o Netflix hacen un seguimiento de su historial de navegación con el interés de hacer recomendaciones personalizadas.
Al mismo tiempo, una serie de estudios recientes han demostrado que es sorprendentemente fácil identificar a personas no identificadas en supuestamente anónimas bases de datos, incluso aquellas que contienen millones de registros. Por lo tanto, si queremos que los beneficios de la minería de datos - como recomendaciones personalizadas o servicios localizados - ¿cómo podemos proteger nuestra privacidad?
En el último número de PLoS ONE, los investigadores del MIT ofrecen una respuesta posible. Su sistema prototipo, openPDS - para el almacenamiento de datos personales - almacena los datos de sus dispositivos digitales en una única ubicación que especifique: Podría ser un servidor cifrado en la nube, pero también podría ser un ordenador en una caja cerrada con llave debajo de su escritorio.
Cualquier aplicación móvil, servicio en línea, o equipo de investigación de grandes datos que quiera usar sus datos tiene que consultar el almacén de datos, que devuelve sólo la cantidad de información que se requiere.
Código compartido, no los datos
"El ejemplo que me gusta usar es la música personalizada", dice Yves-Alexandre de Montjoye, un estudiante graduado en artes y ciencias y el primer autor del nuevo artículo. "Pandora, por ejemplo, se reduce a esto que ellos llaman el genoma de la música, que contiene un resumen de sus gustos musicales. Para recomendar una canción, todo lo que necesita es los últimos 10 canciones que escuchaó - sólo para asegurarse de que no mantiene la recomendación de la misma otra vez - y este genoma música no necesita la lista de todas las canciones que he estado escuchando ".
Con openPDS, comenta Montjoye, "Usted comparte código; usted no comparte datos. En lugar de enviar datos a Pandora para definir cuáles son sus preferencias musicales, es Pandora quién envía un pedazo de código a usted para definir sus preferencias musicales, para luego enviarlo de vuelta. "
De Montjoye se unió en el artículo a su director de tesis, Alex "Sandy" Pentland, el profesor Toshiba de Arte y Ciencias Multimedia; Erez Shmueli, un post-doctorado en el grupo de Pentland; y Samuel Wang, un ingeniero de software de Foursquare que era un estudiante graduado en el Departamento de Ingeniería Eléctrica y Ciencias de la Computación, cuando se realizó la investigación.
Después de un despliegue inicial en el que participaron 21 personas que usaron openPDS para regular el acceso a sus registros médicos, los investigadores están poniendo a prueba el sistema con varias compañías de telecomunicaciones en Italia y Dinamarca. Aunque openPDS puede, en principio, ejecutarse en cualquier máquina a elección del usuario, en los ensayos, los datos se almacenan en la nube.
Permisos significativos
Uno de los beneficios de openPDS, comenta Montjoye, es que requiere aplicaciones para especificar qué información necesitan y cómo se va a utilizar. Hoy, dice, "al instalar una aplicación, ésta le dice "esta aplicación tiene acceso a tu ubicación GPS" o "tiene acceso a la tarjeta SD.' Usted como usuario no tiene absolutamente ninguna manera de saber lo que eso significa. Los permisos no le dicen nada".
De hecho, las aplicaciones suelen recopilar muchos más datos de lo que realmente necesitan. Los proveedores de servicios y desarrolladores de aplicaciones no siempre saben de antemano qué datos resultarán más útiles, por lo que almacenan todo lo que puedan por la posibilidad de que es posible que lo necesiten más tarde. Podría, por ejemplo, resultar que para algunos oyentes de la música, la cubierta del álbum resulta ser una buena ayuda para saber que las canciones les gustarán, antes que cualquier cosa capturada por el genoma de música de Pandora.
OpenPDS conserva todos los que datos potencialmente útiles, pero en un repositorio controlado por el usuario final, no por el desarrollador de la aplicación o por el proveedor de servicios. Un desarrollador que descubre que un bit de información poco utilizado previamente es útil debe solicitar el acceso a la misma desde el usuario. Si la petición parece innecesariamente invasiva, el usuario simplemente puede negarlo.
Por supuesto, un desarrollador nefasto podía tratar de jugar con el sistema, construyendo peticiones que provocan más información de la que el usuario tiene la intención de revelar. Una aplicación de navegación puede ser, por ejemplo, estar autorizado para identificar la parada de metro o en el garaje más cercano al usuario. Pero no debería necesitar ambas piezas de información a la vez, y solicitandolo, podría inferir información de ubicación más detallada que la que el usuario desea revelar.
La creación de salvaguardias contra esas fugas de información tendrán que hacerse sobre una base de caso por caso, basado en aplicación por aplicación, reconoce Montjoye, y al menos en un principio, todas las implicaciones de algunas combinaciones de consultas pueden no ser obvias. Pero "incluso si no es 100 por ciento seguro, sigue siendo una gran mejora con respecto a la situación actual", dice. "Si logramos que la gente tenga acceso a la mayoría de sus datos, y si podemos tener la técnica puntera, para pasar de forma anónima a los sistemas interactivos, sería como una gran victoria como."
Escrito por Larry Hardesty, Oficina de Noticias del MIT