¿Cuáles son los riesgos del ‘big data’? (+ Video)

Un peligro del ‘big data’ es que se lo puede engañar. Cuando la gente sabe qué conjunto de datos se utiliza para tomar decisiones importantes, puede inclinar la balanza a su favor. . Foto tomada Zonamovilidad.es.

En los últimos 15 años hemos presenciado una explosión en la cantidad de datos digitales a nuestra disposición y en las tecnologías informáticas usadas para procesarlos. El ‘big data’, como se la conoce, sin duda aportará importantes avances científicos, tecnológicos y médicos, y podría mejorar significativamente la formulación de políticas gubernamentales; pero también plantea serios riesgos si se abusa de él o se lo utiliza de manera inadecuada.

Tener más datos no es un sustituto de tener datos de alta calidad. Por ejemplo, aunque uno puede encontrar innumerables opiniones políticas en las redes sociales, estas no representan de manera fiable a los votantes. De hecho, una parte sustancial de los tuits y mensajes de Facebook sobre política son generados por computadoras.

Los programas automatizados basados en conjuntos de datos han causado numerosos escándalos. Hace poco, un estudiante buscó imágenes de Google sobre “peinados de aspecto no profesional para ir a trabajar”. Los resultados mostraron, en su mayoría, imágenes de personas de raza negra. Cuando el estudiante quitó el ‘no’ antes de ‘profesional’, Google arrojó principalmente imágenes de personas blancas. Esto no fue resultado de un sesgo de los programadores de Google, sino un reflejo del modo en que la gente etiqueta imágenes en internet.

Pues bien, un programa de ‘big data’ que usara este resultado de búsqueda para evaluar las decisiones de contratación y ascensos podría penalizar a los candidatos negros. Y esto no es solo una posibilidad hipotética. Una investigación de ProPublica sobre modelos de riesgo de reincidencia delincuencial demostró que una metodología de amplio uso para determinar las sentencias para los convictos sobrestima sistemáticamente la probabilidad de que los acusados de raza negra cometan delitos en el futuro y subestima la de los blancos.

Otro peligro del ‘big data’ es que se lo puede engañar. Cuando la gente sabe qué conjunto de datos se utiliza para tomar decisiones importantes, puede inclinar la balanza a su favor. Por ejemplo, si a los profesores se los juzga según los resultados de sus estudiantes, pueden ser más propensos a “enseñar para el examen”.

Ni siquiera el motor de búsqueda de Google es inmune. No obstante estar alimentado por una inmensa cantidad de datos y supervisado por varios de los principales científicos de datos del mundo, sus resultados son susceptibles de manipulación por medio de técnicas como el Google ‘bombing’ o el ‘spamdexing’, entre otros métodos.

Un tercer peligro es la violación de la privacidad. En los últimos años se han robado grandes conjuntos de datos confidenciales de sitios empresariales y gubernamentales, y los investigadores han demostrado cómo las opiniones políticas o, incluso, las preferencias sexuales de las personas se pueden recoger con precisión en publicaciones en línea aparentemente inocuas, como las opiniones sobre películas, incluso si se publican bajo seudónimo.

Por último, el big data plantea un reto para la rendición de cuentas. Si alguien siente que ha sido tratado injustamente por la decisión de un algoritmo, a menudo no tiene forma de apelar, ya sea porque los resultados no se pueden interpelar o porque las personas que los han creado se niegan a proporcionar detalles sobre cómo funcionan. Hace poco, la Unión Europea adoptó una medida que garantiza a las personas afectadas por los algoritmos el ‘derecho a una explicación’, pero solo el tiempo dirá cómo funcionará en la práctica.

Y los alcances de esto pueden ser muy tóxicos, como explica Cathy O’Neil en su libro ‘Weapons of Math Destruction’ (‘Armas de destrucción matemática’), en el cual analiza el poder de los algoritmos en nuestra vida cotidiana y cómo muchos de ellos fomentan la desigualdad y la discriminación.

La buena noticia es que los peligros del ‘big data’ se pueden evitar. Pero no será así a menos que protejamos celosamente la privacidad de las personas, detectemos y corrijamos las injusticias, utilicemos prudentemente las recomendaciones algorítmicas y mantengamos una comprensión rigurosa del funcionamiento interno de los algoritmos y los datos, objetivos y visiones que alimentan sus decisiones.

Lea más:

En video, ¿qué es el Big Data?

(Tomado de El Tiempo)

Ciencia y Tecnología
Colaboradores:

One Reply to “¿Cuáles son los riesgos del ‘big data’? (+ Video)

  1. En primero lugar quisiera plantear que el BIG-DATA, no es un peligro para nadie, es solo un conjunto de técnicas y algoritmos para utilizar en un conjunto de datos grande. Por otra parte es cierto, todos los datos no tienen la calidad necesaria, para ello se realiza el primer paso de la minería de datos, que es clasificación de los mismos, de esta forma quedan los datos que realmente no sirven para nuestro interés. El uso del BIG-DATA, de la Minería de Datos, y del Aprendizaje Automático, tienen mucho mas que brindar, el uso que se le dé a la tecnología no puede ser una señal de pare para su empleo e importancia. Un ejemplo de esto, el machete, una herramienta muy útil para el campesino, o un arma letal en manos de un delincuente. Por otra parte el big-data no roba información, se aplica a la misma, si de una u otra forma se roba la información, es por otra vía, el big-data solo se encarga de darle el tratamiento a los datos, para lograr un conocimiento, que tiene que ser supervisado por el hombre, para llegar a la sabiduría que puedan tener estos

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *