lunes, 11 de noviembre de 2019

"Hola mundo", de Hannah Fry (2018)

Resumen del libro "Hola mundo", de Hannah Fry (2018)

Resumen original y actualizado en:
https://evpitasociologia.blogspot.com/2019/11/hola-mundo-de-hannah-fry-2018.html

Resumen elaborado por E.V.Pita, doctor en Comunicación y licenciado en Sociología y Derecho

Sociología, algoritmos, Internet, redes sociales, sociedad de la información

........................................................................................................................

Ficha técnica

Título: "Hola mundo"

Subtítulo: Cómo seguir siendo humanos en la era de los algoritmos

Título original en inglés: "Hello World"

Autora: Hannah Fry

Fecha de publicación en inglés; 2018

Publicación en español: 2019 / Blackie Books, Barcelona

Número de páginas: 301

........................................................................................................................

Biografía oficial de la autora (hasta 2020)

Hannah Fry es profesora adjunta de matemáticas urbanas en el University College de Londres. En su trabajo cotidiano utiliza modelos matemáticos para estudiar patrones de comportamiento humano, y ha colaborado con gobiernos, cuerpos policiales, analistas sanitarios y supermercados. Los vídeos de sus "charlas TED" acumulan millones de visitas, y ha presentado documentales de televisión para la BBC británica y la PBS estadounidense; también presenta el pódscat de ciencia The Curious Case of Rutherford & Fry ("Los curiosos casos de Rutherford y Fry"), que desde hace tiempo produce la BBC,

........................................................................................................................

Texto de la contraportada

"¿Deberíamos entregar a las máquinas todo el poder? ¿Confiamos realmente en ellas? Los algoritmos ya deciden, sin ayuda humana, penas de cárcel, tratamientos clínicos y hasta el destino de un coche que se dirige directo a atropellar a un niño.

Un ensayo imponente que, desde las matemáticas, la sociología y los nuevos horizontes tecnológicos, proyecta un nuevo mundo. Un texto afinadísimo que no sataniza los algoritmos, sino el uso que, a menudo, les dan sus creadores y usuarios.

Por eso este libro crucial trata sobre nosotros: quiénes somos y quiénes queremos ser.

Nuestro mañana depende de lo que pensemos hoy".

........................................................................................................................

ÍNDICE

Nota sobre el título

Poder
Datos
Justicia
Medicina
Coches
Delincuencia
Arte

........................................................................................................................

RESUMEN

Comentarios iniciales: La autora Hannah Fry llega a una conclusión: los algoritmos (recetas matemáticas para generar resultados automáticos) aún no están bien desarrollados (lo que hace un sueño impracticable el verdadero coche autónomo) y la Inteligencia Artificial, ni de lejos, se le puede considerar autónoma ni mucho menos que llegue a competir con el humano ni superarlo. A día de hoy, dice, la tecnología es muy floja:  el superordenador Watson (programa de IA) es incapaz de hacer diagnósticos médicos serios, los algoritmos de Justicia condenan a inocentes o ponen penas muy altas sin tener en cuenta las circunstancias personales, los programas de pronóstico de delincuencia se ceban con los barrios marginales y su índice de pronósticos es bajo... Incluso la máquina DeepBlue de IBM que derrotó a Kasparov era bastante chapucera (aunque los ingenieros fueron muy astutos al imitar los "silencios" antes de mover pieza para poner nervioso al rival) pero logró amedrentar al maestro ajedrecista ruso, que se dejó apabullar y cayó en una especie de terror tecnológico que le impidió sostener el pulso con su rival mecánico.

A ello se suma que los datos de los usuarios son empleados para venderles publicidad (a través de algoritmos que detectan si una internauta está embarazada antes de que lo sepa su padre) o para fines más oscuros como manipularles para votar en las elecciones.

La autora inicia el libro explicando por qué tituló a su obra "Hola Mundo". Cuenta que de pequeña le regalaron un Spectrum (equivalente al Commodore 64) y que una de las primeras instrucciones para programar (la primera lección, según la tradición) era ordenar que la pantalla escribiese: "Hola mundo" en letras que se van moviendo (la idea fue de Brian Kernighan en 1970 porque había visto una caricatura de un polluelo saliendo del cascarón y diciendo: "Hola mundo").

Fry define primero lo que es un algoritmo: "conjunto ordenado y finito de operaciones que permite hallar la solución de un problema". Aquí se incluye la receta de un pastel, las instrucciones para montar un mueble de Ikea o las indicaciones para encontrar una calle. La autora matiza que, actualmente, el algoritmo es algo más: toman una secuencia de operaciones matemáticas (ecuaciones, aritmética, álgebra, cálculo, lógica y probabilidad) y las traducen en código informático. Se les introducen datos del mundo real y se pone a trabajar realizando cálculos para alcanzar su fin.

Es útil dividir las tareas que hacen en el mundo real en cuatro categorías:

- Priorización: hacer una lista ordenada (ejemplo: buscador de Google que ordena las páginas que buscas, Netflix al sugerir las películas que quieres ver, TomTom selecciona la ruta más rápida y la máquina de ajedrez Deep Blue).

- Clasificación: seleccionar una categoría (anuncios en Facebook para mujeres de 30 años con anillos de compromiso y ropa para embarazada; etiquetar fotos de vacaciones,)

- Asociación: encontrar vínculos. Señalar relaciones entre cosas (páginas de citas como OKcupid, las recomendaciones de Amazon al vincular tus intereses con los de clientes anteriores)4

- Filtrado: aislar lo importante. Eliminar el ruido (los programas de reconocimiento de voz Siri, Alexa, Cortana y filtros de noticias de Facebook y Twitter)

La mayoría de los algoritmos se construyen para realizar una combinación de estas cuatro cosas. (Por ejemplo, UberPool empareja a posibles viajeros que vayan en la misma dirección cribando rutas).

A ello se suman dos paradigmas clave:

- Algoritmos basados en reglas: Instrucciones directas e inequívocas construidas por humanos. (Ejemplo: la receta de un pastel)

- Algoritmos de aprendizaje automático: Se inspira en la forma de aprender de los seres vivos (premiar al perro que aprende un hacer algo para que deduzca por sí solo lo que debe hacer). Esta es la base de la Inteligencia Artificial (se da a la máquina unos datos, un objetivo, retroalimentación cuando está en el buen camino y descubre la mejor manera de alcanzar un fin). Sobre esto último, la IA ha descubierto maneras de dar buenos resultados siguiendo estrategias y rutas inconcebibles para un ser humano (como confundir la foto de un coche con un perro porque hay un simple punto extra en las ruedas). Estos algoritmos son buenos cuando la lista de instrucciones no funciona (sirve para reconocer objetos en fotos, entender palabras y traducirlas).

La autora descarta que la IA sea una amenaza para la Humanidad (al tomar estas máquinas unos extraños caminos para hallar soluciones, rutas que los humanos no entienden) y que la Inteligencia Artificial está tan subdesarrollada ahora mismo que sería más honesto denominarla: "revolución en la estadística computacional" pero no "inteligencia" ("Preocuparse por la maligna inteligencia artificial es como preocuparse por el hacinamiento en las colonias de Marte; estamos lejos de eso", parafraseando al teórico del aprendizaje automático Andrew Ng).

La autora también advierte que la gente no debe tener fe ciega en los algoritmos (como ocurre cuando el GPS nos coloca a un conductor al borde de un acantilado y este sigue ciegamente las instrucciones del asistente de navegación). Fry advierte que, diversos experimentos demuestran que los electores pueden variar su intención de voto (en torno a un 12 %) tras cambiar y reordenar levemente los enlaces a los resultados de búsqueda de candidatos en la primera página de un buscador o una web ("El mejor sitio para esconder un cadáver es la segunda página de Google", bromea la autora, recordando un chiste de informáticos). El problema que subyace aquí es que la gente ignora lo fácil que puede ser manipulada y hacerle cambiar sutilmente de opinión política.

La autora dice que para saber si un algoritmo es fiable o no hay que investigar bien cómo funciona (recuerda el caso de un ingeniero clasista de Nueva York que en el siglo XX diseñó túneles bajos para que no pudiesen pasar los autobuses llenos de gente pobre y afroamericana por la carretera que llevaba a una playa frecuentada por ricos y blancos). Añade: "Los algoritmos se parecen mucho a las ilusiones mágicas; parecen cosa de brujería pero una vez que sabes el truco, el misterio se desvanece". Por ello, muchas veces los humanos tienen que hacer caso omiso a los algoritmos (como hizo el militar soviético Petrov al ignorar un presunto ataque de misiles desde Alaska, en EE.UU., a la URSS en los años 80; dedujo que el algoritmo estaba equivocado porque nadie lanzaría una guerra nuclear con solo cinco misiles y esperó 23 minutos a ver si había explosiones, lo que no ocurrió; era una falsa alarma y así evitó empezar una guerra nuclear).

Otros autores defienden que los algoritmos hacen mejores predicciones que las personas y que merece apostar por cálculos automatizados para hacer diagnósticos médicos, pronósticos de ventas o evaluaciones de aptitud militar o rendimiento académico esperado. Cita el libro de Paul Meehl (Clinical versus Statistical Prediction), en el que dice que los algoritmos matemáticos, por muy sencillos que sean, casi siempre realizan mejores predicciones que las personas. En todo caso, la autora dice que hay que bajar a los algoritmos de su pedestal y preguntarse si de verdad son capaces de hacer lo que dicen.

El inicio fueron las tarjetas clubcard de fidelización de los supermercados (caso de Tesco contra Sainsbury, en Inglaterra), pues recogían numerosos datos de los clientes, los clasificaban y predecían sus nuevas compras. Luego, en EE.UU. Luego, en el 2002, Target dio un paso adelante y llegó a afinar tanto en las predicciones que incluso ofrecía productos de bebé a recién embarazadas, incluidas adolescentes cuyas familias lo ignoraban (lo que la autora llama cruzar la "línea repulsiva" en la que una información privada y confidencial se usa para manipularnos). Para evitar más situaciones "embarazosas", mezclan distintos productos con los de bebés.

Menciona la figura del "broker de datos" cuyo máximo exponente sería Palantir Technologies (de Silicon Valley, fundada por Peter Thiel, el de PayPal). Hay otras como Acxiom, Corelogic, Datalogix, eBureau... Usan datos para inferir nuevos datos pero de forma masiva para que los anuncios que recibimos vayan directamente al objetivo. Apenas hay diferencias en la forma de operar que tienen Google, Facebook, Instagram y Twitter. La actividad de los "brókeres de datos" apenas está regulada y pueden vender nuestro historial de navegación en Internet sin nuestro consentimiento. Unos profesores alemanes compraron datos anónimos y descubrieron que era muy fácil deducir la identidad y su huella digital lo delataba. En Europa han introducido el Reglamento General de Protección de Datos (RGPD), con la idea de ilegalizar parte de la actividad de los brókeres de datos.

 Además de las molestias que puedan ocasionar los anuncios que aparecen en la web, hay otros problemas: desde malas calificaciones crediticias de los bancos a que las aseguradoras califican a un cliente de "alto riesgo" porque al cruzar datos aparece que practica deportes peligrosos, porque come dulces sin azúcar es diabético o porque tiene un apellido afroamericano le llegan anuncios de detenciones y penales.

La autora también analiza el caso de Cambridge Analytica. La tooría se basa en cinco rasgos para describir la personalidad del individuo: apertura a nuevas experiencias, escrupulosidad, extraversión, afabilidad y neuroticismo. En el 2012, un grupo de científicos pudo deducir mediante psicometría la personalidad de cada usuario a partir de los clicks que hacía en "Me gusta" en Facebook y también con Twitter. Así un mismo anuncio ofrecía "nuevas experiencias" al aperturista y "una larga tradición" al conservador. A partir de esta base, Cambridge Analytica empezó a trabajar para la campaña electoral de Trump (identificaba a pequeños grupos de personas a las que creyeran fáciles de convencer y adaptar sus mensajes específicamente a ellas en lugar de enviarles publicidad genérica). A la gente que compraba coches de Ford, les ofrecían anuncios "típicamente americanos" para alentar su patriotismo. Pero también enviaban mensajes sesgados: identificaban a una madre soltera neurótica, y explotaban su temor de ser atacadas porque vivían solas en casa, y le enviaban mensajes para que respaldase a grupos de presión de armas. O creaban anuncios y los disfrazaban de periodismo ("Diez verdades incómodas sobre la Fundación Clinton"). La autora concluye: "Cambridge Analytica mostró, con fines de manipulación, noticias falsas a usuarios de Facebook basándose en sus perfiles psicológicos. La pregunta es: ¿Funcionó? Creemos que somos inmunes a la manipulación emocional pero, probablemente, no lo somos". Lograron aumentar un 0,10 % las ventas pero esos pequeños márgenes de influencia son suficientes en unas votaciones generales para inclinar la balanza por escaso margen y favorecer que uno u otro político gane en unos estados o provincias.

La autora también menciona el caso extremo de clasificación de los ciudadanos: el Sesame Credit. la puntuación china de calificación de los ciudadanos. que es voluntario hasta el 2020 (luego, será obligatorio), y que se hace a través de un algoritmo. Si un chino juega diez horas a los videojuegos es considerado "ocioso" y le quitan puntos. Si tienes más de 600 o 750 puedes tener más límite de crédito, usar un carril VIP en el aeropuerto de Pekín o volar al extranjero. El algoritmo premia la lealtad y castiga la desobediencia como un programa de fidelización.

La autora señala que cada vez que usamos un algoritmo debemos preguntarnos por sus incentivos ocultos: ¿Por qué una aplicación da una cosa gratis? ¿Qué hace realmente ese algoritmo? Hannah Fry advierte que estos algoritmos tienen el poder de predecir nuestros hábitos de compra y también de robarnos nuestra libertad.

En los siguientes capítulos, la autora analiza cómo funcionan los algoritmos en la Justicia, etc... y sus defectos.
Por ejemplo, en Justicia hay distintos algoritmos como Compas para la evaluación de riesgos de reclusos que podrían reincidir en dos años (con una tasa de predicción acertada del 70 %). ProPublica descubrió que había un sesgo negativo hacia los reclusos negros. También habla de cómo un algoritmo identificó a un ciudadano normal con un peligroso atracador de bancos y fue detenido. Pero también habla de los algoritmos que impuso mayores penas a un joven que pasó por una zona de disturbios de Brixton en el 2011 y robó un agua mineral en un supermercado durante un disturbio y otro que actuó con un pasamontañas y se llevó videojuegos. Hay falta de coherencia en los algoritmos que calculan penas pero la autora dice que también entre los propios jueces para juzgar un mismo delito sin saberlo.

Los algoritmos también calculan el riesgo de reincidencia y la probabilidad de que vuelvan a delinquir. Uno de los métodos usados es el diagrama de árbol de decisiones (SI/NO), los cuales se dividen en paquetes más pequeños y luego se hace una media de la probabilidad. Habla del "bosque aleatorio" (un algoritmo de aprendizaje automático, un tipo de algoritmo que pertenece a la categoría más amplia de la inteligencia artificial o aprendizaje automático). Los bosques aleatorios son usados por Netflix para ayudar a predecir lo que nos gustaría ver según nuestras preferencias anteriores. Airbnb los emplea para detectar cuentas fraudulentas y en atención sanitaria se usan en el diagnóstico de enfermedades.





No hay comentarios:

Publicar un comentario