viernes, 23 de agosto de 2019

"Todo el mundo miente", de Seth Stephens-Davidowitz (2017)

Resumen del libro "Todo el mundo miente", de Seth Stephens-Davidowitz (2017)

Resumen original y actualizado en el siguiente link:
https://evpitasociologia.blogspot.com/2019/08/todo-el-mundo-miente-de-seth-stephens.html

Resumen elaborado por E.V.Pita, doctor en Comunicación, licenciado en Sociología y Derecho.

Sociología, análisis masivo de datos, Big Data, sociedad digital

.................................................................................................................................

Ficha técnica

Título: "Todo el mundo miente"

Subtítulo: Lo que Internet y el big data pueden decirnos sobre nosotros mismos

Título en inglés: Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are

Fecha de publicación en inglés: 2017

Publicación en español: Capitán Swing Libros, SL, Madrid, 2019

Número de páginas: 287

.................................................................................................................................

Biografía oficial de Seth Stephens-Davidowitz (hasta el 2019)

Es escritor de opinión para el New York Times, profesor de The Wharton School, donde imparte un curso en el que explica cómo entender el comportamiento humano a través del big data, y excientífico de datos de Google. En la escuela secundaria, Stephens-Davidowitz, escribía obituarios para el periódico local, The Bergen Record, y fue malabarista en espectáculos teatrales. Se licenció en Filosofía por la Universidad de Stanford y tiene un doctorado en Economía por Harvard. Durante su trabajo como científico de datos en Google, investigó cómo combinar encuestas tradicionales con nuevas fuentes de datos de Internet. También ayudó a desarrollar nuevos métodos para medir la efectividad de la publicidad. Su trabajo se centra en el uso de fuentes de big data para descubrir comportamientos y actitudes previamente ocultos. A través de búsquedas de Google obtiene nuevos conocimientos sobre la psique humana que le permiten medir socialmente cuestiones como el racismo, el aborto autoinducido, la depresión, el maltrato infantil, las turbas de odio, la ciencia del humor, la preferencia sexual, la ansiedad, la preferencia del hijo y la inseguridad sexual, entre muchos otros temas. Sus investigaciones han aparecido en el Journal of Public Economics y en otras muchas publicaciones de prestigio. Vive en Brooklin y es un apasionado fanático de los Mets, los Knics, los Jets y Leonard Cohen.

.................................................................................................................................

Texto de la contraportada

"En un día promedio de principios del siglo XXI, los seres humanos que buscan en Internet acumulan ocho billones de gigabytes de datos. Esta asombrosa cantidad de información puede decirnos mucho sobre quiénes somos, los miedos, deseos y comportamientos que nos impulsan y las decisiones conscientes e inconscientes que tomamos. De lo profundo a lo mundano, podemos obtener un asombroso conocimiento sobre la psique humana que hace menos de 20 años parecía insondable. Stephen-Davidowitz nos ofrece información fascinante, sorprendente y a menudo graciosa, sobre temas que van desde la economía hasta la ética, los deportes, el sexo, etc. Todo ello extraído del mundo del big data. A partir de estudios y experimentos sobre cómo vivimos y pensamos realmente, el autor demuestra en qué medida todo el mundo es un laboratorio. Con conclusiones que van desde lo extraño pero cierto hasta lo provocador y lo perturbador, explora el poder de este suero de la verdad digital y su potencial más profundo, revelando sesgos profundamente arraigados en nosotros; una información que sin duda podemos utilizar para cambiar nuestra cultura. La influencia del big data se está multiplicando exponencialmente, y Stephens-Davidowitz nos desafía a pensar de una manera diferente sobre el mundo y la forma en que lo vemos.

.................................................................................................................................

ÍNDICE

Prólogo de Steven Pinker

Introducción: el perfil de una revolución

Primera parte. Datos grandes, datos pequeños

1. Malas corazonadas

Segunda parte. Las capacidades de los macrodatos.

2. ¿Tenía razón Freud?

3. Datos reinventados

Los cuerpos como datos

Las palabras como datos

Las imágenes como datos

4. Suero de la verdad digital

La verdad sobre el sexo,  el odio y el prejuicio, sobre internet, abuso infantil y aborto, los amigos de Facebook, tus clientes

¿Podemos soportar la verdad?

5. Más de cerca

¿Qué ocurre realmente en nuestros condados, ciudades y pueblos?

¿En qué ocupamos los minutos y las horas?

Nuestros dobles

Historias de datos

6. Todo el mundo es un laboratorio

El ABC de las pruebas A/B

Los experimentos crueles, pero iluminadores, de la naturaleza


Tercera parte. Macrodatos: precaución

7. ¿Macrodatos, macrochascos? Lo que no se puede hacer con ellos

La maldición de la dimensionalidad

El énfasis excesivo en lo medible

8. ¿Más datos, más problemas? Lo que no deberíamos hacer

El peligro del poder de las corporaciones

El peligro del poder de los Gobiernos

Conclusión: ¿Cuántas personas acaban los libros?

.................................................................................................................................

RESUMEN

El autor Seth Stephens-Davidowitz comienza su libro explicando la victoria de Trump desde un análisis masivo de datos que se remonta al 2008, cuando el afroamericano Obama ganó la presidencia. Se habló de una era posracial en EE.UU., que resultó ser una utopía. En un rastreo por Internet se detectó que,en la intimidad de sus hogares, los internautas aumentaron escandalosamente las búsquedas en Google de chistes racistas o relacionados con "negratas" (un grave insulto en EE.UU.). Lo sorprendente es que las búsquedas, que reflejaban odio racial, se distribuían por el mapa del país de una forma diferente a la que se esperaría (los sondeos reflejan un Norte progresista y un Sur conservador). Lo hacían de otra forma: el Este (con frontera en el Misissipi)  era racista y el Oeste, no. Daba igual que un estado fuese republicano o progresista. Había una línea divisoria que nadie había imaginado y que no salía en las encuestas pero que afloró en los macrodatos de Google y en esas búsquedas privadas desde casa. El mapa coincidía casi una década después con los votantes de Trump.

El autor menciona que hay una herramienta llamada Google Trends que sirve para saber cuántas búsquedas se hacen de determinado tema (por ejemplo, "síntomas de la gripe", lo que puede alertar de una epidemia antes de que sea detectado oficialmente) pero también recoge las confesiones en solitario de los internautas que no se atreverían a confesar en una encuesta por vergüenza. El autor señala que el cuándo y dónde se buscan hechos, citas, lugares, nombres, cosas o ayuda pueden decirnos mucho más sobre los deseos, pensamientos y temores reales de lo que se creía. Añade que, además de decir cosas obvias, los datos de Google son poderosos porque la gente le cuenta al gigantesco motor de búsqueda cosas que no le contarían a nadie más.

El espíritu del libro se basa en un experimento antiguo donde los encuestadores pedían a los vecinos que dijesen si eran socios de la biblioteca, si hacían donaciones, etc... y resultó que exageraban todos los datos por miedo a quedar mal ante el encuestador. Lo mismo ocurre con los hombres que exageran su número de relaciones sexuales en el matrimonio ya que se contradice con el hecho de que en Google hay muchas quejas por falta de relaciones en pareja. O sea, que todo el mundo mentía en las encuestas (ya fuese cara a cara  o telefónicas) pero que luego desvela su verdadera personalidad al hacer búsquedas en Google, y cuyo análisis tiene un fuerte carácter predictor.

Otro truco que descubrió el autor fue que los electores ponen primero en las búsquedas en Google el nombre de su candidato preferido y después el de su rival (por ejemplo, Clinton-Trump o Trump-Clinton) lo que da pistas de quién se llevará los votos en cada estado.

Los macrodatos también sirven para saber las preferencias sexuales de la gente (los gays que no saben si salir del armario y consultan a Google, los esposos que se preguntan cómo solicitar cierta práctica sexual a su mujer, los hombres que hacen preguntas sobre el tamaño de su miembro o las mujeres sobre el olor de sus partes íntimas).

El autor insiste en que estos estudios de macrodatos siguen una lógica profunda y que el pionero fue John Snow, un intendente de Sanidad de Londres del siglo XIX que cubrió un mapa con cruces donde fallecía gente por cólera y descubrió que en el centro del círculo de cruces había una fuente con agua contaminada. El cólera, por tanto no era contagioso por el aire sino por el agua (que contenía gérmenes). Este espíritu es el que impregna las nuevas búsquedas.

Stephens-Davidowitz también hace un resumen de las palabras usadas en las búsquedas en las redes sociales por sexos. En el género femenino destacan palabras como "compras" y "pelo" y "excited" o "love" y los hombres de "fútbol" y "Xbox", "colegas" y "mi esposa". Las mujeres también usan la palabra "mañana" más que los hombres (poco dados a pensar en futuro) y alargar las vocales (so, soo, sooo). Los hombres incluyen muchos tacos.
Por edades, de 19 a 22 años destacan palabras como "beber", "estudiar", "semestre chungo" y "odiosas clases". De 23 a 29 años, se resaltan palabras como "en el trabajo", "día libre", "cerveza", "diversión", "nuevo empleo". De 30 a 65 años, "mi niño", "mis hijos", "hija".

Otro de los hallazgos de los científicos de datos de Facebook fue estimar la "felicidad nacional bruta" examinando textos. Se hicieron experimentos con libros como Harry Potter y las reliquias de la muerte (un tíovivo de momentos felices y tristes), la película 127 horas (un bajón a lo largo de la película y subidón al final) o El Rey Lear (dramón de principio a fin).
Los científicos de datos clasificaron las historias analizadas en varios prototipos: "De mendigo a millonario (ascenso)", "De millonario a mendigo" (caída), "Atrapado sin salida" (caída, luego ascenso), "Ícaro" (ascenso, luego caída), "Cenicienta" (ascenso, luego caída, luego ascenso), "Edipo" (caída, luego ascenso, luego caída).

Los análisis de textos periodísticos también sirvieron para ver si un diario era republicano (conservador) o demócrata (progresista). Mientras unos dicen "impuesto de bienes inmuebles" los otros dicen "impuesto a la muerte" (porque grava las herencias), y otros dicen "Seguridad Social privatizada" y sus rivales "Reforma de la seguridad Social"; unos dicen "gente pobre" y otros "gasto público". Gentzkow y Shapiro, tras analizar 433 diarios de EE.UU., constataron diferencias notables en el uso del lenguaje según cada periódico (The Washington Post fue progresista por usar "impuestos a bienes inmuebles"). El periódico más progresista resultó ser The Philadelphia Daily News y el más conservador, The Billings Gazette, de Montana.

Otro análisis se hizo respecto a la cara "estándar" de cada época, en las fotografías del siglo XX y principios del XXI en EE.UU. Década por década, hasta 1930, los retratados típicos apenas sonríen, por no decir que están serios; de 1930 a 1970, esbozan una leve sonrisa; en 1970, ya hay sonrisas abiertas, cada vez más hasta el 2010. No es que haya aumentado la felicidad de los americanos sino que Kodak hizo campañas para asociar las fotos con la felicidad y mostrarse sonrientes (lo mismo que se ve ahora en Instagram y Facebook).

Las fotos vía satélite de la luz nocturna también han servido para medir la felicidad o al menos el crecimiento económico. Zonas apagadas empezaron a brillar a medida que surgía la industria a su alrededor y generaba más riqueza. Otra empresa de datos, Premise, encargó a empleados de Nigeria sacar fotos de tiendas para calcular el verdadero PIB. Otros lo hicieron sacando fotos a las cajetillas de tabaco para saber si tenían etiquetas.


No hay comentarios:

Publicar un comentario