Big (good) data


¿No es justo que alguien que se cuide pague menos por su seguro de salud o de vida? ¿Y que a una persona con unas probabilidades superiores de devolución de su deuda se le cargue un menor tipo de interés? ¿Y qué opinaría si recibiera menos publicidad o, al menos, mucho más vinculada a sus intereses? ¿Y si le pudieran planificar una dieta, unas vacaciones o una cartera de activos financieros que se ajustasen perfectamente a sus intereses, personalidad, hábitos de vida y circunstancias personales? Creo que la respuesta es sí: lo quiero, me apunto. Las empresas lo saben y llevan años intentando conocer lo mejor posible a sus clientes (primera lección de cualquier curso de marketing: "conoce a tu cliente"). Y estos, aunque lo niegan, en ocasiones (muchas) prefieren no perder tiempo y que lo que se les ofrezca sea el producto o servicio que se ajuste a lo que están buscando y a lo que más les conviene (es una sensación que yo tengo cada vez que voy a comprar ropa, por cierto).


Y en esta situación, llega el big dataque, como toda innovación tecnológica, genera un debate sobre si es PSI, es decir, si garantiza la Privacidad, es Segura y fomenta la Integración. Enrique Titos ya arrancaba el debate aquí y el libro de la abogada Paloma Llaneza aporta interesantes puntos de vista para debatir sobre ello. “En Datanomics hay datos, sólo datos, de cómo se recaba y se usa nuestra información personal, de cuáles han sido las consecuencias indeseables de estos datos… y cómo hemos mutado hacia una fe casi religiosa en que los datos son la solución y no el problema. Queda claro cuál es el sesgo del libro. Y no digo que no tenga razón; y tampoco que no se hayan producido abusos y aprovechamientos ilícitos, pero veo el vaso medio lleno y creo que el big data es una innovación tecnológica que sirve para avanzar y para hacer una sociedad más justa. Ello sin menoscabo de que deba existir, y se garantice, el “derecho a volar por debajo del radar”, así como la seguridad de los datos. Y, para eso, es necesario que se intensifique la regulación sobre cómo se recaban y usan los datos, así como quién los usa. Y, por qué no, que se remunere a quienes los aportan de forma consciente o inconsciente (y, sobre todo, que nadie no sea consciente).




Nuestra identidad digital es más completa, rugosa y precisa que el yo que creemos que somos. Incluye todos aquellos elementos de nuestro carácter que, aunque deseemos no tenerlos, existen. En el mundo de los datos, somos más nuestros dobles digitales que nosotros mismos”. Es decir, alguien nos conoce mejor que nosotros mismos. ¿Y acaso esto no puede ser positivo para ayudarnos, para ofrecernos lo que más nos conviene, para evitar perder el tiempo?


No estamos lejos de valorar si vale la pena gastar recursos públicos en niños que prevemos que no van a ser brillantes en los estudios” lo reinterpreto como “no estamos lejos de evitar a algunos niños el martirio de tener que estudiar una carrera universitaria, sobre todo si se han equivocado eligiéndola, y de enseñarles la profesión para la que están más capacitados, aquella que desarrollando serán más felices”.


¿Y si podemos dejar de enviar o analizar CV de dos hojas gracias a que contamos con un big data en condiciones?


Los prejuicios y las injusticias no han venido ni de los datos ni de los algoritmos”. No puedo estar más de acuerdo. Y, es más, lo que puede conseguir el big data es que la discriminación se realice de forma menos subjetiva y más fiable… o que incluso no caigamos en ella porque estaba basada en “conclusiones” equivocadas. Advierte la autora de que, en ocasiones, “no se busca causalidad sino correlación”, pero este es uno de los errores más frecuentes de quienes tratan de sacar conclusiones sin conocer correctamente las bases de la estadística inferencial. No es un problema del big data (los buenos data scientist no caen en este error), sino de los modelos utilizados, o de la propia intención de modelizarlo todo, cuando hay muchas cosas que no son modelizables, por más que tengamos una infinidad de datos. Los mercados financieros, por ejemplo. ¿Habríamos sido capaces de predecir el momento del estallido de la Gran Recesión de 2008-2009 si entonces hubiéramos tenido big data? ¿Y las intensas caídas de las cotizaciones como la observada en la parte final de 2018? Los “Errores tipo I” (rechazar hipótesis verdaderas) y los “Errores Tipo II” (aceptar hipótesis falsas) seguirán produciéndose, pero con menos probabilidad gracias al big data.


La cadena de valor del dato



Fuente: Elaboración propiahttps://elalcazardelasideas.blogspot.com/2018/05/la-cadena-de-valor-del-dato.html
El campo de la medicina es uno de los que más recurren a la estimación a partir del muestreo. Pues bien, el big datano hace más que alimentar este muestreo de forma más nutrida, de aplicarlo vía inteligencia artificial para salvar vidas. ¿Le gustaría que el médico pudiera diagnosticarle en tiempo real? ¿Y el psicólogo? ¿Le asusta el “internet de los sentidos”? La próxima aplicación será hacer posible el análisis de los sentimientos en tiempo real a partir de datos como la temperatura corporal, el seguimiento ocular o los niveles de glucosa en sangre (aunque debo reconocer que esto sí da algo de miedo…).
La cadena de valor del dato

Fuente: Elaboración propia



Con lo que estoy muy de acuerdo es con la crítica que se hace a las redes sociales y la sensación de que seamos “tristes perros de Pàvlov conectados” buscando la recompensa vía like, retuit o nuevos seguidores. “Las redes sociales están llenas de recompensas impredecibles que captan, de manera permanente, la atención de sus usuarios, creando en ellos una rutina que obliga a verificar sus pantallas de forma habitual porque nunca saben cuándo ni cómo se va a producir la recompensa. El uso de las redes sociales provoca un aumento de la tristeza y el potencial de tener un impacto psicológico en los usuarios”. “Y si uno osa desconectarse, el servicio o la aplicación se encargará de mandar mensajes, ofertas o recompensas para llamar la atención del usuario y atraerlo de nuevo al servicio”. “Los mecanismos pull-to-refresh[1] o infinite scrolling de cualquier red social son desconcertantemente similares a una máquina tragaperras: cada vez que se desliza hacia abajo, no sabes lo que viene después. A veces es una hermosa foto. A veces es sólo un anuncio (Tristan Harris)”. “Cuando cambiamos nuestra foto de perfil Facebook sabe que es un momento en el que somos vulnerables a la aprobación social y lo coloca más arriba en el feed y por más tiempo, para que el usuario se sienta recompensado y reconfortado en su pertenencia a la comunidad de Facebook”. “Si alguien me sigue, ¿cómo no voy a seguirle?”. “Cuando uno recibe una invitación de alguien para conectarse, imagina que esa persona ha tomado una decisión consciente, cuando en realidad es probable que respondan inconscientemente a la lista de contactos sugeridos por la red social. En otras palabras, LinkedIn convierte nuestros impulsos inconscientes (para ‘agregar a una persona’) en nuevas obligaciones sociales que millones de personas se sienten obligadas a pagar”. “Si cuantificásemos el tiempo que empleamos en la labor de consultar y contestar mensajes irrelevantes o que podrían ser contestados al final del día, nos sorprenderíamos de los millones de horas de trabajo y de descanso que se pierden, con el impacto negativo en la productividad y la salud de todos nosotros”. Supongo que lleva asintiendo desde que comenzó el entrecomillado. El capítulo 6 (Adiction by design) debería ser de obligatoria lectura para cualquier usuario de redes sociales.
Una última reflexión, para la que pido ayuda a los expertos en big data: ¿puede alguien decirme cuántas veces aparecen las palabras “EEUU”, “China” y “Europa” en este libro? Me atrevo a apostar a que la frecuencia de “China” no es muy diferente a la de “EEUU” y superior cuando hablamos del futuro. A costa, claro, de la palabra “Europa”, muy poco presente. Este es un dato tremendo.
No creo que yo sea “dataísta”, pero sí me quedo con sus beneficios, por los cuales estoy dispuesto a pagar los costes que comporta. Pero esta es mi opinión. Lo importante es saber la de la autora, mucho más versada que yo y que aporta información muy relevante, y de una manera muy directa y amena. Un libro muy recomendable para tener criterio con el que debatir: ¿big data sí o no?





[1] Diseñado por Loren Brichter. https://en.wikipedia.org/wiki/Loren_Brichter