Puedes explicar lo que has entendido

Explícaselo a tu abuela. Si no puedes explicarlo simplemente, es que no lo has entendido bastante bien

¿Qué (demonios) es Big Data? Es la frase que más he escuchado en estos días de vacaciones. Me lo pregunta la gente que me quiere y que se interesa por lo que hago en mi trabajo. Personas de todos los sectores, tipo de responsabilidades y cargos no saben lo que es Big Data (suena a palabro moderno que va a pasar de moda), y tampoco para lo que sirve. No me extraña. Es algo de lo que se habla mucho y se explica poco. En este post me voy a liar la manta a la cabeza y voy a intentar contar de forma sencilla todo este sarao.

Lo de “Data” está claro. Son los datos. Lo de “Big” no parece tener gran complicación. Uniendo las dos cosas nos sale que son datos grandes. Como eso no dice mucho en español, pues nos quedamos con que son muchos datos, y no importa tanto lo de si son grandes o no. También, intuitivamente queda claro que los datos están para analizarlos. Conclusión: big data es analizar grandes cantidades de datos. Hasta ahí: todo clarito.

Comienza el baile con las primeras preguntas que surgen a todo el mundo: ¿De dónde salen esos datos?¿Quién los tiene?¿De quiénes son?¿Para qué se analizan?¿Por qué esto es nuevo?  De ahí, pasar a la inquietud y a la paranoia es cuestión de minutos. ¿Nos están persiguiendo?¿Por qué alguien querría saber qué es lo que hago?¿Esto no da un poco de miedo?

Vamos por partes:

¿De dónde salen esos datos? Pues de twitear que estás estás en la playa, de enviar un email a la empresa de autobuses quejándote de los horarios, de ir a la compra al supermercado y ahorrarte un euro y medio al pasar la tarjeta de fidelización, de hacer running con el GPS del movil activado, de devolver la camisa horrorosa que te regaló tu cuñada en Navidad, de recibir en casa la bicicleta para tu sobrino que has comprado, de buscar en Internet qué hacer un fin de semana con los niños sin gastarte mucho dinero o de subirte en el bus de vacaciones al pueblo. Casi todo lo que hacemos hoy en día deja un rastro, un reguero de datos como si fueran las miguitas de pan de Pulgarcito.

¿Quién tiene esos datos? Cuando tú utilizas algo, estás (habitualmente) aceptando las condiciones de uso de ese algo. En el caso de las aplicaciones de móviles, es obvio. Si utilizas una app de running, das por hecho que se quedan grabados los km que has hecho, por dónde has estado corriendo, tus pulsaciones, etc. Cuando pasas la tarjeta de fidelizacion en el súper para que te descuenten los tres euros que tienes acumulados, pues sabes que esa empresa sabe lo que compras. La tienda de moda donde has devuelto la camisa sabe que todos esos modelitos han sido devueltos en dos semanas, así que toma nota y no vuelve a fabricar ese patrón.

¿De quiénes son esos datos? Los datos son tuyos pero, si aceptas las condiciones de uso, pues los datos pasan a ser de la empresa, de la aplicación móvil, etc. La LODP española te protege de un uso indebido de los datos, pero tienes que hacer uso de tus derechos, en caso de que los veas vulnerados. Como no podía ser de otra manera, ahora hay que tener mucho cuidado con la cyberseguridad. Son muchos los delitos que se pueden cometer en Internet. Sé prudente y revisa las condiciones antes de aceptar. Las reticencias que suscitan el uso de los datos (el uso legal, digo) son diferentes según la edad del usuario. La generación de los millennials acepta sin problemas la cesión de sus datos a cambio de un servicio gratuito. Pero si no es tu caso, muchas empresas dan otras opciones, por ejemplo, pagar por eliminar los anuncios, etc. La opción más drástica: no utilizar ese servicio. Así no consiguen ninguna información que no quieras compartir.

¿Para qué se analizan? Las empresas utilizan los datos que tienen para darte un mejor servicio y que estés más feliz (y vuelvas pronto a gastar más), para ahorrarse costes intentando venderte algo que no te interesa nada (y que, por supuesto, en tu vida vas a comprar) e intentando adivinar qué es lo que vas a querer el año que viene o dentro de cinco años (para no fabricar cosas que no quiera nadie). Cuando las empresas son pequeñas, es más fácil no cometer esos errores. Por ejemplo: imagínate que pones una panadería. Tienes 100 clientes. En unos meses ya sabes que el 50 % te compran barras de pan, el 30% baguetes, el 15% pan de pueblo y el 5 % te compra hogazas. Además, el 75 % te compra todos los días, el 20 % cada dos días y el 5 % una vez a la semana. El 25 % de los que te compran más de dos barras de pan entre semana, pues además te compran unos donuts. Pero si te compran sólo una barra de pan un sábado, pues se llevan una botella de colacola, además de un tigretón. Es fácil intuir que todo se va complicando y que es difícil tener la cantidad de pan adecuada para conjugar varios factores: que todo el mundo tenga su pan disponible, que tenga el producto que realmente quiere, y que tú no tengas que cenar pan duro con donuts resecos y tigretones caducados todos los días porque has calculado mal la demanda. Cuando las empresas crecen, todo esto se complica y es necesario capturar, almacenar y analizar los datos para convertirlos en información válida y fiable, porque la cabeza tiene un límite. ¿Verdad?

¿Es ésto nuevo? Realmente no es nada nuevo, esto es más viejo que los caminos. Una de las preocupaciones de los seres humanos es tener la mayor cantidad de información sobre algo para tomar las decisiones más acertadas posibles. Cuando te vas a comprar un coche, eso queda clarísimo. Buscas, rebuscas, preguntas, investigas, pruebas…todo lo que haga falta para equivocarte lo menos posible. Porque lo que arriesgas merece la pena todo ese esfuerzo previo. En el caso de las empresas es lo mismo. El coste de equivocarse es alto, así que hay que conseguir información para saber si ahora conviene más contratar a más comerciales, o mejorar tal producto que no se vende ni para atrás, o es una cuestión de bajar ese precio, o seguir a la competencia que nos está adelantando por la derecha, o formar a los directivos, que se están quedando obsoletos. Es importante saber qué es lo que falla para poder solucionarlo. Conocer el problema a fondo para solucionarlo. Tener información de la mayor calidad para conocer a fondo lo que ocurre poder decidir bien.

Y ahora puede que te estés diciendo “Si esta mujer no ha hablado nada de Big Data”. Ahora voy: Big Data es una tecnología que permite almacenar datos como antes no se podía hacer. Ya no importa si los datos son muchos o pocos, si son grandes o pequeños, si los necesitas ahora mismo o dentro de un mes, si tienen formato número, texto, imágen o vídeo. Big Data lo “traga” todo. Esa es la gran novedad. Pero los análisis, el por qué de las cosas, sigue siendo el mismo de siempre: solucionar los problemas de las personas, de los negocios.

Me queda ahora reflexionar sobre las inquietudes que genera este Gran Hermano, más potente que lo que ideó George Orwell. ¿Realmente estamos perseguidos? No realmente, pues lo que se persigue no es saber al dedillo lo que hace Manuel Menéndez, de 39 años y que vive en Torrelodones; sino qué motiva y cómo se comporta el grupo en el que se encuentra Manuel Menéndez, que será uno que incluya varones, de menos de 40 años, que tienen un nivel adquisitivo X, que viven en un entorno urbano de tal manera.

Toda esta cuestión de la información y el uso que se hace de los datos lleva incluso a discusiones filosóficas. ¿El problema es de la tecnología o del uso que se hace de ella? Todos tenemos presente el debate sobre la energía nuclear, por ejemplo.

Mi opinión: no se pueden poner puertas al campo. La tecnología está ahí, nos facilita la vida. Fruto de nuestra interacción con ella se generan grandísimas cantidades de datos, que son información que nos permiten conocer más nuestra condición humana. No creo que eso sea ni bueno ni malo, es lo que es y lo que podemos hacer es un buen uso de ello.