La idea de purgar y analizar datos para tomar decisiones, ser más competitivos o innovar no es nueva. El Business Intelligence centrado en la explotación de los datos internos de las empresas ya cumplía ese objetivo. Sin embargo, montar una infraestructura de warehouse y “minería” de datos requería un gran esfuerzo inversor en tecnología propietaria reservada solo a los más grandes.
Big Data nace de los avances tecnológicos en materia de software y virtualización del hardware, y también propiciado por el cambio de los hábitos sociales en un mercado cada vez más digitalizado e interconectado, apoyados por esta misma evolución tecnológica: el uso generalizado de Internet, del Cloud Computing y del Móvil ha implosionado en una oleada de datos de todo tipo.
Los macrodatos, agregados o dispersos, están disponibles para quien sepa o pueda recolectarlos, hacer la ingesta, filtrarlos y darles un nuevo valor. En parte, nosotros mismos somos los responsables de que exista ese volumen ingente de información, gracias al florecimiento de las redes sociales y el cambio en la forma de realizar nuestras compras y transacciones comerciales a diario.
Las 3 + 4 V
Tradicionalmente, Big Data Analytics se ha explicado a partir de las denominadas tres V (Volumen, Velocidad y Variedad).
- El volumen se refiere a la gran cantidad de datos que son tomados continua y constantemente. Es la característica fundamental del Big Data, a mayor cantidad de datos, más posibilidades de ajuste.
- La velocidad se refiere al flujo de datos que están en circulación entre los extremos y el núcleo, y entre sus propias interconexiones. Frente a los envíos periódicos en batch para su procesamiento, el Big Data aspira a que los datos sean analizados en tiempo real o lo más cercano al tiempo real.
- La variedad se refiere a las distintas tipologías, formatos y orígenes de los datos que hacen el proceso más laborioso y de integración. A diferencia de los datos internos de las compañías generados por sus aplicativos y ERP que se muestran perfectamente estructurados, el Big Data tiene que lidiar con éstos y con todos los demás, que pueden no estar estructurados, y proceden del resto de fuentes.
A estas tres V, últimamente se la han añadido por parte de distintos analistas hasta cuatro más de Veracidad (necesidad de que sean contrastados y auténticos), de Viabilidad (necesidad de puedan ser adquiridos y manejados), de Visualización (necesidad de que se puedan mostrarse y entenderse) y de Valor (necesidad de que sean importantes y pertinentes).
Con la combinación de estas características en su sabia proporción, y el empleo de algoritmos que den una explicación a los datos recolectados y también proporcione una proyección de su comportamiento, el Big Data permite obtener ese punto de conocimiento e innovación diferencial aplicado al negocio que se traduce en una ventaja respecto a tus competidores. Una de estas ventajas se refiere a la mejora en la planificación de la demanda, de forma que se convierta en un incremento de las ventas y una mejora del ROI de la inversión al poder optimizar los recursos disponibles.
Datos estructurados y no estructurados
Toda plataforma de Big Data tiene que estar preparada para manejar tanto la base de datos interna de nuestro entorno ERP (con información de la cadena de suministro, las ventas, facturación y presupuestos) como la incorporación de los datos no estructurados creados a partir de los nuevos canales de información sobre bases de datos NoSQL de nuevo cuño: contenidos de la Web, Social Data y análisis del sentimiento, indicios macro e informes varios, y toda la nueva estadística procedente de la sensorización y el Internet of Things. Hay que hallar la fórmula que homogenice todos los datos para poder integrarlos procedan de la base de datos que procedan en las mismas gráficas y cuadros de mando.
Hay que trabajar primero con los datos tradicionales. Constituyen una gran fuente de información de gran calidad y que tenemos siempre a mano en nuestros sistemas, pero que no los estamos utilizando activamente para la planificación de la demanda. Una vez hayamos superado esta primera fase entonces deberemos incorporar esas nuevas fuentes de datos no estructurados. En estos últimos deberemos incorporar también lo que denominamos metadatos, es decir, información paralela de interés como cuándo y dónde se ha obtenido este dato, desde qué dispositivo o terminal se ha obtenido y quién lo ha creado, en especial para su trazabilidad.
Inteligencia artificial
Cuando hablamos de cómo debemos tratar toda esta información, aparece la necesidad de aplicar el concepto de “machine learning”, es decir algoritmos de autoaprendizaje que nos ayudarán a realizar un tratamiento eficaz y adecuado. En la posterior fase del análisis de los datos podremos utilizar las herramientas de Business Intelligence tradicionales.
Sin embargo, si queremos montar una plataforma que sea capaz de procesar la información en tiempo real, debemos ir un paso más allá y pasar de un sistema Hadoop a un Spark. Los algoritmos existentes en el mercado proceden de software libre basado en Apache, realizado por profesionales que conocen el mercado y los casos de uso. Es, por lo tanto, una tecnología bastante artesanal y con una gran proyección de futuro.
Para todos los públicos
Una de las preguntas que nos hacemos es si Big Data es aplicable a las pymes o bien si es un tema reservado para grandes compañías. Como idea principal, Big Data es para aquellas empresas a las que la analítica masiva de datos les pueda aportar valor. Lo primero de todo es que debemos conocer nuestro negocio y medir si le va a suponer un incremento o no, Sin importar tanto el tamaño o el sector de actividad, porque con las modalidades de suscripción y pago por uso, se puede organizar la infraestructura justa para su explotación sin necesidad de grandes desembolsos iniciales.
¿Va a cambiar la estructura de las compañías? El impacto del Big Data dependerá del tamaño del proyecto. Como primer cambio debemos apuntar el hecho de que los datos pasan a formar parte del activo de la compañía, es decir van a adquirir un valor que hasta ahora no estaba contemplado en el patrimonio de la compañía. Esta circunstancia provocará que en determinadas compañías aparezca la figura del responsable de los datos. En paralelo se abre una gran oportunidad para empresas emprendedoras que se dediquen exclusivamente a cocinar los datos y ofrecerlos como servicios a otras empresas, así como perfiles del tipo científico de datos (matemáticos, estadísticos, programadores…) y otros de visión de negocio.
Análisis del sentimiento
Una de las fuentes de información del Big Data más importantes es Social Data. Como ejemplo principal tenemos las herramientas para captar los tuits, realizar su filtrado, ponderación, tener en cuenta el impacto del titular sobre la conversión de clics, los comentarios en el blog. Esta información nos va a mejorar la previsión de la demanda.
El uso de Social Data nos introduce un aspecto a tener en cuenta que es el de la privacidad de estos datos que en muchas ocasiones puede entrar en conflicto con ese derecho fundamental de las personas. En este sentido se debe tener muy en cuenta el marco que nos establece el nuevo Reglamento General de Protección de Datos que entrará en vigor en mayo de 2018. Como medidas básicas, hay que empezar con el consentimiento del titular para el tratamiento de sus datos, la anonimización de los mismos y su cifrado en toda la cadena.
Big Data nos puede ayudar mucho en mejorar nuestra planificación de la demanda, pero no está asegurado el retorno de la inversión. Esta circunstancia genera reticencias en las empresas para abordar un proyecto de este calado. Pero lo que no debe dar miedo es enfrentarse a tus propios datos y a utilizarlos activamente en tu provecho.
- ¿Qué es y cómo interpretar el ratio de tesorería? - 16 de abril de 2020
- Cumplimiento: otro motivo para actualizar el ERP - 27 de febrero de 2020
- Ratio de rentabilidad económica, un dato esencial para tu empresa - 27 de septiembre de 2019