Un buen puñado de datos, bien mezclados bajo las reglas mágicas de las matemáticas. Los resultados: una predicción meteorológica, un nuevo fichaje deportivo, una tendencia de consumo novedosa, la comprensión del deshielo polar.
El big data y el business analytics se han ido colando en nuestra vida sin que nos demos casi cuenta. Las promesas de tecnologías con capacidades predictivas y analíticas sin precedentes son hoy una realidad. Pero ¿de qué hablamos realmente cuando hablamos de big data y analytics? ¿Qué significan otros términos que aparecen también en este campo como business intelligence y data science?
Qué es el big data y analytics
Durante el último año y medio, hemos intentado entender cómo funciona una pandemia en un mundo más global y conectado que nunca. Los estudios de movilidad y flujos de personas y su relación con los brotes de COVID-19 se han multiplicado alrededor del mundo. Aunque cada uno tenía su propio enfoque, muchos se basaban en big data: buscaban analizar la información de millones de personas para buscar y entender patrones y tomar decisiones informadas.
En líneas generales, tal como explica el Instituto de Ingeniería del Conocimiento de la Universidad Autónoma de Madrid, el término big data “hace referencia a un conjunto de datos grande y complejo, así como a las técnicas de tratamiento específicas de ese gran volumen de información”. Se suele definir también bajo las llamadas tres uves (aunque ahora se habla ya de siete).
Las tres uves originales eran las de volumen (gran cantidad de datos), velocidad (la que tienen las tecnologías que procesan esos volúmenes) y variedad (de formas y formatos). A ellas se les han añadido las uves de veracidad (la información debe ser fiable), viabilidad (el big data debe usarse de forma eficiente y efectiva), visualización (para entender y presentar mejor los resultados obtenidos) y valor (el que se obtiene cuando los datos sueltos se transforman en información y decisiones útiles).
Por último, el big data analytics o análisis de conjuntos de datos masivos es, según IBM, el uso de técnicas analíticas avanzadas sobre estos conjuntos de datos. Este análisis permite tomar decisiones mejores y hacerlo más rápido, modelar y predecir resultados futuros o identificar tendencias que permanecían ocultas a simple vista.
Los usos del big data
La idea del big data tiene más de 30 años, pero ha ido asentándose a medida que crecían el número de datos disponibles. En el año 2010, se crearon 2000 millones de terabytes de información digital. En 2019 fueron 41 000 millones. El año pasado, según estimaciones aun no definitivas de IDC, fueron 59 000 millones. El volumen de datos seguirá creciendo en el futuro. Pero ¿para qué se usan todos esos ceros y unos que codifican la información del planeta?
- Deportes. En España, el caso de Ramón Rodríguez Verdejo, Monchi, director deportivo del Sevilla FC, es muy conocido. Su uso del big data para descubrir talento y ficharlo le ha dado muchas alegrías al club andaluz. Pero hoy el análisis masivo de datos se usa hasta en Primera Federación (la antigua Segunda B) y el big data se utiliza no solo para fichar, sino para analizar el rendimiento de los deportistas, prevenir lesiones o descubrir nuevas tácticas en multitud de disciplinas deportivas.
- Servicios financieros. Bancos, fondos de inversión y aseguradoras fueron uno de los primeros sectores en apostar por el big data. Pioneros como JP Morgan empezaron usando el análisis sobre los datos de sus propios clientes para ofrecer servicios personalizados. Hoy el big data analytics se utiliza de forma generalizada en el sector para detectar fraudes, elaborar perfiles de riesgo o entender mejor a los clientes.
- Ciencia. El uso de técnicas de análisis avanzado en ciencia e investigación está muy extendido. Por poner un ejemplo, la meteorología y el estudio del clima no podrían entenderse hoy sin el big data. Los datos de radares y satélites ayudan hoy a anticiparse a la formación de grandes tormentas y otros desastres naturales con gran precisión (y mucho margen de tiempo).
Esto son solo tres ejemplos de entre miles de casos de uso. El análisis de big data es hoy un compañero habitual de los departamentos de marketing, los servicios de telemedicina, los festivales de música, el diseño y producción de series y películas y, también, las operadoras de telecomunicaciones como Orange.
¿Qué son el business intelligence y el business analytics?
En el camino del big data se cruzan, a menudo, otros términos similares. Dos de ellos, estrechamente relacionados entre sí, son los de business intelligence y business analytics. En este sentido, ambos conceptos hacen referencia a la aplicación de las tecnologías de análisis al ámbito de los negocios.
Según Gartner, business intelligence “es un término general que incluye las aplicaciones, la infraestructura y las herramientas que permiten el análisis de los datos y la obtención de información para mejorar las decisiones de negocio y optimizar el rendimiento”. El término business analytics haría referencia a la parte de análisis propiamente dicha y el de intelligence a la de la obtención de información útil para el negocio.
¿Qué es la ciencia de datos?
Todos los procesos y técnicas que rodean el desarrollo y el uso del big data se agrupan bajo el término de ciencia de datos o data science. Tal como señala IBM, la ciencia de datos abarca la preparación de los datos para su análisis y procesamiento, el análisis avanzado de datos y la presentación de los resultados para revelar patrones y permitir que las partes interesadas saquen conclusiones informadas.
Así, la data science engloba desde la manipulación de los datos hasta el desarrollo de algoritmos y modelos de inteligencia artificial para el análisis de la información. Los científicos de datos son hoy un perfil profesional muy demandado que tiene conocimientos matemáticos y estadísticos, maneja una amplia gama de tecnologías de datos, es capaz de desarrollar y usar la IA (y en especial, modelos de machine learning y aprendizaje profundo) y tiene la capacidad de exponer el valor de la información recabada de los datos.
En definitiva, el big data analytics está presente en cada vez más aspectos de nuestra vida y ha cogido mucha fuerza en el entorno de los negocios. El desarrollo de tecnologías avanzadas de análisis y de la inteligencia artificial abre cada vez más puertas para extraer el valor oculto de los datos.
Por Juan F. Samaniego
Imágenes | Unsplash/Isaac Smith, James Donovan, Luke Chesser