La sociedad digital actual, con todo lo que conlleva en uso de dispositivos móviles y smartphones, GPS, sistemas de transporte, medidores eléctricos, interacción en redes sociales (virtuales o físicas)… genera cada día cantidades ingentes de datos cuyo análisis puede ayudar a predecir todo tipo de fenómenos y comportamientos e incluso adelantarse al comportamiento futuro de cualquier tipo de red – humana o no-. Es el llamado Big Data o análisis de datos masivos y redes complejas, que permite también extraer todo tipo de información sobre catástrofes naturales e incluso epidemias, permitiendo adelantarse y reaccionar de forma eficaz a dichos fenómenos y mejorar, por ejemplo, los procesos de ayuda humanitaria a los países subdesarrollados.
Esta vertiente más humanitaria de algo aparentemente tan frío como es la extracción de datos y su análisis para extraer conclusiones fue el tema de debate elegido en Jornadas «Big Data, Good Data» de la 6ª edición del curso de Ciencia de Redes, que organiza la Cátedra Orange y que tuvieron lugar los pasados 11 y 12 de noviembre en la la ETSI de Telecomunicación de la Universidad Politécnica de Madrid. En ellas, los expertos Miguel Ángel Luengo -responsable científico del programa Global Pulse de Naciones Unidas-, Vanessa Frías -profesora de la Universidad de Maryland (EEUU)-, Blanca Carazo -responsable de cooperación en UNICEF-, Julio Mayol -profesor titular de Cirugía en la Universidad Complutense de Madrid-, Carlos Herrera Yagüe -data scientist en la start up de reputación on line Traity– y Ludovic Centonze, director de proyectos en Orange CSR, debatieron sobre las aplicaciones sociales del Big Data para temas tales como la ayuda al desarrollo y la protección de la infancia, las alertas epidémicas, la gestión de catástrofes o la medicina.
Así, por ejemplo, Miguel Ángel Luengo nos dio a conocer proyectos como el que está llevando a cabo Naciones Unidas en Colombia a través del programa Global Pulse. Allí, el análisis del clima de los últimos diez años, así como el mapa de cosechas, hizo que desde la organización se desaconsejara la siembra a los agricultores de la zona debido a los malos augurios climáticos. Efectivamente, debido a la temporada de huracanes, 2013 fue un año catastrófico en la agricultura colombiana con fuertes pérdidas para los que decidieron no seguir el consejo.
El experto de Naciones Unidas puso de relieve, asimismo, las distintas aplicaciones del uso de datos, según las necesidades del país al que se aplican. Así, métodos anticonceptivos, eficiencia en vacunación, desforestación, prevención de propagación de epidemias son otras aplicaciones que puso de relieve, derivadas del análisis masivo de la información obtenida de uso de móviles, mensajes de Facebook, Twitter e incluso la transcripción a texto de programas de radio para analizar las palabras que se repiten con mayor frecuencia.
Otra de las iniciativas de las que se incidió durante las jornadas, Challenge D4D Senegal (Data for development), está siendo promovida precisamente por Orange, para la aportación de proyectos que ayuden a mejorar las condiciones de vida en este país africano gracias al uso de Big Data. Tal y como explico Ludovic Centonze, director de proyectos en Orange CSR, en el concurso que se ha puesto en marcha al efecto, se han definido las cinco áreas prioritarias en las que trabajar en colaboración con los Ministerios responsables o instituciones asociadas: salud, agricultura, transporte e infraestructura, energía y producción de estadísticas nacionales.
En cualquier caso, uno de los estudios que más atrajo la curiosidad de los presentes fue el de la investigadora Vanessa Frías, que, a través el análisis de datos sobre nuestro comportamiento en redes sociales, ha logrado definir con alto nivel de detalle en qué nos parecemos -y, obviamente, en qué nos diferenciamos- de nuestros vecinos ingleses y norteamericanos a la hora de utilizar Twitter. Del estudio pormenorizado de parámetros tales como densidad de población, horarios de actividad o número de tweets en las ciudades de Madrid, Londres y Nueva York, Frías logró establecer que, de las tres, Madrid es la ciudad que más tarde comienza su actividad en la red social en las zonas de negocio. Sobre las 7.30pm se inicia un aumento considerable en la cantidad de tweets que generamos en nuestro país, mientras en Londres y Nueva York se ha iniciado dos y una hora antes respectivamente.Sin embargo, la capital de España es, de las tres ciudades, la que finaliza más tarde la actividad en la popular red tanto en la vida nocturna y de ocio como en el uso residencial. La actividad de Nueva York, por ejemplo, tiene su punto más bajo de actividad alrededor de las 2 am, seguida de Londres (6am), mientras que Madrid esto ocurre hasta cerca del mediodía, momento en el que comienza el repunte de tweets.Otro dato del estudio es el referido al uso que hacemos de Twitter según la densidad de población. Así, Nueva York es la ciudad con un volumen muy superior de tweets por kilómetro cuadrado (84,13), seguida de Londres (42,51) y Madrid (10,88).Finalmente, la investigadora concluyó que las zonas con más volumen de actividad en las tres ciudades son las zonas comerciales y de negocio, seguidas de zonas industriales y domicilios particulares.