Usando datos para gestionar situaciones de emergencia

Wednesday, April 11, 2018

Usando datos para gestionar situaciones de emergencia

Escrito por Carmen Rodríguez, becaria en LUCA, y Javier Carro, Data Scientist en LUCA. Área Big Data for Social Good.

¿Qué pensarías si te dijese que los datos pueden ayudar a salvar vidas? ¿Y si pudiésemos ayudar a minimizar las consecuencias de un desastre natural?

En el área Big Data for Social Good de LUCA tenemos una línea de investigación centrada en el análisis de datos de desastres naturales (terremotos, movimientos de tierra, inundaciones, etc.) con el objetivo de optimizar su gestión. Puedes ver un ejemplo en este post sobre nuestra colaboración con UNICEF. 
La repercusión de este tipo de eventos se ve reflejada en nuestro comportamiento en las comunicaciones. Llamamos para pedir ayuda, a nuestros familiares y amigos, para comprobar que están a salvo, o para avisar de que estamos bien. Esas reacciones humanas se reflejan en los datos de las redes de telefonía móvil y, convenientemente anonimizados y agregados, pueden ser utilizados para ayudar en la gestión de estos eventos.

En esta ocasión hemos hecho un estudio de impacto del temporal que tuvo lugar en la zona del Golfo de San Jorge de Argentina entre los días 29 de marzo y 7 de abril de 2017 y del que se hicieron eco varias noticias a lo largo de varios días. Comodoro Rivadavia y Rada Tilly son dos municipios argentinos situados entre las cuencas de varios arroyos y cuencas de drenaje. El temporal de lluvias dejó unos valores de 232 mm el día 29, cuando la media de precipitaciones del mes de marzo en Comodoro Rivadavia se sitúa en 20,7 mm.

Figura 2: condiciones meteorológicas en Comodoro Rivadavia en torno a las fechas del temporal estudiado.
Figura 2: condiciones meteorológicas en Comodoro Rivadavia en torno a las fechas del temporal estudiado.

Estas intensas lluvias, junto con el desbordamiento de los ríos que desembocan en el océano Atlántico, provocan grandes inundaciones en la ciudad, que dejan anegadas las calles y provocan la evacuación de miles de personas.

¿Qué nos dicen los datos de llamadas?


Para llevar a cabo este análisis hemos utilizado los registros de llamadas realizadas por hora en diferentes municipios. En función de la variación de llamadas causada por el desastre los hemos catalogado en tres zonas: afectación alta (Comodoro Rivadavia y Rada Tilly) en color rojo, afectación media (Caleta Olivia) en amarillo y afectación baja (Camarones, Sarmiento, Las Heras y Pico truncado) en azul. 

En la siguiente figura hemos representado el número de llamadas por hora para cada una de las localidades. Podemos apreciar a simple vista que para las líneas rojas, que representan la "zona cero" de la catástrofe, hay un pico de llamadas el día 29 de marzo a las 18:00.

Figura 3: llamadas cursadas por hora en cada localidad en torno a las fechas del temporal estudiado. Las escalas son diferentes para cada localidad para que se puedan observar mejor los patrones horarios.
Figura 3: llamadas cursadas por hora en cada localidad en torno a las fechas del temporal estudiado. Las escalas son diferentes para cada localidad para que se puedan observar mejor los patrones horarios.

Vemos también un aumento de llamadas en las localidades de Sarmiento y Pico Truncado, que nos indica que la repercusión del evento llega también a zonas más alejadas geográficamente.

Para profundizar un poco más, calculamos la desviación de las llamadas respecto de su patrón habitual por hora y día de la semana. Normalizamos esta diferencia y representamos el siguiente gráfico en el que los picos nos indican una desviación muy grande respecto de lo que se esperaría a esa hora ese día. En este caso sí podemos ver, en la Figura 4, un pico el día 29 en todas las localidades, en mayor o menor medida.

Figura 4: desviaciones de las llamadas realizadas respecto a los patrones horarios habituales para cada localidad. La desviación está expresada en número de desviaciones estándar respecto de la media. De nuevo ténganse en cuenta los cambios de escala, que se han hecho para poder observar mejor cómo destacan los diferentes picos, pero muestran que los niveles de impacto son diferentes.
Figura 4: desviaciones de las llamadas realizadas respecto a los patrones horarios habituales para cada localidad. La desviación está expresada en número de desviaciones estándar respecto de la media. De nuevo ténganse en cuenta los cambios de escala, que se han hecho para poder observar mejor cómo destacan los diferentes picos, pero muestran que los niveles de impacto son diferentes.

En este tipo de catástrofes, un desbordamiento debido a las grandes lluvias o un terremoto, la reacción es bastante inmediata. El día 28 los valores de llamadas se ajustan a las medias habituales, pero el 29 se produce una desviación brusca a una hora concreta, un gran pico de llamadas en el momento del desastre. Los días posteriores, la situación va normalizándose hasta alcanzar de nuevo valores normales de llamadas. 

En el siguiente mapa podemos ver esta evolución temporal. Los colores representan el grado de desviación del patrón de llamadas, que van desde el verde claro para las menores desviaciones hasta el rojo para las más grandes, pasando por amarillo y naranja.

Apreciamos el cambio brusco el día 29 de marzo y como la situación se estabiliza a lo largo de los días.

Figura 5: evolución temporal de las desviaciones en cada localidad. Los colores verdes representan las menores desviaciones respecto al patrón habitual y, los rojos, las más grandes.
Figura 5: evolución temporal de las desviaciones en cada localidad. Los colores verdes representan las menores desviaciones respecto al patrón habitual y, los rojos, las más grandes.

Podemos profundizar aún más a nivel geográfico, analizando el comportamiento en cada antena y pudiendo discriminar así la afectación por zonas dentro del mismo municipio. 

En la Figura 6 representamos los valores de llamadas para una muestra de antenas de distintas localidades, en las que vemos cómo unas antenas registran un pico mayor que otras o cómo algunas dejan de prestar servicio, probablemente debido a problemas técnicos en la red derivados precisamente de las condiciones meteorológicas.

Figura 6: patrones de llamadas horarios para las antenas de cada municipio.
Figura 6: patrones de llamadas horarios para las antenas de cada municipio.

Como podemos ver en la figura 7, si analizamos los datos de llamadas (línea verde) respecto a su patrón habitual (línea rosa) podemos comprobar las diferencias entre las desviaciones de antenas del mismo municipio, . Además, vemos la diferencia entre la repercusión en las distintas zonas de afectación. Las gráficas de la izquierda corresponden a antenas de Comodoro, que presentan un pico de llamadas el día 29 alrededor de las 6 de la tarde. Sin embargo, para las gráficas de la derecha, que son de antenas situadas en el municipio de Las Heras, la influencia del desastre se ve reflejada en las llamadas de los días posteriores.

Figura 7: comparativa entre los valores reales de llamadas por hora y los patrones habituales para dos de los municipios del estudio. Izquierda: Comodoro Rivadavia, perteneciente a la zona de afectación alta. Derecha: Las Heras, de afectación baja.
Figura 7: comparativa entre los valores reales de llamadas por hora y los patrones habituales para dos de los municipios del estudio. Izquierda: Comodoro Rivadavia, perteneciente a la zona de afectación alta. Derecha: Las Heras, de afectación baja.

Movilidad

Gracias a nuestra red de telefonía, no sólo podemos observar el comportamiento en cuanto a tráfico de llamadas, sino también el comportamiento anonimizado y agregado en cuanto a movilidad. Así, al igual que en este post o en este otro, podemos estudiar la movilidad en estos casos de desastres naturales.

Hemos creado una matriz origen-destino con todas las provincias de Argentina y especialmente con las localidades que hemos visto hasta ahora. También hemos seguido el mismo método para el cálculo de desviaciones. A continuación aplicamos un filtro que deje visibles sólo las localidades y provincias del país que tienen mayor desviación en movilidad en las fechas en torno al desastre. El resultado se muestra en Figura 8, donde vemos los perfiles de movilidad entre las diferentes combinaciones origen-destino más afectadas según se van seleccionando localidades o provincias en los mapas.

Observamos un claro pico negativo de desviación en la movilidad el día 29 de marzo entre las localidades afectadas y su entorno. Las personas se mueven menos, están aisladas en la zona del desastre o no viajan desde allí o hacia allí debido a las condiciones meteorológicas o los efectos del temporal

Figura 8: desviaciones de movilidad para diferentes combinaciones origen-destino filtrando localidades con mayor impacto en las fechas de interés.
Figura 8: desviaciones de movilidad para diferentes combinaciones origen-destino filtrando localidades con mayor impacto en las fechas de interés.

Observamos también con claridad un segundo pico de descenso de movilidad en todas las combinaciones origen-destino, y es que el día 7 de abril se produjeron de nuevo grandes tormentas y precipitaciones en las mismas zonas de Argentina, tal y como comentamos arriba al referirnos al histórico meteorológico.

Conclusiones

En definitiva, los desastres naturales afectan a nuestro comportamiento y dejamos un rastro de datos que, convenientemente anonimizados y agregados, podemos utilizar para reaccionar ante estos eventos.

La creación de alertas para los servicios de emergencia es un posible caso de uso implementable a partir de estos datos, de manera que se puedan dirigir los esfuerzos y recursos a las zonas más afectadas, o quizá anticiparse a la llegada de los efectos del temporal.

Otra posibilidad es desarrollar una aplicación de avisos para los propios usuarios de la red de telefonía móvil, que alertase de un peligro inminente en la zona en la que se encuentran y aconsejase medidas de precaución.

Obviamente, es importante discernir si los eventos que registramos de esta forma corresponden a un desastre natural o están motivados por otros tipos de actos multitudinario como conciertos o unas olimpiadas, por ejemplo. Otras fuentes y formas de análisis, como la propia información de estado y rendimiento de los elementos de red, Twitter con procesamiento de lenguaje o análisis de sentimiento, otros estudios meteorológicos, topográficos y geomorfológicos, etc. pueden completar este tipo de estudios.

Aún así, con este análisis seguimos comprobando el gran potencial que estos datos tienen en este tipo de servicios dedicados al bien social. Datos que nos ayuden a mejorar, a ayudar y a prevenir en la medida de lo posible los efectos de estas catástrofes.


No comments:

Post a Comment