Analizamos el COVID19 con R

Podemos analizar los datos mundiales de casos reportados para la enfermedad por coronavirus (CoViD-19) del repositorio del Centro de Ciencias e Ingeniería de Sistemas de la Universidad Johns Hopkins (JHU CSSE) https://github.com/CSSEGISandData/COVID -19

Los conjuntos de datos están disponibles en dos modalidades, como secuencias de series de tiempo y según el estado de la persona (confirmado, fallecido o recuperado).

Gracias a este paquete tenemos disponibles varias funciones de análisis, visualización y modelado que nos permitirán calcular y visualizar el número total de casos, el número total de cambios y la tasa de crecimiento a nivel mundial o para una ubicación geográfica específica.

Incluso tenemos para generar el modelo Susceptible-Infected-Recovered (SIR) para la propagación de la enfermedad. (beta)

Un fantástico recurso implementado en librería de R para poder trabajar en clase con datos completamente actualizados y modelos ya prediseñados, con simples líneas de código nos permitirá estudiar los datos de una forma sencilla y visual.

Después de esta breve introducción de cómo funciona esta librería os quiero añadir en este articulo algunos comandos y funcionalidades para verlo de una forma mucho más práctica.

Instalamos la librería en nuestro entorno de R

Install.packages(“covid19.analytics”)

Cargamos la librería para poder usarla

library(covid19.analytics)

Ahora ya que estamos listos podemos empezar a usar los datos.

La función covid19.data () permite a los usuarios obtener datos en tiempo real sobre los casos notificados por CoViD19 del repositorio CCSE de la JHU, en las siguientes modalidades:

«aggregated» para el último día, con una gran ‘granularidad’ de regiones geográficas (es decir, ciudades, provincias, estados, países)

«time series» para regiones geográficas acumuladas más grandes (provincias / países)

«deprecated»: también incluimos el estilo de datos original en el que se informaron inicialmente estos conjuntos de datos.

Los conjuntos de datos también incluyen información sobre las diferentes categorías (estado) «confirmado» / «defunciones» / «recuperado» de los casos reportados diariamente por país / región / ciudad.

Ejemplo

#obtenemos en “data” todos los datos actuales del COVID19 en todas las ciudades registradas

data <- covid19.data()

View(data)

Vamos a obtener por secuencia de tiempo todos los datos confirmados por COVID19

data_c <- covid19.data(case="ts-confirmed")

View(data_c)

Recordar que podemos jugar con estas secuencias de tiempo y los diferentes estados.

Time Series data
ts-confirmed	Datos confirmados
ts-deaths	Datos de fallecidos
ts-recovered	Datos de recuperados
ts-ALL	Datos combinados

Una función rápida para ver los casos principales por región para series de tiempo y registros agregados

report.summary ()

Ejemplo de España

report.summary(geo.loc="Spain")

Comparamos las dos ciudades primeras de USA

report.summary(Nentries=2, geo.loc="US")

Podemos sacar los totales confirmados por región a lo largo de una línea de tiempo

data_c <- covid19.data(case="ts-confirmed")

tots.per.location(data_c, geo.loc = "US")

Ratio de crecimiento en Italia de los casos de fallecidos.

data_d <- covid19.data(case="ts-deaths")

growth.rate(data_d, geo.loc = "Italy")

Mapas en Vivo

Datos de fallecidos a nivel mundial

data_d <- covid19.data(case="ts-deaths")

live.map(data_d)

Y para terminar este listado de ejemplos podemos usar el comando SIR.model para generar nuestro modelo epidemiológico.

#SIR

data_c <- covid19.data(case="ts-confirmed")

generate.SIR.model(data_c, "Spain", tot.population = 46490000)

Con este pequeño articulo de ayuda os he querido mostrar esta útil librería donde de una manera sencilla y sin tener grandes conocimientos de R podemos generar interesantes modelos de datos.