Como a Estatística ajuda no entendimento do Corona Vírus?
Muitas vezes nos perguntamos como as áreas que estudamos podem ser aplicadas para a “vida real”. Dessa forma, neste artigo explicaremos um pouco sobre o entendimento da covid-19 por meio da estatística.
“Dados são o novo petróleo”
Clive Humby, um matemático londrino especializado em Ciência de Dados, redigiu a frase acima, e com toda a razão. Quem possui dados, possui algo tão valioso quanto o petróleo.
Isso pois existem aproximadamente 7,8 bilhões de pessoas no mundo gerando dados constantemente. E graças a eles, é possível descobrir padrões e desvendar mistérios, de forma que aqueles que sabem fazer o bom uso deles só tendem a ganhar. Assim como o petróleo, tudo tem de ser analisado, transformado e interpretado por pessoas, pois afinal, o petróleo em si é inútil se não for refinado.
A estatística está aí para isso. Ela pode ser uma grande ferramenta para diversos estudos, e um deles, é a análise de epidemias, como o Covid-19, pois há diversos fatores que devem ser considerados a fim de obter uma certa confiabilidade e garantir, com uma certa precisão, a correlação entre eles.
Comparativos:
Para analisarmos melhor o estado em que o Brasil se encontra, podemos utilizar alguns países como base comparativa. Entretanto, devemos considerar países com fatores que sejam parecidos com o nosso, tal como demografia e política. Dois países que satisfazem essas condições, são os Estados Unidos e o Japão.
Essas três nações apresentam um Estado Democrático Liberal, além de características populacionais comparáveis, de forma aproximada, como ilustra a tabela abaixo:
Nota-se que, apesar do Japão possuir uma população absoluta menor que os outros dois territórios, apresenta uma densidade muito maior, deixando a comparação mais justa.
O objetivo dessa publicação seria comparar o Brasil com a situação de um país que conseguiu melhorar o controle da pandemia, e outro que ainda está em fase de transição, e que infelizmente possui dados alarmantes. Utilizamos a linguagem Python para reproduzir os gráficos de linhas apresentados a seguir, que compreendem o intervalo entre os dias 01/01 e 22/06, :
Analisando os dados:
É possível observar que os três países começaram a ter casos confirmados em datas e ritmos distintos. Mesmo o Japão sendo aquele que apresentou o primeiro caso dos três, conseguiu conter o avanço da doença de uma forma eficaz, não deixando ter tantos casos quanto os países da América.
A escala do gráfico é logarítmica. Logo, quanto mais a linha se aproxima de uma reta horizontal, mais os casos estão sendo estabilizados. Sendo assim, o ritmo de crescimento é determinado pela inclinação da curva: quanto mais inclinada, maior o número de casos que o país teve em um menor período de tempo.
Logo, nos meses de Março e Abril, os EUA e o Brasil tiveram uma taxa de crescimento mais acelerada no número de casos. Recentemente, a taxa do país norte americano começou a reduzir. Já no Brasil, continua de forma constante.
Pelo gráfico, no dia 22/06, temos os resultados totais, nos quais os países americanos ficaram com mais de um milhão de casos, e o Japão, com um pouco acima de dez mil.
Separamos outra maneira de visualizar os mesmos dados, contando os casos novos de corona por dia, em cada um dos países:
Como já mencionado, os EUA, no início, apresentou um crescimento mais expressivo, enquanto que o Brasil vem crescendo constantemente e, em alguns momentos, entre maio e junho, vem superando os EUA em casos novos por dia. Vale ressaltar que o nosso país já ultrapassou o pico do país norte americano, alcançando um valor acima dos cinquenta mil. Além disso, não sabemos quando os dois países atingirão o valor máximo por dia.
Nota-se que o Japão já obteve seu maior surto, e não apresentou mais algum crescimento no número de casos diários.
Brasil:
Agora que comparamos o Brasil com outros países vamos entender o impacto do covid-19 por meio da estatística em nosso país, vamos falar da questão interna. Observe o gráfico, feito em linguagem R, e a tabela abaixo:
Pelas informações mencionadas anteriormente, notamos que as regiões com os maiores casos totais são Nordeste e Sudeste, respectivamente.
Segue um mapa, também construído em R, com os casos separados por Estado:
Embora a região Norte seja a terceira região com mais casos totais, vale ressaltar que o Amazonas e o Pará possuem situações preocupantes. Além disso, a região Nordeste superou a Sudeste a partir de Maio. As regiões Sul e Centro-Oeste, com a exceção do Distrito Federal, têm menos de vinte mil casos.