Análise exploratória: Torture os dados até que eles confessem

Análise exploratória: Torture os dados até que eles confessem

A estatística é a ciência que busca através de análises tirar “insights” e soluções dos bancos de dados. Por exemplo: empresas utilizam de métodos estatísticos para coletar informações relevantes para formular o seu planejamento financeiro.

Tais análises são feitas das mais diversas formas, se utilizando os mais diversos tipos de gráficos e testes com o intuito de se extrair qualquer informação.

Análise descritiva X Análise exploratória

Embora parecidas as análises descritivas e exploratórias possuem objetivos diferentes, a primeira servindo para entender a natureza dos dados (média, moda, mediana) enquanto a análise exploratória está ligada com a tomada de decisões (achando correlações entre variáveis, classificando as variáveis, etc…).

Como é feita a análise?

As análises são feitas em softwares designados (Python, R, Power BI, Excel, etc…) seguindo o padrão:

1. Organizando os dados

Criando tabelas para uma visualização melhor dos dados, separando as variáveis entre qualitativas e quantitativas. Dessa forma os dados ficam “prontos” para serem tratados.

2. Verificar se há ausência de dados faltantes

Chegar se existe dados faltantes.

3. Fazendo uma análise individual de cada variável

Realizar todo tipo de análise possível com cada uma das variáveis (calcular média , moda, mediana, desvio padrão) afim de achar um “insight” da variável em questão.

4. Estudando o comportamento das variáveis em conjunto

Aqui o assunto fica realmente denso devido a variedade de opções disponíveis, e saber qual tipo de gráfico ou qual teste ser usado é de extrema importância. O primeiro fator a ser levado em consideração é a natureza das variáveis que vão ser estudadas. (No caso se são quantitativas ou qualitativas; sem contar as sub categorias).

Por exemplo ao se analisar duas variáveis quantitativas (Peso x Altura) um gráfico de dispersão é conveniente.

Por outro lado a tabela de contingência é perfeita para duas variáveis qualitativas.

Enfim, são muitas as opções e para cada situação uma análise diferente.

5. Identificar padrões e relações entre as variáveis

Depois dos vários testes realizados, basta olhar atenciosamente para os resultados e ouvir oque eles estão dizendo, mesmo com os gráficos prontos, requer um “bom olho” para perceber alguns detalhes.

6. Tomada de decisão

Agora com os “insights”, se tem uma noção mais ampla da situação permitindo a tomada de decisões corretas.

Autor: Rafael Torres

ESCREVER UM COMENTÁRIO

Enter your keyword