[ editar artigo]

ANÁLISE DE DADOS - O GRÁFICO BOX-PLOT

ANÁLISE DE DADOS - O GRÁFICO BOX-PLOT

 

O gráfico de box-plot foi criado pelo estatístico John Tukey há quase 50 anos, e é usado até hoje nos dando uma clareza da distribuição dos dados numéricos, resumidos em cinco números: mínimo, primeiro quartil, mediana, terceiro quartil, e máximo. Esses valores são calculados ordenando primeiramente a amostra do menor para o maior. Veja a amostra de dez números abaixo:

No caso de uma amostra com quantidade pares de números, tiramos a média dos números centrais para encontrar a mediana, caso a amostra tivesse quantidade ímpar, a mediana é o próprio elemento central, depois da ordenação. A mediana é o valor que separa a amostra em 50% acima desse número e 50% abaixo desse número. No caso do primeiro quartil 25% da amostra está abaixo dele e 75% acima, já o terceiro quartil 75% abaixo dele e 25% acima. O valor máximo e mínimo obedecem a fórmula apresentada abaixo ao lado deles, valores que superam são chamados de outliers (valores atípicos que as vezes podem ser originados de erros de digitação ou sistêmicos).

 

                Quartis são valores que dividem a amostra em quatro partes iguais

Vamos praticar a interpretação desse gráfico?

Vamos supor que este seja um gráfico altura x gênero, veja que dos 50% abaixo da mediana no caso do gênero feminino as observações não variam tanto, ao contrário dos 50% acima da mediana. Já no caso do gênero masculino, a situação inverte temos pouca variabilidade nos 50% acima da mediana e alta variabilidade nos 50% abaixo da mediana.

 

 

COMUNIDADE CEO DO FUTURO
Zhang Yi Ling
Zhang Yi Ling Seguir

Chinês, estatístico, cientista de dados, coach, escritor, apaixonado por educação, curioso, audaz, determinado, trabalha com os números, mas gosta das pessoas ;) #sevocepodesonharvocepoderealizar

Ler conteúdo completo
Indicados para você