COMUNIDADE CEO DO FUTURO
Você procura por
  • em Publicações
  • em Grupos
  • em Usuários
VOLTAR

ANÁLISE DE DADOS - O GRÁFICO BOX-PLOT

ANÁLISE DE DADOS - O GRÁFICO BOX-PLOT
Zhang Yi Ling
jan. 12 - 2 min de leitura
000

 

O gráfico de box-plot foi criado pelo estatístico John Tukey há quase 50 anos, e é usado até hoje nos dando uma clareza da distribuição dos dados numéricos, resumidos em cinco números: mínimo, primeiro quartil, mediana, terceiro quartil, e máximo. Esses valores são calculados ordenando primeiramente a amostra do menor para o maior. Veja a amostra de dez números abaixo:

No caso de uma amostra com quantidade pares de números, tiramos a média dos números centrais para encontrar a mediana, caso a amostra tivesse quantidade ímpar, a mediana é o próprio elemento central, depois da ordenação. A mediana é o valor que separa a amostra em 50% acima desse número e 50% abaixo desse número. No caso do primeiro quartil 25% da amostra está abaixo dele e 75% acima, já o terceiro quartil 75% abaixo dele e 25% acima. O valor máximo e mínimo obedecem a fórmula apresentada abaixo ao lado deles, valores que superam são chamados de outliers (valores atípicos que as vezes podem ser originados de erros de digitação ou sistêmicos).

 

                Quartis são valores que dividem a amostra em quatro partes iguais

Vamos praticar a interpretação desse gráfico?

Vamos supor que este seja um gráfico altura x gênero, veja que dos 50% abaixo da mediana no caso do gênero feminino as observações não variam tanto, ao contrário dos 50% acima da mediana. Já no caso do gênero masculino, a situação inverte temos pouca variabilidade nos 50% acima da mediana e alta variabilidade nos 50% abaixo da mediana.

 

 


Denunciar publicação
    000

    Indicados para você