Em 1973, o estatístico Francis Anscombe quis provar que não basta apenas fazer cálculos numéricos, é preciso visualizar os dados antes de analisá-los. Para isso ele criou quatro conjunto de dados de onze pontos que possuem estatísticas descritivas idênticas, mas que têm distribuições muito diferentes e aparências muito distintas quando exibidos graficamente.
O conjunto de dados
Calculando as estatísticas básicas, parece que os quatro conjuntos de dados possuem o mesmo comportamento.
No entanto, é na análise gráfica que percebemos a diferença.
A reta de regressão quando calculada vai ser a mesma para os quatro conjuntos de dados e o coeficiente de determinação linear também. Esse resultado deixo para vocês calcularem, a partir da base de dados já citada acima, e fica a reflexão sobre se os dados devem se ajustar ao modelo ou o modelo que deve se ajustar ao dados?