Como calcular a variância nas estatísticas

Índice:

Anonim

Um dos conceitos mais básicos em estatística é a média, ou média aritmética, de um conjunto de números. A média significa um valor central para o conjunto de dados. o variância de um conjunto de dados mede até que ponto os elementos desse conjunto de dados estão espalhados a partir da média. Os conjuntos de dados em que os números estão todos próximos da média terão uma variação baixa. Os conjuntos em que os números são muito mais altos ou mais baixos que a média terão uma alta variância.

Calcular a média do conjunto de dados

Calcular diferenças quadradas

A próxima etapa envolve calcular a diferença entre cada elemento no conjunto de dados e a média. Como alguns elementos serão mais altos que a média e outros serão menores, o cálculo da variância usa o quadrado das diferenças.

Dia 1 Vendas - Vendas Médias: $ 62.000 - $ 65414.29 = (- $ 3.414,29); (-3.414,29)2 = 11,657,346.94

Dia 2 Vendas - Vendas Médias: $ 64.800 - $ 65414.29 = (- $ 614.29); (-614,29)2 = 377,346.94

Dia 3 Vendas - Vendas Médias: $ 62.600 - $ 65414.29 = (- $ 2.814,29); (-2.814,29)2 = 7,920,204.08

Dia 4 Vendas - Vendas Médias: $ 69.200 - $ 65414.29 = (+ $ 3.785,71); (+3.785,71)2 = 14,331,632.65

Dia 5 Vendas - Vendas Médias: $ 66.000 - $ 65414.29 = (+ $ 585.71); (+585,71)2 = 343,061.22

Dia 6 Vendas - Vendas Médias: $ 63.900 - $ 65414.29 = (- $ 1.514,29); (-1.514,29)2 = 2,293,061.22

Dia 7 Vendas - Vendas Médias: $ 69.400 - $ 65414.29 = (+ $ 3.985,71); (+3,985.71)2 = 15,885,918.37

NOTA: As diferenças quadradas não são medidas em dólares. Esses números são usados ​​na próxima etapa para calcular a variação.

Variação e Desvio Padrão

A variância é definida como a média das diferenças ao quadrado.

11,657,346.94 + 377,346.94 + 7,920,204.08 + 14,331,632.65 + 343,061.22 + 2,293,061.22 + 15,885,918.37 = 52,808,571.43

52,808,571.43/7 = 7,544,081.63

Como a variância usa o quadrado da diferença, a raiz quadrada da variância dará uma indicação mais clara do spread real. Nas estatísticas, a raiz quadrada da variância é chamada de desvio padrão.

SQRT (7.544.081,63) = US $ 2.746,65

Usos para desvio e desvio padrão

Tanto a variância quanto o desvio padrão são altamente úteis na análise estatística. A variância mede o spread global de um conjunto de dados a partir da média. O desvio padrão ajuda na detecção outliersou elementos do conjunto de dados que se afastam muito da média.

No conjunto de dados acima, a variação é bastante alta, com apenas dois totais de vendas diárias chegando a US $ 1.000 da média. O conjunto de dados também mostra que dois dos sete totais de vendas diárias são mais de um desvio padrão acima da média, enquanto outros dois são mais do que um desvio padrão abaixo da média.