Como calcular a variância residual

Índice:

Anonim

Os investidores usam modelos do movimento de preços de ativos para prever onde o preço de um investimento será em determinado momento. Os métodos usados ​​para fazer essas previsões são parte de um campo em estatística conhecido como análise de regressão. O cálculo do variância residual de um conjunto de valores é uma ferramenta de análise de regressão que mede com que precisão as previsões do modelo correspondem aos valores reais.

Linha de regressão

o linha de regressão mostra como o valor do ativo mudou devido a mudanças em diferentes variáveis. Também conhecido como linha de tendência, a linha de regressão exibe a "tendência" do preço do ativo. A linha de regressão é representada por uma equação linear:

Y = a + bX

onde "Y" é o valor do ativo, "a" é uma constante, "b" é um multiplicador e "X" é uma variável relacionada ao valor do ativo.

Por exemplo, se o modelo prevê que uma casa de um quarto é vendida por US $ 300.000, uma casa de dois quartos é vendida por US $ 400.000 e uma casa de três quartos é vendida por US $ 500.000, a linha de regressão seria:

Y = 200.000 + 100.000X

onde "Y" é o preço de venda da casa e "X" é o número de quartos.

Y = 200.000 + 100.000 (1) = 300.000

Y = 200.000 + 100.000 (2) = 400.000

Y = 200.000 + 100.000 (3) = 500.000

Scatterplot

UMA gráfico de dispersão mostra os pontos que representam as correlações reais entre o valor do ativo e a variável. O termo "gráfico de dispersão" vem do fato de que, quando esses pontos são plotados em um gráfico, eles parecem estar "espalhados" ao invés de estarem perfeitamente na linha de regressão. Usando o exemplo acima, poderíamos ter um gráfico de dispersão com esses pontos de dados:

Ponto 1: 1BR vendido por US $ 288.000

Ponto 2: 1BR vendido por US $ 315.000

Ponto 3: 2BR vendido por US $ 395.000

Ponto 4: 2BR vendido por US $ 410.000

Ponto 5: 3BR vendido por US $ 492.000

Ponto 6: 3BR vendido por US $ 507.000

Cálculo de desvio residual

O cálculo da variância residual começa com o soma dos quadrados de diferenças entre o valor do ativo na linha de regressão e cada valor de ativo correspondente no gráfico de dispersão.

Os quadrados das diferenças são mostrados aqui:

Ponto 1: $ 288.000 - $ 300.000 = (- $ 12.000); (-12.000)2 = 144,000,000

Ponto 2: $ 315.000 - $ 300.000 = (+ $ 15.000); (+15.000)2 = 225,000,000

Ponto 3: $ 395.000 - $ 400.000 = (- $ 5.000); (-5.000)2 = 25,000,000

Ponto 4: $ 410.000 - $ 400.000 = (+ $ 10.000); (+10.000)2 = 100,000,000

Ponto 5: $ 492.000 - $ 500.000 = (- $ 8.000); (-8,000)2 = 64,000,000

Ponto 6: $ 507.000 - $ 500.000 = (+ $ 7.000); (+7,000)2 = 49,000,000

Soma dos quadrados = 607.000.000

A variância residual é encontrada tomando a soma dos quadrados e dividindo-a por (n-2), onde "n" é o número de pontos de dados no gráfico de dispersão.

VR = 607,000,000 / (6-2) = 607,000,000 / 4 = 151,750,000.

Usos para Variação Residual

Embora cada ponto no gráfico de dispersão não esteja alinhado perfeitamente com a linha de regressão, um modelo estável terá os pontos do gráfico de dispersão em uma distribuição regular ao redor da linha de regressão. A variância residual também é conhecida como "variação de erro". Uma alta variância residual mostra que a linha de regressão no modelo original pode estar com erro. Algumas funções de planilha podem mostrar o processo por trás da criação de uma linha de regressão que se encaixa mais de perto com os dados do gráfico de dispersão.