Как рассчитать остаточную дисперсию

Оглавление:

Anonim

Инвесторы используют модели движения цен на активы, чтобы предсказать, где цена инвестиции будет в любой момент времени. Методы, используемые для создания этих прогнозов, являются частью поля статистики, известного как регрессивный анализ, Расчет остаточная дисперсия набора значений - это инструмент регрессионного анализа, который измеряет, насколько точно прогнозы модели соответствуют фактическим значениям.

Линия регрессии

линия регрессии показывает, как изменилась стоимость актива из-за изменений в различных переменных. Также известный как линия трендалиния регрессии отображает «тренд» цены актива. Линия регрессии представлена ​​линейным уравнением:

Y = a + bX

где "Y" - это стоимость актива, "a" - это константа, "b" - это множитель, а "X" - это переменная, связанная со стоимостью актива.

Например, если модель предсказывает, что дом с одной спальней продается за 300 000 долларов, дом с двумя спальнями продается за 400 000 долларов, а дом с тремя спальнями продается за 500 000 долларов, линия регрессии будет выглядеть следующим образом:

Y = 200 000 + 100 000X

где «Y» - цена продажи дома, а «X» - количество спален.

Y = 200 000 + 100 000 (1) = 300 000

Y = 200 000 + 100 000 (2) = 400 000

Y = 200 000 + 100 000 (3) = 500 000

разброс точек

рассеивания показывает точки, которые представляют фактические корреляции между стоимостью актива и переменной. Термин «график рассеяния» происходит от того факта, что, когда эти точки изображены на графике, они кажутся «разбросанными» вокруг, а не лежат идеально на линии регрессии. Используя приведенный выше пример, мы могли бы получить диаграмму рассеяния с этими точками данных:

Точка 1: 1BR продан за $ 288 000

Точка 2: 1BR продан за $ 315 000

Точка 3: 2BR продано за $ 395 000

Точка 4: 2BR продано за 410 000 долларов

Точка 5: 3BR продано за 492 000 долларов

Пункт 6: 3BR продано за 507 000 долларов

Расчет остаточной дисперсии

Расчет остаточной дисперсии начинается с сумма квадратов различий между стоимостью актива на линии регрессии и каждой соответствующей стоимостью актива на диаграмме рассеяния.

Квадраты различий показаны здесь:

Пункт 1: 288 000 долл. США - 300 000 долл. США = (- 12 000 долл. США); (-12000)2 = 144,000,000

Пункт 2: 315 000–300 000 долл. США = (+ 15 000 долл. США); (+15000)2 = 225,000,000

Пункт 3: 395 000 долл. США - 400 000 долл. США = (- 5 000 долл. США); (-5000)2 = 25,000,000

Пункт 4: 410 000 долл. США - 400 000 долл. США = (+ 10 000 долл. США); (+10000)2 = 100,000,000

Пункт 5: 492 000–500 000 долл. США = (- 8 000 долл. США); (-8000)2 = 64,000,000

Пункт 6: 507 000–500 000 долл. США = (+ 7 000 долл. США); (7000)2 = 49,000,000

Сумма квадратов = 607 000 000

Остаточную дисперсию можно найти, взяв сумму квадратов и разделив ее на (n-2), где «n» - количество точек данных на диаграмме рассеяния.

RV = 607 000 000 / (6-2) = 607 000 000/4 = 151 750 000.

Использует для остаточной дисперсии

Хотя каждая точка на диаграмме рассеяния не будет идеально совмещаться с линией регрессии, стабильная модель будет иметь точки рассеяния в регулярном распределении вокруг линии регрессии. Остаточная дисперсия также известна как «ошибка дисперсии». Высокая остаточная дисперсия показывает, что линия регрессии в исходной модели может быть ошибочной. Некоторые функции электронных таблиц могут показать процесс создания линии регрессии, которая ближе соответствует данным диаграммы рассеяния.