Одним из самых основных понятий в статистике является среднее или среднее арифметическое, из набора чисел. Среднее значение обозначает центральное значение для набора данных. дисперсия набора данных измеряет, насколько далеко элементы этого набора данных распределены от среднего значения. Наборы данных, в которых все числа близки к среднему, будут иметь низкую дисперсию. Те наборы, в которых числа намного выше или ниже среднего, будут иметь высокую дисперсию.
Вычислить среднее из набора данных
Рассчитать квадратичные различия
Следующим шагом является вычисление разницы между каждым элементом в наборе данных и средним значением. Поскольку некоторые элементы будут выше среднего, а некоторые - ниже, при расчете дисперсии используется квадрат разностей.
Продажи в первый день - средние продажи: 62 000 долл. США - 65414,29 долл. США = (- 3 414,29 долл. США); (-3,414.29)2 = 11,657,346.94
Продажи на второй день - средние продажи: $ 64 800- $ 65414,29 = (- $ 614,29); (-614,29)2 = 377,346.94
Продажи на третий день - средние продажи: 62 600 долл. США - 65414,29 долл. США = (- 2 814,29 долл. США); (-2,814.29)2 = 7,920,204.08
Продажи на четвертый день - средние продажи: 69 200 долл. США - 65414,29 долл. США = (+ 3 785,71 долл. США); (+3,785.71)2 = 14,331,632.65
Продажи в день 5 - средние продажи: 66 000 долл. США - 65414,29 долл. США = (+ 585,71 долл. США); (585,71)2 = 343,061.22
Продажи на шестой день - средние продажи: 63 900 долл. США - 65414,29 долл. США = (- 1 514,29 долл. США); (-1,514.29)2 = 2,293,061.22
Продажи в день 7 - средние продажи: 69 400 долл. США - 65414,29 долл. США = (+ 3 985,71 долл. США); (+3,985.71)2 = 15,885,918.37
НОТА: Разница в квадрате не измеряется в долларах. Эти числа используются на следующем шаге для расчета дисперсии.
Дисперсия и стандартное отклонение
Дисперсия определяется как среднее от квадратов разностей.
11,657,346.94 + 377,346.94 + 7,920,204.08 + 14,331,632.65 + 343,061.22 + 2,293,061.22 + 15,885,918.37 = 52,808,571.43
52,808,571.43/7 = 7,544,081.63
Поскольку дисперсия использует квадрат разности, квадратный корень дисперсии даст более четкое представление о фактическом спреде. В статистике квадратный корень дисперсии называется стандартное отклонение.
SQRT (7 544 081,63) = 2 746,65 долл. США
Использует для отклонения и стандартного отклонения
Как дисперсия, так и стандартное отклонение очень полезны в статистическом анализе. Дисперсия измеряет общий разброс набора данных от среднего значения. Стандартное отклонение помогает в обнаружении останцыили элементы набора данных, которые отклоняются от среднего значения.
В приведенных выше данных разница довольно высока, и только два ежедневных общих объема продаж находятся в пределах 1000 долларов от среднего значения. Набор данных также показывает, что два из семи ежедневных итогов продаж более чем на одно стандартное отклонение выше среднего, в то время как два других - более чем на одно стандартное отклонение ниже среднего.