Однофакторный дисперсионный анализ, также известный как ANOVA, дает нам возможность сделать несколько сравнений нескольких групп населения. Вместо того, чтобы делать это попарно, мы можем одновременно рассмотреть все рассматриваемые средства. Чтобы выполнить тест ANOVA, нам нужно сравнить два вида вариаций, вариацию между средними значениями выборки, а также вариацию в каждой из наших выборок.
Мы объединяем все это изменение в одну статистику, называемуюF статистика, потому что она использует F-распределение. Мы делаем это путем деления вариации между выборками на вариацию внутри каждой выборки. Способ сделать это обычно обрабатывается программным обеспечением, однако есть некоторая ценность в том, чтобы увидеть один такой расчет.
Программное обеспечение делает все это довольно легко, но хорошо знать, что происходит за кулисами. В дальнейшем мы разрабатываем пример ANOVA, следуя шагам, перечисленным выше.
Предположим, у нас есть четыре независимых популяции, которые удовлетворяют условиям для однофакторного ANOVA. Мы хотим проверить нулевую гипотезу
ЧАС0: μ1 = μ2 = μ3 = μ4. Для целей этого примера мы будем использовать выборку размера три из каждой изучаемой популяции. Данные из наших образцов:Теперь рассчитаем сумму квадратов лечения. Здесь мы рассмотрим квадратичные отклонения каждого среднего значения выборки от общего среднего и умножим это число на единицу меньше, чем количество популяций:
Прежде чем перейти к следующему шагу, нам нужны степени свободы. Есть 12 значений данных и четыре образца. Таким образом, число степеней свободы лечения составляет 4 - 1 = 3. Число степеней свободы ошибки составляет 12 - 4 = 8.