Как найти степени свободы в статистике

Многие проблемы статистического вывода требуют от нас найти число степени свободы. Количество степеней свободы выбирает один распределение вероятностей из бесконечно многих. Этот шаг часто упускается из виду, но важная деталь при расчетедоверительные интервалы и работа проверка гипотез.

Не существует единой общей формулы для числа степеней свободы. Тем не менее, существуют определенные формулы, используемые для каждого типа процедур в логической статистике. Другими словами, среда, в которой мы работаем, будет определять количество степеней свободы. Ниже приведен частичный список некоторых из наиболее распространенных процедур вывода, а также количество степеней свободы, которые используются в каждой ситуации.

Стандартное нормальное распределение

Процедуры с участием стандартное нормальное распределение перечислены для полноты и прояснения некоторых заблуждений. Эти процедуры не требуют от нас определения количества степеней свободы. Причина этого в том, что существует единое стандартное нормальное распределение. Эти типы процедур охватывают процедуры с участием среднего по населению, когда стандартное отклонение населения уже известно, а также процедуры, касающиеся пропорций населения.

instagram viewer

Один образец T процедур

Иногда статистическая практика требует от нас использования t-распределения Стьюдента. Для этих процедур, таких как те, которые имеют дело со средним значением популяции с неизвестным стандартным отклонением, число степеней свободы на единицу меньше размера выборки. Таким образом, если размер выборки Nто есть N - 1 степень свободы.

T процедуры с парными данными

Много раз имеет смысл обрабатывать данные как парные. Сопряжение обычно выполняется из-за связи между первым и вторым значением в нашей паре. Много раз мы соединялись до и после измерений. Наша выборка парных данных не является независимой; однако разница между каждой парой не зависит. Таким образом, если образец имеет в общей сложности N пары точек данных, (всего 2N значения), то есть N - 1 степень свободы.

T Процедуры для двух независимых групп населения

Для этих типов проблем мы все еще используем распределение Стьюдента. На этот раз есть образец от каждой из наших групп населения. Хотя желательно, чтобы эти две выборки были одинакового размера, это не обязательно для наших статистических процедур. Таким образом, мы можем иметь два образца размера N1 и N2. Есть два способа определения количества степеней свободы. Более точный метод заключается в использовании формулы Уэлча, вычислительно громоздкой формулы, включающей размеры выборки и стандартные отклонения выборки. Другой подход, называемый консервативным приближением, может использоваться для быстрой оценки степеней свободы. Это просто меньшее из двух чисел N1 - 1 и N2 - 1.

Хи-квадрат для независимости

Одно использование тест хи-квадрат чтобы увидеть, если две категориальные переменные, каждая с несколькими уровнями, демонстрируют независимость. Информация об этих переменных регистрируется в двухсторонний стол с р строки и с колонны. Количество степеней свободы есть произведение (р - 1)(с - 1).

Хи-квадрат добра

Совершенство хи-квадрат начинается с одной категориальной переменной с общим N уровни. Мы проверяем гипотезу о том, что эта переменная соответствует заранее определенной модели. Количество степеней свободы на единицу меньше количества уровней. Другими словами, есть N - 1 степень свободы.

Один фактор ANOVA

Один фактор дисперсионный анализ (ANOVA) позволяет проводить сравнения между несколькими группами, устраняя необходимость в множественных парных проверках гипотез. Поскольку тест требует от нас измерения как вариаций между несколькими группами, так и вариаций внутри каждой группы, мы получаем две степени свободы. F-статистика, который используется для одного фактора ANOVA, является дробью. Числитель и знаменатель имеют степень свободы. Позволять с быть количество групп и N общее количество значений данных. Количество степеней свободы для числителя на единицу меньше количества групп, или с - 1. Число степеней свободы для знаменателя - это общее количество значений данных за вычетом количества групп или N - с.

Ясно, что мы должны быть очень осторожны, чтобы знать, с какой процедурой вывода мы работаем. Эти знания сообщат нам о правильном количестве степеней свободы использования.

instagram story viewer