Что такое распределение выборки?

Статистическая выборка довольно часто используется в статистике. В этом процессе мы стремимся определить что-то о населении. Поскольку популяции обычно большие по размеру, мы формируем статистическую выборку, выбирая подмножество популяции заранее определенного размера. Изучая выборку, мы можем использовать логическую статистику, чтобы определить что-то о населении

Статистическая выборка размера N включает в себя одну группу N люди или предметы, которые были случайно выбраны из населения. С концепцией статистической выборки тесно связано распределение выборки.

Происхождение выборочных распределений

Распределение выборки происходит, когда мы формируем более одного простая случайная выборка того же размера из данного населения. Эти образцы считаются независимыми друг от друга. Таким образом, если человек находится в одной выборке, то он имеет такую ​​же вероятность оказаться в следующей выборке.

Мы рассчитываем конкретную статистику для каждого образца. Это может быть образец жадный, выборочная дисперсия или выборочная пропорция. Поскольку статистика зависит от имеющейся у нас выборки, каждая выборка, как правило, дает различное значение для статистики, представляющей интерес. Диапазон полученных значений - это то, что дает нам распределение выборки.

instagram viewer

Распределение выборки для средств

Для примера рассмотрим распределение выборки для среднего значения. Среднее значение популяции - это параметр, который обычно неизвестен. Если мы выбираем выборку размером 100, то среднее значение этой выборки легко вычисляется путем сложения всех значений вместе, а затем деления на общее количество точек данных, в данном случае 100. Один образец размером 100 может дать нам среднее значение 50. Другой такой образец может иметь среднее значение 49. Еще 51 и другой образец могут иметь среднее значение 50,5.

Распределение этих выборочных средств дает нам выборочное распределение. Мы хотели бы рассмотреть больше, чем просто четыре примера средства, как мы сделали выше. При наличии еще нескольких выборочных средств у нас будет хорошее представление о форме распределения выборки.

Почему мы заботимся?

Распределения выборки могут показаться довольно абстрактными и теоретическими. Тем не менее, есть некоторые очень важные последствия от их использования. Одним из основных преимуществ является то, что мы устраняем изменчивость, которая присутствует в статистике.

Например, предположим, что мы начинаем с совокупности со средним значением μ и стандартным отклонением σ. Стандартное отклонение дает нам оценку того, насколько распределено распределение. Мы сравним это с распределением выборки, полученным путем формирования простых случайных выборок размером N. Распределение выборки среднего по-прежнему будет иметь среднее значение μ, но стандартное отклонение отличается. Стандартное отклонение для распределения выборки становится σ / √ N.

Таким образом, мы имеем следующее

  • Размер выборки 4 позволяет нам иметь распределение выборки со стандартным отклонением σ / 2.
  • Размер выборки 9 позволяет нам иметь распределение выборки со стандартным отклонением σ / 3.
  • Размер выборки 25 позволяет нам иметь распределение выборки со стандартным отклонением σ / 5.
  • Размер выборки 100 позволяет нам иметь распределение выборки со стандартным отклонением σ / 10.

На практике

В практике статистики мы редко формируем выборочные распределения. Вместо этого мы рассматриваем статистику, полученную из простой случайной выборки размера N как если бы они были одной точкой на соответствующем распределении выборки. Это еще раз подчеркивает, почему мы хотим иметь относительно большие размеры выборки. Чем больше размер выборки, тем меньше вариаций мы получим в нашей статистике.

Обратите внимание, что кроме центра и спреда, мы не можем ничего сказать о форме нашего распределения выборки. Оказывается, что в некоторых довольно широких условиях Центральная предельная теорема можно применить, чтобы рассказать нам нечто удивительное о форме распределения выборки.

instagram story viewer