Отбор проб с заменой или без

Статистическая выборка может быть сделано разными способами. В дополнение к типу метода выборки, который мы используем, есть еще один вопрос, касающийся того, что конкретно происходит с человеком, которого мы выбрали случайным образом. Этот вопрос возникает при выборке: «После того, как мы выберем человека и запишем измерение атрибута, который мы изучаем, что мы будем делать с этим человеком?»

Есть два варианта:

  • Мы можем заменить человека обратно в пул, из которого мы отбираем образцы.
  • Мы можем решить не заменять человека.

Мы очень легко видим, что это приводит к двум различным ситуациям. В первом варианте замена оставляет открытой возможность случайного выбора индивидуума во второй раз. По второму варианту, если мы работаем без замены, то невозможно выбрать одного человека дважды. Мы увидим, что эта разница будет влиять на расчет вероятностей, связанных с этими выборками.

Влияние на вероятности

Чтобы увидеть, как обработка замены влияет на вычисление вероятностей, рассмотрим следующий пример вопроса. Какова вероятность получения двух тузов из стандартная колода карт?

instagram viewer

Этот вопрос неоднозначен. Что происходит, когда мы берем первую карту? Положим ли мы его обратно в колоду или оставим?

Начнем с вычисления вероятности с заменой. Всего четыре туза и 52 карты, поэтому вероятность получения одного туза равна 4/52. Если мы заменим эту карту и возьмем снова, то вероятность снова 4/52. Эти события независимы, поэтому мы умножаем вероятности (4/52) x (4/52) = 1/169 или примерно 0,592%.

Теперь мы сравним это с той же ситуацией, за исключением того, что мы не заменяем карты. Вероятность розыгрыша туза в первом розыгрыше все еще 4/52. Для второй карты мы предполагаем, что туз уже разыгран. Теперь мы должны вычислить условную вероятность. Другими словами, нам нужно знать, какова вероятность розыгрыша второго туза, учитывая, что первая карта также является тузом.

На данный момент из 51 карты осталось три туза. Таким образом, условная вероятность второго туза после розыгрыша туза равна 3/51. Вероятность получения двух тузов без замены составляет (4/52) x (3/51) = 1/221 или около 0,425%.

Из вышеприведенной проблемы мы видим, что то, что мы выбираем для замены, имеет отношение к значениям вероятностей. Это может существенно изменить эти значения.

Численность населения

В некоторых ситуациях выборка с заменой или без нее существенно не меняет вероятности. Предположим, что мы случайным образом выбираем двух человек из города с населением 50 000 человек, из которых 30 000 - женщины.

Если мы производим выборку с заменой, то вероятность выбора самки при первом выборе составляет 30000/50000 = 60%. Вероятность женщины на втором выборе все еще 60%. Вероятность того, что оба человека будут женщинами, составляет 0,6 х 0,6 = 0,36.

Если мы производим выборку без замены, то первая вероятность не изменяется. Вторая вероятность теперь 29999/49999 = 0,5999919998..., что очень близко к 60%. Вероятность того, что оба являются женщинами, составляет 0,6 х 0,5999919998 = 0,359995.

Вероятности технически различны, однако они достаточно близки, чтобы быть почти неразличимыми. По этой причине во многих случаях, даже если мы проводим выборку без замены, мы рассматриваем выбор каждого индивидуума так, как будто он не зависит от других индивидуумов в выборке.

Другие приложения

Есть и другие случаи, когда нам нужно рассмотреть, брать ли образцы с заменой или без нее. На примере этого самонастройки. Этот статистический метод подпадает под заголовок метода повторной выборки.

В начальной загрузке мы начнем со статистической выборки населения. Затем мы используем компьютерное программное обеспечение для расчета образцов начальной загрузки. Другими словами, компьютер выполняет повторную выборку с заменой исходной выборки.

instagram story viewer