Пример начальной загрузки в статистике

Бутстрапирование это мощный статистический метод. Это особенно полезно, когда образец Размер, с которым мы работаем, мал. При обычных обстоятельствах размер выборки менее 40 не может быть решен, если предположить нормальное распределение или т распределение. Методы начальной загрузки довольно хорошо работают с образцами, которые содержат менее 40 элементов. Причина этого заключается в том, что при начальной загрузке происходит повторная выборка. Эти методы не предполагают ничего распределение наших данных.

Начальная загрузка стала более популярной, поскольку вычислительные ресурсы стали более доступными. Это потому, что для того, чтобы начальная загрузка была практичной, необходимо использовать компьютер. Как это работает, мы увидим в следующем примере начальной загрузки.

Мы начинаем с статистическая выборка от населения, о котором мы ничего не знаем. Нашей целью будет 90% доверительный интервал относительно среднего значения выборки. Хотя другие статистические методы, используемые для определения

instagram viewer
доверительные интервалы Предположим, что мы знаем среднее или стандартное отклонение нашей популяции, для начальной загрузки не требуется ничего, кроме выборки.

Для целей нашего примера мы будем предполагать, что выборка составляет 1, 2, 4, 4, 10.

Теперь мы делаем повторную выборку с заменой из нашей выборки, чтобы сформировать так называемые образцы начальной загрузки. Каждый образец начальной загрузки будет иметь размер пять, как и наш оригинальный образец. Так как мы выбираем случайным образом, а затем заменяем каждое значение, образцы начальной загрузки могут отличаться от исходного образца и друг от друга.

Для примеров, с которыми мы столкнемся в реальном мире, мы сделаем эту повторную выборку сотни, если не тысячи раз. Ниже мы увидим пример из 20 примеров начальной загрузки:

Поскольку мы используем начальную загрузку для вычисления доверительного интервала для среднего значения популяции, мы теперь вычисляем средние значения для каждой из наших выборок начальной загрузки. Эти средства, расположенные в порядке возрастания: 2, 2,4, 2,6, 2,6, 2,8, 3, 3, 3,2, 3,4, 3,6, 3,8, 4, 4, 4,2, 4,6, 5,2, 6, 6, 6,6, 7,6.

Теперь мы получаем из нашего списка начальной загрузки образца доверительный интервал. Поскольку мы хотим, чтобы доверительный интервал составлял 90%, мы используем 95-й и 5-й процентили в качестве конечных точек интервалов. Причиной этого является то, что мы разделили 100% - 90% = 10% пополам, так что у нас будут средние 90% всех средних значений начальной загрузки.

instagram story viewer