Как рассчитать погрешность

Много раз политические опросы и другие приложения статистики излагать свои результаты с погрешностью. Нередко можно увидеть, что в опросе общественного мнения утверждается, что у определенного процента респондентов есть поддержка вопроса или кандидата, плюс и минус определенный процент. Именно этот плюс и минус является пределом погрешности. Но как рассчитывается предел погрешности? Для простая случайная выборка Для достаточно большой популяции допустимая погрешность или ошибка на самом деле является лишь повторным подтверждением размера выборки и уровня используемой достоверности.

Формула для погрешности

В дальнейшем мы будем использовать формулу для погрешности. Мы планируем наихудший возможный случай, в котором мы не знаем, каков истинный уровень поддержки в наших опросах. Если бы у нас было какое-то представление об этом числе, возможно, благодаря предыдущим данным опроса, мы бы получили меньшую погрешность.

Формула, которую мы будем использовать: Е = Z_α/2/ (2√ n)

Уровень доверия

Первая часть информации, которую мы должны рассчитать для погрешности, - это определить, какой уровень доверия нам нужен. Это число может быть любым процентом менее 100%, но наиболее распространенными уровнями доверия являются 90%, 95% и 99%. Из этих трех 95% уровень используется наиболее часто.

instagram viewer

Если мы вычтем уровень достоверности из единицы, то получим значение альфа, записанное как α, необходимое для формулы.

Критическая ценность

Следующий шаг в расчете запаса или ошибки - найти соответствующее критическое значение. На это указывает термин Z_α/2 в приведенной выше формуле. Поскольку мы предположили простую случайную выборку большой популяции, мы можем использовать стандартное нормальное распределение из Z-scores.

Предположим, что мы работаем с уровнем уверенности 95%. Мы хотим посмотреть Z-Гол г *для которого область между -z * и z * составляет 0,95. Из таблицы видно, что это критическое значение составляет 1,96.

Мы могли бы также найти критическое значение следующим образом. Если мы думаем в терминах α / 2, так как α = 1 - 0,95 = 0,05, мы видим, что α / 2 = 0,025. Теперь мы ищем таблицу, чтобы найти Zпо шкале справа от 0,025. В итоге мы получили бы такое же критическое значение 1,96.

Другие уровни доверия дадут нам другие критические значения. Чем выше уровень доверия, тем выше будет критическое значение. Критическое значение для уровня достоверности 90% с соответствующим значением 0,10 составляет 1,64. Критическое значение для уровня достоверности 99% с соответствующим значением 0,01 составляет 2,54.

Размер образца

Единственное другое число, которое нам нужно использовать формулу для расчета предел погрешности это размер образца, обозначается N в формуле. Затем мы берем квадратный корень из этого числа.

Из-за расположения этого числа в приведенной выше формуле, чем больше размер образца что мы используем, тем меньше будет погрешность. Поэтому большие образцы предпочтительнее, чем маленькие. Однако, поскольку для статистической выборки требуются ресурсы времени и денег, существуют ограничения на то, насколько мы можем увеличить размер выборки. Наличие квадратного корня в формуле означает, что увеличение размера выборки в четыре раза приведет только к половине погрешности.

Несколько примеров

Чтобы понять формулу, давайте рассмотрим несколько примеров.

Какова погрешность для простой случайной выборки из 900 человек при 95%уровень доверия?
Используя таблицу, мы имеем критическое значение 1,96, и, таким образом, погрешность составляет 1,96 / (2 √ 900 = 0,03267, или около 3,3%.
Каков предел погрешности для простой случайной выборки из 1600 человек с уровнем достоверности 95%?
На том же уровне уверенность В качестве первого примера увеличение размера выборки до 1600 дает нам погрешность 0,0245 или около 2,5%.