Что такое надежность в статистике?

В статистикатермин «устойчивый» или «устойчивый» относится к силе статистической модели, тестов и процедур в соответствии с конкретными условиями статистического анализа, которые надеются достичь в исследовании. Учитывая, что эти условия исследования выполняются, модели могут быть проверены, чтобы быть верным с помощью математических доказательств.

Многие модели основаны на идеальных ситуациях, которых не существует при работе с реальными данными, и, как следствие, модель может давать правильные результаты, даже если условия не выполняются точно.

Таким образом, надежная статистика - это любая статистика, которая дает хорошую производительность, когда данные берутся из широкого диапазона распределения вероятностей, на которые в основном не влияют выбросы или небольшие отклонения от модельных допущений в данном набор данных. Другими словами, надежная статистика устойчива к ошибкам в результатах.

Один из способов соблюдения общепринятой надежной статистической процедуры состоит в том, чтобы смотреть не дальше, чем на t-процедуры, которые используют гипотезы для определения наиболее точных статистических прогнозов.

instagram viewer

Соблюдение Т-процедур

Для примера надежности мы рассмотрим T-процедуры, которые включают в себя доверительный интервал для среднего значения с неизвестным стандартным отклонением, а также для проверки гипотез о среднем значении.

Использование t-Процедура предполагает следующее:

Набор данных, с которыми мы работаем, является простая случайная выборка населения.
Население, из которого мы отобрали, обычно распределяется.

На практике с примерами из реальной жизни статистики редко имеют население, которое обычно распределяется, поэтому вместо этого возникает вопрос: «Насколько устойчивы наши t-процедуры?»

В общем случае условие, что мы имеем простую случайную выборку, является более важным, чем условие, которое мы выбрали из нормально распределенной популяции; Причина этого заключается в том, что центральная предельная теорема обеспечивает распределение выборки, которое приблизительно нормальный - чем больше размер нашей выборки, тем ближе среднее значение выборки к выборке обычный.

Как T-процедуры функционируют как надежная статистика

Так что надежность для T-процедуры зависят от размера выборки и распределения нашей выборки. Соображения для этого включают в себя:

Если размер выборки велик, что означает, что у нас есть 40 или более наблюдений, то t-процедуры могут использоваться даже с искаженными дистрибутивами.
Если размер выборки составляет от 15 до 40, то мы можем использовать t-процедуры для любого фасонного распределения, если только нет выбросов или высокой степени асимметрии.
Если размер выборки меньше 15, то мы можем использовать T- процедуры для данных, которые не имеют выбросов, одного пика и почти симметричны.

В большинстве случаев надежность была установлена посредством технических работ в математической статистике, и, К счастью, нам не обязательно делать эти сложные математические вычисления, чтобы правильно использовать их; нам нужно только понять, каковы общие рекомендации по надежности нашего конкретного статистического метода.

T-процедуры функционируют как надежные статистические данные, потому что они обычно дают хорошую производительность для этих моделей, учитывая размер выборки в основе для применения процедуры.