В статистикатермин «устойчивый» или «устойчивый» относится к силе статистической модели, тестов и процедур в соответствии с конкретными условиями статистического анализа, которые надеются достичь в исследовании. Учитывая, что эти условия исследования выполняются, модели могут быть проверены, чтобы быть верным с помощью математических доказательств.
Многие модели основаны на идеальных ситуациях, которых не существует при работе с реальными данными, и, как следствие, модель может давать правильные результаты, даже если условия не выполняются точно.
Таким образом, надежная статистика - это любая статистика, которая дает хорошую производительность, когда данные берутся из широкого диапазона распределения вероятностей, на которые в основном не влияют выбросы или небольшие отклонения от модельных допущений в данном набор данных. Другими словами, надежная статистика устойчива к ошибкам в результатах.
Один из способов соблюдения общепринятой надежной статистической процедуры состоит в том, чтобы смотреть не дальше, чем на t-процедуры, которые используют гипотезы для определения наиболее точных статистических прогнозов.
Соблюдение Т-процедур
Для примера надежности мы рассмотрим T-процедуры, которые включают в себя доверительный интервал для среднего значения с неизвестным стандартным отклонением, а также для проверки гипотез о среднем значении.
Использование t-Процедура предполагает следующее:
- Набор данных, с которыми мы работаем, является простая случайная выборка населения.
- Население, из которого мы отобрали, обычно распределяется.
На практике с примерами из реальной жизни статистики редко имеют население, которое обычно распределяется, поэтому вместо этого возникает вопрос: «Насколько устойчивы наши t-процедуры?»
В общем случае условие, что мы имеем простую случайную выборку, является более важным, чем условие, которое мы выбрали из нормально распределенной популяции; Причина этого заключается в том, что центральная предельная теорема обеспечивает распределение выборки, которое приблизительно нормальный - чем больше размер нашей выборки, тем ближе среднее значение выборки к выборке обычный.
Как T-процедуры функционируют как надежная статистика
Так что надежность для T-процедуры зависят от размера выборки и распределения нашей выборки. Соображения для этого включают в себя:
- Если размер выборки велик, что означает, что у нас есть 40 или более наблюдений, то t-процедуры могут использоваться даже с искаженными дистрибутивами.
- Если размер выборки составляет от 15 до 40, то мы можем использовать t-процедуры для любого фасонного распределения, если только нет выбросов или высокой степени асимметрии.
- Если размер выборки меньше 15, то мы можем использовать T- процедуры для данных, которые не имеют выбросов, одного пика и почти симметричны.
В большинстве случаев надежность была установлена посредством технических работ в математической статистике, и, К счастью, нам не обязательно делать эти сложные математические вычисления, чтобы правильно использовать их; нам нужно только понять, каковы общие рекомендации по надежности нашего конкретного статистического метода.
T-процедуры функционируют как надежные статистические данные, потому что они обычно дают хорошую производительность для этих моделей, учитывая размер выборки в основе для применения процедуры.