Определение надежности в исследованиях

Надежность - это степень, в которой измерительный прибор выдает одни и те же результаты каждый раз, когда его используют, при условии, что базовая измеряемая вещь не изменяется.

Ключевые выводы: надежность

Если измерительный прибор выдает подобные результаты каждый раз, когда его используют (при условии, что измеряемое остается неизменным во времени), говорят, что он обладает высокой надежностью.
Хорошие измерительные приборы должны иметь как высокую надежность, так и высокую точность.
Четыре метода, которые социологи могут использовать для оценки надежности: процедура повторного тестирования, процедура альтернативных форм, процедура разбиения пополам и процедура внутренней согласованности.

Пример

Представьте, что вы пытаетесь оценить надежность термометра в вашем доме. Если температура в комнате остается неизменной, надежный термометр всегда будет показывать одно и то же значение. Термометр, которому не хватает надежности, может меняться, даже если температура не меняется. Обратите внимание, однако, что термометр не должен быть точным, чтобы быть надежным. Например, он всегда может регистрироваться на три градуса выше. Его степень надежности связана с предсказуемостью его отношений с тем, что тестируется.

instagram viewer

Методы оценки надежности

Для оценки надежности измеряемая вещь должна измеряться более одного раза. Например, если вы хотите измерить длину дивана, чтобы убедиться, что он подходит к двери, вы можете измерить его дважды. Если вы получаете идентичные измерения дважды, вы можете быть уверены, что вы измерили надежно.

Существует четыре процедуры для оценки надежности теста. (Здесь термин «тест» относится к группе утверждений в вопроснике, количественный или качественный оценка или комбинация двух.)

Процедура тест-повторного тестирования

Здесь один и тот же тест дается два или более раз. Например, вы могли бы создать анкету с набором из десяти заявлений для оценки доверия. Эти десять утверждений затем даются субъекту дважды в два разных времени. Если респондент дает одинаковые ответы оба раза, вы можете предположить, что вопросы надежно оценили ответы субъекта.

Одним из преимуществ этого метода является то, что для этой процедуры необходимо разработать только один тест. Однако есть несколько недостатков в процедуре повторного тестирования. Между тестированием могут происходить события, которые влияют на ответы респондентов; ответы могут меняться со временем просто потому, что люди меняются и растут со временем; и субъект может приспособиться к тесту во второй раз, более глубоко подумать о вопросах и переоценить их ответы. Например, в приведенном выше примере некоторые респонденты могли бы стать более уверенными в второй сеанс тестирования, который затруднит интерпретацию результатов теста-ретеста процедура.

Процедура альтернативных форм

В процедуре альтернативных форм (также называется надежность параллельных форм), даны два теста. Например, вы можете создать два набора из пяти операторов, измеряющих достоверность. Испытуемым будет предложено заполнить каждую из пяти анкет. Если человек дает одинаковые ответы на оба теста, вы можете предположить, что вы надежно измерили концепцию. Одним из преимуществ является то, что репликация будет менее важным фактором, потому что два теста отличаются. Однако важно убедиться, что обе альтернативные версии теста действительно измеряют одно и то же.

Процедура разделения пополам

В этой процедуре один тест дается один раз. Оценка присваивается каждой половине отдельно, а оценки сравниваются по каждой половине. Например, у вас может быть один набор из десяти утверждений в вопроснике для оценки достоверности. Респонденты сдают тест, а затем вопросы делятся на два подэтапа по пять пунктов в каждом. Если счет в первой половине отражает счет во второй половине, можно предположить, что тест достоверно измерил концепцию. С другой стороны, история, созревание и реплика не в игре. Однако баллы могут сильно различаться в зависимости от того, как тест делится на две части.

Процедура внутренней согласованности

Здесь один и тот же тест проводится один раз, и оценка основана на среднем сходстве ответов. Например, в вопроснике из десяти утверждений для измерения достоверности каждый ответ можно рассматривать как суб-тест из одного утверждения. Сходство в ответах на каждое из десяти утверждений используется для оценки надежности. Если респондент не отвечает на все десять утверждений одинаковым образом, то можно предположить, что тест не является надежным. Один из способов, которым исследователи могут оценить внутреннюю согласованность, заключается в использовании статистическое программное обеспечение вычислять Альфа Кронбаха.

С процедурой внутренней согласованности история, созревание и репликация не учитываются. Однако количество утверждений в тесте может повлиять на оценку надежности при внутренней оценке.