Пример теста перестановки

Один вопрос, который всегда важно задавать в статистика «Является ли наблюдаемый результат только случайностью или статистически значимый?» Один класс проверка гипотез, называемые тестами перестановки, позволяют нам проверить этот вопрос. Обзор и этапы такого теста:

  • Мы разделили наши предметы на контрольную и экспериментальную группу. Нулевая гипотеза состоит в том, что между этими двумя группами нет различий.
  • Применить лечение в экспериментальной группе.
  • Измерьте ответ на лечение
  • Рассмотрим каждую возможную конфигурацию экспериментальной группы и наблюдаемый ответ.
  • Рассчитайте значение p на основе нашего наблюдаемого отклика относительно всех потенциальных экспериментальных групп.

Это схема перестановки. В продолжение этой схемы, мы потратим время на подробное рассмотрение разработанного примера такого теста на перестановку.

пример

Предположим, мы изучаем мышей. В частности, нас интересует, как быстро мыши заканчивают лабиринт, с которым они никогда раньше не сталкивались. Мы хотим предоставить доказательства в пользу экспериментального лечения. Цель состоит в том, чтобы продемонстрировать, что мыши в группе лечения будут решать лабиринт быстрее, чем необработанные мыши.

instagram viewer

Начнем с наших предметов: шесть мышей. Для удобства мышей будем обозначать буквами A, B, C, D, E, F. Три из этих мышей должны быть случайным образом отобраны для экспериментального лечения, а остальные три помещены в контрольную группу, в которой субъекты получают плацебо.

Затем мы случайным образом выберем порядок, в котором мышей выбирают для запуска лабиринта. Время, потраченное на отделку лабиринта для всех мышей, будет отмечено, и будет вычислено среднее значение для каждой группы.

Предположим, что в нашей случайной выборке есть мыши A, C и E в экспериментальной группе, а другие мыши в плацебо контрольная группа. После того, как лечение было осуществлено, мы случайным образом выбираем порядок для мышей, чтобы пройти через лабиринт.

Время выполнения для каждой из мышей:

  • Мышь А запускает гонку за 10 секунд
  • Мышь B запускает гонку за 12 секунд
  • Мышь С запускает гонку за 9 секунд
  • Мышь D запускает гонку за 11 секунд
  • Мышь E запускает гонку за 11 секунд
  • Мышь F запускает гонку за 13 секунд.

Среднее время завершения лабиринта для мышей в экспериментальной группе составляет 10 секунд. Среднее время завершения лабиринта для контрольной группы составляет 12 секунд.

Мы могли бы задать пару вопросов. Действительно ли лечение является причиной более быстрого среднего времени? Или нам просто повезло в выборе контрольной и экспериментальной группы? Лечение, возможно, не имело эффекта, и мы случайным образом выбрали более медленных мышей, чтобы получить плацебо, и более быстрых мышей, чтобы получить лечение. Тест перестановки поможет ответить на эти вопросы.

Гипотезы

Гипотезы для нашего теста перестановки:

  • нулевая гипотеза это утверждение без эффекта. Для этого конкретного теста у нас есть H0Разницы между группами лечения нет. Среднее время запуска лабиринта для всех мышей без обработки такое же, как среднее время для всех мышей с обработкой.
  • Альтернативная гипотеза - это то, что мы пытаемся установить доказательства в пользу. В этом случае мы бы H: Среднее время для всех мышей с обработкой будет быстрее, чем среднее время для всех мышей без обработки.

Перестановки

Всего шесть мышей и три места в экспериментальной группе. Это означает, что количество возможных экспериментальных групп определяется числом комбинаций C (6,3) = 6! / (3! 3!) = 20. Остальные лица будут частью контрольной группы. Таким образом, есть 20 различных способов случайного выбора людей в две группы.

Присвоение A, C и E экспериментальной группе проводилось случайным образом. Поскольку существует 20 таких конфигураций, вероятность того, что конкретная конфигурация с A, C и E в экспериментальной группе имеет вероятность возникновения 1/20 = 5%.

Нам нужно определить все 20 конфигураций экспериментальной группы людей в нашем исследовании.

  1. Экспериментальная группа: A B C и Контрольная группа: D E F
  2. Экспериментальная группа: A B D и Контрольная группа: C E F
  3. Экспериментальная группа: A B E и контрольная группа: C D F
  4. Экспериментальная группа: A B F и Контрольная группа: C D E
  5. Экспериментальная группа: A C D и Контрольная группа: B E F
  6. Экспериментальная группа: A C E и контрольная группа: B D F
  7. Экспериментальная группа: A C F и Контрольная группа: B D E
  8. Экспериментальная группа: A D E и контрольная группа: B C F
  9. Экспериментальная группа: A D F и Контрольная группа: B C E
  10. Экспериментальная группа: A E F и Контрольная группа: B C D
  11. Экспериментальная группа: B C D и контрольная группа: A E F
  12. Экспериментальная группа: B C E и контрольная группа: A D F
  13. Экспериментальная группа: B C F и контрольная группа: A D E
  14. Экспериментальная группа: B D E и контрольная группа: A C F
  15. Экспериментальная группа: B D F и контрольная группа: A C E
  16. Экспериментальная группа: B E F и контрольная группа: A C D
  17. Экспериментальная группа: C D E и контрольная группа: A B F
  18. Экспериментальная группа: C D F и Контрольная группа: A B E
  19. Экспериментальная группа: C E F и контрольная группа: A B D
  20. Экспериментальная группа: D E F и контрольная группа: A B C

Затем мы рассмотрим каждую конфигурацию экспериментальной и контрольной групп. Мы рассчитываем среднее значение для каждой из 20 перестановок в приведенном выше листинге. Например, для первого A, B и C имеют времена 10, 12 и 9 соответственно. Среднее значение этих трех чисел составляет 10,3333. Также в этой первой перестановке D, E и F имеют времена 11, 11 и 13 соответственно. Это в среднем 11,6666.

После расчета среднее значение каждой группыРассчитаем разницу между этими средствами. Каждое из следующих соответствует разнице между экспериментальной и контрольной группами, которые были перечислены выше.

  1. Плацебо - лечение = 1,333333333 секунды
  2. Плацебо - лечение = 0 секунд
  3. Плацебо - лечение = 0 секунд
  4. Плацебо - лечение = -1,333333333 секунды
  5. Плацебо - лечение = 2 секунды
  6. Плацебо - лечение = 2 секунды
  7. Плацебо - лечение = 0,666666667 секунд
  8. Плацебо - лечение = 0,666666667 секунд
  9. Плацебо - лечение = -0,666666667 секунд
  10. Плацебо - лечение = -0,666666667 секунд
  11. Плацебо - лечение = 0,666666667 секунд
  12. Плацебо - лечение = 0,666666667 секунд
  13. Плацебо - лечение = -0,666666667 секунд
  14. Плацебо - лечение = -0,666666667 секунд
  15. Плацебо - лечение = -2 секунды
  16. Плацебо - лечение = -2 секунды
  17. Плацебо - лечение = 1,333333333 секунды
  18. Плацебо - лечение = 0 секунд
  19. Плацебо - лечение = 0 секунд
  20. Плацебо - лечение = -1,333333333 секунды

Р-значение

Теперь мы оцениваем различия между средствами каждой группы, которые мы отметили выше. Мы также подсчитаем процент наших 20 различных конфигураций, которые представлены каждой разницей в средних значениях. Например, четыре из 20 не имели различий между средствами контрольной и лечебной групп. Это составляет 20% из 20 конфигураций, указанных выше.

  • -2 на 10%
  • -1,33 на 10%
  • -0,667 на 20%
  • 0 на 20%
  • 0,667 на 20%
  • 1,33 на 10%
  • 2 на 10%.

Здесь мы сравниваем этот список с нашим наблюдаемым результатом. Наш случайный отбор мышей для контрольной и контрольной групп привел к средней разнице в 2 секунды. Мы также видим, что эта разница соответствует 10% всех возможных образцов. Результатом является то, что для этого исследования у нас есть р-значение 10%.

instagram story viewer