Пример двух образцов T-теста и доверительного интервала

Иногда в статистике полезно видеть проработанные примеры проблем. Эти примеры могут помочь нам разобраться в похожих проблемах. В этой статье мы пройдемся по процессу выведения статистики для получения результата, касающегося двух групп населения. Мы не только увидим, как проводить проверка гипотезы о разнице двух средних чисел, мы также построим доверительный интервал за эту разницу. Методы, которые мы используем, иногда называют t-тестом с двумя выборками и t-интервалом с двумя выборками.

Постановка проблемы

Предположим, мы хотим проверить математические способности учащихся начальной школы. Один вопрос, который у нас может возникнуть, состоит в том, имеют ли более высокие классы более высокие средние результаты тестов.

Простая случайная выборка из 27 учеников третьего класса проходит тест по математике, их ответы оцениваются, и результаты показывают, что средний балл составляет 75 баллов с стандартное отклонение образца 3 балла.

Простая случайная выборка из 20 пятиклассников проходит тот же математический тест, и их ответы оцениваются. Средний балл для пятиклассников составляет 84 балла при стандартном отклонении выборки 5 баллов.

instagram viewer

Учитывая этот сценарий, мы задаем следующие вопросы:

  • Предоставляют ли данные выборки нам доказательство того, что средний балл по тестированию популяции всех пятиклассников превышает средний балл по тестированию популяции всех учащихся третьего класса?
  • Каков 95-процентный доверительный интервал для разницы средних баллов по тестам между группами учащихся третьего и пятого классов?

Условия и порядок

Мы должны выбрать, какую процедуру использовать. При этом мы должны убедиться, что условия для этой процедуры выполнены. Нас просят сравнить два популяции. Один набор методов, которые могут быть использованы для этого, это методы для t-процедур с двумя образцами.

Чтобы использовать эти t-процедуры для двух образцов, мы должны убедиться, что выполняются следующие условия:

  • У нас есть две простые случайные выборки из двух групп населения, представляющих интерес.
  • Наши простые случайные выборки не составляют более 5% населения.
  • Два образца не зависят друг от друга, и нет совпадения между предметами.
  • Переменная нормально распределена.
  • Среднее значение и стандартное отклонение популяции неизвестны для обеих популяций.

Мы видим, что большинство этих условий соблюдены. Нам сказали, что у нас есть простые случайные выборки. Население, которое мы изучаем, велико, так как в этих классах учатся миллионы учеников.

Условие, которое мы не можем автоматически принять, состоит в том, что результаты тестов обычно распределяются. Поскольку у нас достаточно большой размер выборки, из-за надежности наших t-процедур необязательно, чтобы переменная была нормально распределена.

Поскольку условия выполнены, мы выполним пару предварительных расчетов.

Стандартная ошибка

Стандартная ошибка - это оценка стандартного отклонения. Для этой статистики мы добавляем выборочную дисперсию выборок, а затем берем квадратный корень. Это дает формулу:

(s1 2 / N1 + s22 / N2)1/2

Используя приведенные выше значения, мы видим, что значение стандартной ошибки

(32 / 27+ 52 / 20)1/2 =(1 / 3 + 5 / 4 )1/2 = 1.2583

Степени свободы

Мы можем использовать консервативное приближение для нашего степени свободы. Это может недооценивать число степеней свободы, но это гораздо легче вычислить, чем с использованием формулы Уэлча. Мы используем меньший из двух размеров выборки, а затем вычитаем один из этого числа.

Для нашего примера меньший из двух образцов равен 20. Это означает, что количество степеней свободы составляет 20 - 1 = 19.

Проверка гипотез

Мы хотим проверить гипотезу о том, что учащиеся пятого класса имеют средний балл теста, превышающий средний балл учащихся третьего класса. Пусть μ1 будет средний балл населения всех пятиклассников. Точно так же мы позволяем μ2 быть средней оценкой населения всех учеников третьего класса.

Гипотезы следующие:

  • ЧАС0: μ1 - μ2 = 0
  • ЧАС: μ1 - μ2 > 0

Статистика теста - это разница между средними значениями выборки, которая затем делится на стандартную ошибку. Так как мы используем выборочные стандартные отклонения для оценки стандартного отклонения популяции, тестовая статистика из t-распределения.

Значение тестовой статистики составляет (84 - 75) / 1,2583. Это примерно 7,15.

Теперь мы определим значение p для этого теста гипотезы. Мы смотрим на значение тестовой статистики и на то, где она находится в t-распределении с 19 степенями свободы. Для этого распределения у нас есть 4,2 х 10-7 как наше р-значение. (Один из способов определить это - использовать функцию T.DIST.RT в Excel.)

Поскольку у нас такое маленькое значение p, мы отвергаем нулевую гипотезу. Вывод заключается в том, что средний балл теста для пятиклассников выше, чем средний балл теста для третьих классов.

Доверительный интервал

Поскольку мы установили, что существует разница между средними значениями, мы теперь определяем доверительный интервал для разницы между этими двумя средними значениями. У нас уже есть многое из того, что нам нужно. Доверительный интервал для разницы должен иметь как оценку, так и погрешность.

Оценка разности двух средних рассчитать просто. Мы просто находим разницу в образце средств. Это различие выборки означает, что средние значения оценивают разницу.

По нашим данным, разница в средстве выборки составляет 84 - 75 = 9.

Погрешность немного сложнее вычислить. Для этого нам нужно умножить соответствующую статистику на стандартную ошибку. Статистику, которая нам нужна, можно найти, посмотрев таблицу или статистическое программное обеспечение.

Опять же, используя консервативное приближение, мы имеем 19 степеней свободы. Для 95% доверительного интервала мы видим, что t* = 2.09. Мы могли бы использовать Функция T.INV в Exceл, чтобы рассчитать это значение.

Теперь мы собрали все вместе и видим, что наша погрешность составляет 2,09 x 1,2583, что составляет примерно 2,63. Доверительный интервал составляет 9 ± 2,63. Интервал от 6,37 до 11,63 балла по тесту, выбранному пятым и третьим классом.