Поле статистики делится на два основных подразделения: описательное и логическое. Каждый из этих сегментов важен, предлагая различные методы, которые решают разные задачи. Описательная статистика описывает, что происходит в Население или набор данных. Инференциальная статистика, напротив, позволяет ученым брать результаты из выборочной группы и обобщать их для большей популяции. Два типа статистики имеют некоторые важные различия.
Описательная статистика
Описательная статистика - это тип статистики, который, вероятно, возникает у большинства людей, когда они слышат слово «статистика». В этой области статистики цель состоит в том, чтобы описать. Численные меры используются, чтобы рассказать об особенностях набора данных. В эту часть статистики входит ряд элементов, таких как:
- среднийили мера центра набора данных, состоящего из среднего значения, медианы, моды или среднего уровня
- Распространение набора данных, которое можно измерить с помощью ассортимент или среднеквадратичное отклонение
- Общее описание данных, таких как пятизначное резюме
- Измерения, такие как перекос и эксцесс
- Исследование отношений и корреляция между парными данными
- Представление статистических результатов в графический форма
Эти меры важны и полезны, потому что они позволяют ученым видеть закономерности среди данных и, таким образом, понимать эти данные. Описательные статистические данные могут использоваться только для описания группы населения или исследуемого набора данных: результаты не могут быть обобщены для какой-либо другой группы или группы населения.
Типы описательной статистики
Есть два вида описательной статистики, которую используют социологи:
Меры центральной тенденции фиксируют общие тренды в данных и рассчитываются и выражаются как среднее значение, медиана и мода. Среднее значение сообщает ученым математическое среднее всего набора данных, например, средний возраст первого брака; медиана представляет середину распределения данных, как возраст, который находится в середине диапазона возрастов, в котором люди впервые вступают в брак; и режим может быть наиболее распространенным возрастом, в котором люди впервые вступают в брак.
Меры распространения описывают, как данные распределяются и связаны друг с другом, в том числе:
- Диапазон, весь диапазон значений, присутствующих в наборе данных
- Распределение частот, которое определяет, сколько раз конкретное значение встречается в наборе данных
- Квартили, подгруппы, сформированные в наборе данных, когда все значения разделены на четыре равные части в диапазоне
- Среднее абсолютное отклонениесреднее значение отклонения каждого значения от среднего
- отклонение, который показывает, какая часть распространения существует в данных
- Стандартное отклонение, которое иллюстрирует разброс данных относительно среднего
Меры разброса часто визуально представлены в виде таблиц, круговых диаграмм и гистограмм, чтобы помочь в понимании тенденций в данных.
Выведенный статистика
Статистические статистические данные производятся посредством сложных математических вычислений, которые позволяют ученым выявлять тенденции в отношении большей популяции на основе изучения взятой из нее выборки. Ученые используют логическую статистику, чтобы исследовать отношения между переменными в выборке а затем сделать обобщения или предсказания о том, как эти переменные будут относиться к большему Население.
Обычно невозможно обследовать каждого члена населения в отдельности. Таким образом, ученые выбирают репрезентативную группу населения, называемую статистической выборкой, и из этого анализа они могут что-то сказать о населении, из которого была получена выборка. Существует два основных раздела логической статистики:
- Доверительный интервал дает диапазон значений для неизвестного параметра популяции путем измерения статистической выборки. Это выражается через интервал и степень уверенности, что параметр находится в пределах интервала.
- Тесты значимости или проверка гипотезы где ученые делают заявления о населении, анализируя статистическую выборку. В этом процессе есть некоторая неопределенность. Это может быть выражено через уровень значимости.
Методы, которые социологи используют для изучения взаимосвязей между переменными и, следовательно, для создания логической статистики, включают линейный регрессионный анализ, логистический регрессионный анализ, ANOVA, корреляционный анализ, структурное моделирование уравнениеи анализ выживания. Проводя исследования с использованием логической статистики, ученые проводят значимый тест, чтобы определить, могут ли они обобщить свои результаты для большей популяции. Общие тесты значимости включают хи-квадрат и Т-тест. Они говорят ученым о вероятности того, что результаты их анализа выборки являются репрезентативными для населения в целом.
Описательный против Выведенный статистика
Хотя описательная статистика полезна для изучения таких вещей, как разброс и центр данных, ничто в описательной статистике не может быть использовано для каких-либо обобщений. В описательной статистике такие измерения, как среднее значение и стандартное отклонение, указываются как точные числа.
Несмотря на то, что логическая логика выводов использует некоторые аналогичные вычисления, такие как среднее значение и стандартное отклонение, для логической статистики логика различна. Статистические данные начинаются с выборки, а затем обобщаются для совокупности. Эта информация о населении не указана в виде числа. Вместо этого ученые выражают эти параметры в виде диапазона потенциальных чисел вместе со степенью достоверности.