Основные компоненты и факторный анализ

Анализ основных компонентов (PCA) и факторный анализ (FA) - это статистические методы, используемые для сокращения данных или определения структуры. Эти два метода применяются к одному набору переменных, когда исследователь заинтересован в обнаружение, какие переменные в наборе образуют когерентные подмножества, которые относительно независимы от одного еще один. Переменные, которые связаны друг с другом, но в значительной степени независимы от других наборов переменных, объединяются в факторы. Эти факторы позволяют вам сократить количество переменных в вашем анализе, объединяя несколько переменных в один фактор.

Конкретными целями PCA или FA являются обобщение моделей корреляции среди наблюдаемых переменных, чтобы уменьшить большое количество наблюдаемых переменных до меньшего числа факторов, чтобы обеспечить уравнение регрессии для базового процесса с использованием наблюдаемых переменных или для проверки теории о природе базовых процессов.

пример

Скажем, например, исследователь заинтересован в изучении характеристик аспирантов. Исследователь проводит опрос большой выборки аспирантов по таким личностным характеристикам, как мотивация, интеллектуальные способности, учебная история, семейная история, здоровье, физические характеристики, и т.п. Каждая из этих областей измеряется несколькими переменными. Переменные затем вводятся в анализ индивидуально и изучаются корреляции между ними. Анализ выявляет закономерности корреляции между переменными, которые, как считается, отражают основные процессы, влияющие на поведение аспирантов. Например, несколько переменных из показателей интеллектуальных способностей объединяются с некоторыми переменными из показателей схоластической истории, чтобы сформировать фактор, измеряющий интеллект. Точно так же переменные из мер личности могут сочетаться с некоторыми переменными из мотивации и схоластики история измеряет, чтобы сформировать фактор, измеряющий степень, в которой студент предпочитает работать самостоятельно - независимость фактор.

instagram viewer

Этапы анализа основных компонентов и факторного анализа

Этапы анализа основных компонентов и факторного анализа включают в себя:

  • Выберите и измерьте набор переменных.
  • Подготовьте матрицу корреляции для выполнения либо PCA, либо FA.
  • Извлечь набор факторов из матрицы корреляции.
  • Определите количество факторов.
  • При необходимости поверните факторы для повышения интерпретируемости.
  • Интерпретировать результаты.
  • Проверьте структуру фактора, установив достоверность конструкции факторов.

Разница между основными компонентами анализа и факторного анализа

Анализ основных компонентов и факторный анализ похожи, потому что обе процедуры используются для упрощения структуры набора переменных. Тем не менее, анализы отличаются по нескольким важным аспектам:

  • В PCA компоненты рассчитываются как линейные комбинации исходных переменных. В FA исходные переменные определяются как линейные комбинации факторов.
  • В PCA цель состоит в том, чтобы составлять как можно большую часть дисперсия в переменных, насколько это возможно. Цель в FA состоит в том, чтобы объяснить ковариации или корреляции между переменными.
  • PCA используется для сокращения данных на меньшее количество компонентов. FA используется, чтобы понять, какие конструкции лежат в основе данных.

Проблемы с анализом основных компонентов и факторного анализа

Одна проблема с PCA и FA заключается в том, что нет критерия, по которому можно протестировать решение. В других статистических методах, таких как анализ дискриминантной функции, логистическая регрессия, анализ профиля и многовариантность дисперсионный анализРешение оценивается по тому, насколько хорошо оно предсказывает членство в группе. В PCA и FA нет внешних критериев, таких как членство в группах, по которым можно протестировать решение.

Вторая проблема PCA и FA заключается в том, что после извлечения доступно бесконечное число вращений, все учитывают одинаковое количество отклонений в исходных данных, но с незначительно определенным фактором разные. Окончательный выбор оставлен на усмотрение исследователя на основе их оценки его интерпретируемости и научной полезности. Исследователи часто расходятся во мнениях о том, какой выбор является лучшим.

Третья проблема заключается в том, что ФА часто используется для «сохранения» плохо продуманных исследований. Если никакая другая статистическая процедура не является подходящей или применимой, данные могут по меньшей мере подвергаться факторному анализу. Это заставляет многих верить, что различные формы ФА связаны с небрежными исследованиями.