Иерархический факторный анализ

⇐ ПредыдущаяСтр 7 из 8Следующая ⇒

Когда проводится облическое факторное вращение, получаемые факторы обычно коррелируют между собой. Матрица взаимных корреляций факторов представляет углы между факторами, и сама может быть подвергнута факторному анализу. Иначе говоря, корреляции между факторами можно проанализировать и выделить любые кластеры факторов, т.е. произвести факторный анализ «второго порядка», или «второго уровня» (факторизация корреляций между переменными – это анализ «первого порядка»), и исследователи, например, Кэттелл, широко использовали эту методику. Полезность такого анализа можно проиллюстрировать с помощью примера.

Колин Купер описывает результаты исследования, целью которого было установить, какими могут быть основные параметры настроения (Купер К. Индивидуальные различия. М., 2000). Был проведен факторный анализ корреляций более 100 заданий, направленных на оценку настроения, извлечены и подвергнуты облическому вращению пять факторов первого порядка, соответствующих основным параметрам настроения. Затем был проведен факторный анализ корреляций между этими факторами первого порядка. Четыре из этих факторов оказались коррелирующими между собой, образуя фактор настроения второго порядка, названный «негативный аффект». Пятый фактор настроения имел незначительную нагрузку по этому фактору. Таким образом была установлена иерархия факторов настроения.

Если имеется много факторов второго порядка и они обнаруживают приемлемую степень корреляции, будет вполне законным провести факторный анализ корреляций между факторами второго порядка, чтобы выполнить факторный анализ третьего порядка.

Процесс можно продолжать либо до тех пор, пока корреляции не станут, по сути, равными нулю, либо до тех пор, пока не получится только один фактор.

Проблема, присущая этому иерархическому анализу, состоит в том, что может быть чрезвычайно трудно идентифицировать или концептуализировать факторы второго и более высоких порядков. В то время как факторы первого порядка могут быть экспериментально идентифицированы выделением заданий с существенными нагрузками, матрица факторов второго порядка показывает, как факторы первого порядка нагружают фактор (факторы) второго порядка. По этой причине может быть достаточно сложно идентифицировать факторы второго порядка. Например, как назвать фактор, который, оказывается, измеряет первичные способности к правописанию, визуализации образов и способности в области механики? Было бы намного легче проанализировать, что происходит, если бы можно было показать, что десяток переменных имеют большие нагрузки по фактору второго порядка, вместо того чтобы пытаться интерпретировать факторы второго порядка в категориях только двух больших нагрузок, присущих факторам первого порядка.

Для того чтобы преодолеть эту проблему, было изобретено несколько методов. Все они связывают факторы второго и более высоких порядков с непосредственно наблюдаемыми переменными. В приведенном выше примере факторы второго порядка будут определены не в категориях первичных факторов (правописание, визуализация, способности в области механики и т.д.), а в категориях действительных переменных. Но ни один из стандартных пакетов, осуществляющих факторный анализ, не включает подобную методику.

Вторая проблема, связанная с таким анализом, касается ошибки измерения. Иногда несколько довольно разных факторов первого порядка почти в полной мере удовлетворяют требованиям, поскольку это касается критерия соответствия простой структуре. Однако более или менее произвольный выбор одного такого решения будет оказывать мощный эффект на корреляции между факторами и, следовательно, на количество и природу факторов второго порядка. Факторный анализ следует осуществлять с особой тщательностью, если предполагается получить иерархические решения.

ФАКТОРНЫЙ И КЛАСТЕРНЫЙ АНАЛИЗ

Как отмечалось ранее, кластерный анализ можно применять в ходе корреляционного анализа – для исследования взаимосвязей множества переменных, как существенно более простой и наглядный аналог факторного анализа. В этом смысле представляет интерес соотнесение факторного и кластерного анализа.

Факторный анализ позволяет выделить факторы, которые интерпретируются как латентные причины взаимосвязи групп переменных. При этом каждый фактор идентифицируется (интерпретируется) через группу переменных, которые теснее связаны друг с другом, чем с другими переменными. Напомним, что кластерный анализ тоже направлен на выявление групп, в состав которых входят объекты, более сходные друг с другом, чем с представителями других групп. При этом, конечно же, кластерный анализ имеет совершенно иную природу, нежели факторный анализ. Но если в качестве объектов классификации определить переменные, а в качестве мер их различия (близости) – корреляции, то кластерный анализ позволит получить тот же результат, что и факторный анализ. Имеется в виду доступная интерпретации структура взаимосвязей множества переменных.

Важно отметить два существенных ограничения факторного анализа. Во-первых, факторный анализ неизбежно сопровождается потерей исходной информации о связях между переменными. И эта потеря часто весьма ощутима: от 30 до 50%. Во-вторых, из требования «простой структуры» следует, что ценность представляет решение, когда группы переменных, которые соответствуют разным факторам, не должны заметно коррелировать друг с другом. И чем теснее эти группы связаны, тем хуже факторная структура, тем труднее факторы поддаются интерпретации. Не говоря уже о случаях иерархической соподчиненности групп.

Кластерный анализ корреляций лишен указанных недостатков. Во-первых, классификация при помощи кластерного анализа по определению отражает всю исходную информацию о различиях (связях в данном случае). Во-вторых, он не только допускает, но и отражает степень связанности разных кластеров, включая случаи соподчиненности (иерархичности) кластеров.

Таким образом, кластерный анализ является не только более простой и наглядной альтернативой факторного анализа. В указанных отношениях он имеет явные преимущества, которые целесообразно использовать, по крайней мере, до попытки применения факторного анализа. Как начальный этап исследования корреляций, кластерный анализ позволит избавиться от несгруппированных переменных и выявить иерархические кластеры, к которым факторный анализ не чувствителен. Вполне вероятно, что после кластерного анализа отпадет и сама необходимость в проведении факторного анализа. Исключение составляют случаи применения факторного анализа по его прямому назначению – для перехода к факторам как к новым интегральным переменным.

Применяя кластерный анализ для исследования структуры корреляций, необходимо помнить о двух обстоятельствах. Во-первых, корреляция является мерой сходства, а не различия – ее величина возрастает (до 1) при увеличении сходства двух переменных. Во-вторых, отрицательные величины корреляции так же свидетельствуют о сходстве переменных, как и положительные, то есть для классификации необходимо использовать только положительные корреляции (их абсолютные значения).

ТЕМА 4. МАТЕМАТИКО-СТАТИСТИЧЕСКИЙ МЕТОД

КЛАССИФИКАЦИИ В ПСИХОЛОГИИ: МОДЕЛЬ ДИСКРИМИНАНТНОГО АНАЛИЗА

Назначение

Дискриминантный анализ (ДА) является статистическим методом, который позволяет изучать различия между двумя и более группами объектов по нескольким переменным одновременно. Этот метод часто бывает полезен в социальных науках. Рассмотрим, например, такую ситуацию.

Группа экспертов исследует возможность переговоров с террористами, захватившими заложников. Их интересуют те особенности ситуации, при которых было бы возможно безопасное освобождение заложников, даже если требования террористов не выполнены. В качестве альтернативы, что заложникам будет причинен вред, существует несколько переменных, предсказывающих их благополучное освобождение. Например, число террористов, наличие поддержки их местным населением, являются ли они независимой группой или принадлежат к большой военной организации, характер их устных заявлений, тип и количество оружия, отношение числа террористов к числу заложников и т. д.

Изучая предыдущие инциденты, в которых власти отказались выполнить требования террористов, эксперты должны найти ответ на следующие вопросы:

1. какие из этих переменных могут быть полезными для предсказания судьбы заложников:

2. как эти переменные могут быть связаны в математическую функцию для предсказания наиболее вероятного исхода:

3. какова точность предсказания.

Дискриминантный анализ с успехом применяется в таких областях как психологическое тестирование, личностное и в целях профотбора или аттестации кадров, анализ переписи населения, изучение эффекта от какого-либо метода лечения, исследование экономических различий между географическими районами и предприятиями, предсказание итогов голосования и др.

Основным предположением дискриминантного анализа является то, что существуют две или более группы, которые по некоторым переменным отличаются от других групп, причем такие переменные могут быть измерены по интервальной шкале либо по шкале отношений. Дискриминантный анализ помогает выявлять различия между группами и дает возможность классифицировать объекты по принципу максимального сходства.

Объекты(наблюдения) должны принадлежать одному из двух (или более) классов (групп). Объекты являются основными единицами анализа. Объектами изучения могут быть люди, животные, страны, экономика в различные моменты времени и вообще все, что угодно. В примере с террористами каждый предыдущий террористический акт есть объект. Класс (группа) должен быть определен таким образом, чтобы каждое наблюдение принадлежало одному и только одному классу. Последствия террористических актов могут быть отнесены к одному из двух классов: случаи успешного освобождения заложников и случаи, когда пострадали некоторые или все заложники. Главная задача в случае с террористами состоит в точном предсказании результатов будущих инцидентов. Поэтому будущие инциденты могут рассматриваться как «нерасклассифицированные» («несгруппированные»).

«Дискриминантный анализ» можно разделить на методы интерпретации межгрупповых различий и методы классификации наблюдений по группам.

При интерпретации необходимо ответить на вопросы: возможно ли, используя данный набор характеристик (переменных), отличить один класс от другого: насколько хорошо эти характеристики позволяют провести различение и какие из них наиболее информативны.

Метод, относящийся к классификации, связан с получением одной или нескольких функций (уравнений), обеспечивающих возможность отнести данный объект к одной из групп (классов). Эти функции, называются классифицирующими. Например, если значения характеристик нового террористического акта близки к соответствующим значениям прошлых инцидентов, в которых все заложники были освобождены, классифицирующая функция покажет, что для рассматриваемого события более вероятен благоприятный исход. (После того как инцидент будет исчерпан, станет известно, оправдался ли прогноз, однако для многих других приложений подтвердить точность классификации не представляется возможным.)

Характеристики, применяемые для того, чтобы отличать один класс от другого, называются дискриминантными переменными. В примере с террористами были упомянуты семь дискриминантных переменных (число террористов, степень поддержки, количество оружия и т. д.). В общем случае, число дискриминантных переменных не ограничено, но в сумме число объектов должно всегда превышать число переменных по крайней мере на два.

Итак, дискриминантный анализ используется для изучения различий между несколькими группами по определенному набору дискриминантных переменных.

⇐ Предыдущая 1 2 3 4 5 678 Следующая ⇒