Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Иерархический факторный анализ



Когда проводится облическое факторное вращение, получаемые факторы обычно коррелируют между собой. Матрица взаимных корреляций факторов представляет углы между факторами, и сама может быть подвергнута факторному анализу. Иначе говоря, корреляции между факторами можно проанализировать и выделить любые кластеры факторов, т.е. произвести факторный анализ «второго порядка», или «второго уровня» (факторизация корреляций между переменными – это анализ «первого порядка»), и исследователи, например, Кэттелл, широко использовали эту методику. Полезность такого анализа можно проиллюстрировать с помощью примера.

Колин Купер описывает результаты исследования, целью которого было установить, какими могут быть основные параметры настроения (Купер К. Индивидуальные различия. М., 2000). Был проведен факторный анализ корреляций более 100 заданий, направленных на оценку настроения, извлечены и подвергнуты облическому вращению пять факторов первого порядка, соответствующих основным параметрам настроения. Затем был проведен факторный анализ корреляций между этими факторами первого порядка. Четыре из этих факторов оказались коррелирующими между собой, образуя фактор настроения второго порядка, названный «негативный аффект». Пятый фактор настроения имел незначительную нагрузку по этому фактору. Таким образом была установлена иерархия факторов настроения.

Если имеется много факторов второго порядка и они обнаруживают приемлемую степень корреляции, будет вполне законным провести факторный анализ корреляций между факторами второго порядка, чтобы выполнить факторный анализ третьего порядка.

Процесс можно продолжать либо до тех пор, пока корреляции не станут, по сути, равными нулю, либо до тех пор, пока не получится только один фактор.

Проблема, присущая этому иерархическому анализу, состоит в том, что может быть чрезвычайно трудно идентифицировать или концептуализировать факторы второго и более высоких порядков. В то время как факторы первого порядка могут быть экспериментально идентифицированы выделением заданий с существенными нагрузками, матрица факторов второго порядка показывает, как факторы первого порядка нагружают фактор (факторы) второго порядка. По этой причине может быть достаточно сложно идентифицировать факторы второго порядка. Например, как назвать фактор, который, оказывается, измеряет первичные способности к правописанию, визуализации образов и способности в области механики? Было бы намного легче проанализировать, что происходит, если бы можно было показать, что десяток переменных имеют большие нагрузки по фактору второго порядка, вместо того чтобы пытаться интерпретировать факторы второго порядка в категориях только двух больших нагрузок, присущих факторам первого порядка.

Для того чтобы преодолеть эту проблему, было изобретено несколько методов. Все они связывают факторы второго и более высоких порядков с непосредственно наблюдаемыми переменными. В приведенном выше примере факторы второго порядка будут определены не в категориях первичных факторов (правописание, визуализация, способности в области механики и т.д.), а в категориях действительных переменных. Но ни один из стандартных пакетов, осуществляющих факторный анализ, не включает подобную методику.

Вторая проблема, связанная с таким анализом, касается ошибки измерения. Иногда несколько довольно разных факторов первого порядка почти в полной мере удовлетворяют требованиям, поскольку это касается критерия соответствия простой структуре. Однако более или менее произвольный выбор одного такого решения будет оказывать мощный эффект на корреляции между факторами и, следовательно, на количество и природу факторов второго порядка. Факторный анализ следует осуществлять с особой тщательностью, если предполагается получить иерархические решения.

ФАКТОРНЫЙ И КЛАСТЕРНЫЙ АНАЛИЗ

Как отмечалось ранее, кластерный анализ можно применять в ходе корреляционного анализа – для исследования взаимосвязей множества переменных, как существенно более простой и наглядный аналог факторного анализа. В этом смысле представляет интерес соотнесение факторного и кластерного анализа.

Факторный анализ позволяет выделить факторы, которые интерпретируются как латентные причины взаимосвязи групп переменных. При этом каждый фактор идентифицируется (интерпретируется) через группу переменных, которые теснее связаны друг с другом, чем с другими переменными. Напомним, что кластерный анализ тоже направлен на выявление групп, в состав которых входят объекты, более сходные друг с другом, чем с представителями других групп. При этом, конечно же, кластерный анализ имеет совершенно иную природу, нежели факторный анализ. Но если в качестве объектов классификации определить переменные, а в качестве мер их различия (близости) – корреляции, то кластерный анализ позволит получить тот же результат, что и факторный анализ. Имеется в виду доступная интерпретации структура взаимосвязей множества переменных.

Важно отметить два существенных ограничения факторного анализа. Во-первых, факторный анализ неизбежно сопровождается потерей исходной информации о связях между переменными. И эта потеря часто весьма ощутима: от 30 до 50%. Во-вторых, из требования «простой структуры» следует, что ценность представляет решение, когда группы переменных, которые соответствуют разным факторам, не должны заметно коррелировать друг с другом. И чем теснее эти группы связаны, тем хуже факторная структура, тем труднее факторы поддаются интерпретации. Не говоря уже о случаях иерархической соподчиненности групп.

Кластерный анализ корреляций лишен указанных недостатков. Во-первых, классификация при помощи кластерного анализа по определению отражает всю исходную информацию о различиях (связях в данном случае). Во-вторых, он не только допускает, но и отражает степень связанности разных кластеров, включая случаи соподчиненности (иерархичности) кластеров.

Таким образом, кластерный анализ является не только более простой и наглядной альтернативой факторного анализа. В указанных отношениях он имеет явные преимущества, которые целесообразно использовать, по крайней мере, до попытки применения факторного анализа. Как начальный этап исследования корреляций, кластерный анализ позволит избавиться от несгруппированных переменных и выявить иерархические кластеры, к которым факторный анализ не чувствителен. Вполне вероятно, что после кластерного анализа отпадет и сама необходимость в проведении факторного анализа. Исключение составляют случаи применения факторного анализа по его прямому назначению – для перехода к факторам как к новым интегральным переменным.

Применяя кластерный анализ для исследования структуры корреляций, необходимо помнить о двух обстоятельствах. Во-первых, корреляция является мерой сходства, а не различия – ее величина возрастает (до 1) при увеличении сходства двух переменных. Во-вторых, отрицательные величины корреляции так же свидетельствуют о сходстве переменных, как и положительные, то есть для классификации необходимо использовать только положительные корреляции (их абсолютные значения).

 

ТЕМА 4. МАТЕМАТИКО-СТАТИСТИЧЕСКИЙ МЕТОД

КЛАССИФИКАЦИИ В ПСИХОЛОГИИ: МОДЕЛЬ ДИСКРИМИНАНТНОГО АНАЛИЗА

 

Назначение

Дискриминантный анализ (ДА) является статистическим методом, который позволяет изучать различия между двумя и более груп­пами объектов по нескольким переменным одновременно. Этот метод часто бывает полезен в социальных науках. Рассмотрим, например, такую ситуацию.

Группа экспертов исследует возмож­ность переговоров с террористами, захватившими заложников. Их интересуют те особенности ситуации, при которых было бы возможно безопасное освобождение заложников, даже если тре­бования террористов не выполнены. В качестве альтернативы, что заложникам будет причинен вред, существует несколько перемен­ных, предсказывающих их благополучное освобождение. Напри­мер, число террористов, наличие поддержки их местным населе­нием, являются ли они независимой группой или принадлежат к большой военной организации, характер их устных заявлений, тип и количество оружия, отношение числа террористов к числу заложников и т. д.

Изучая предыдущие инциденты, в которых власти отказались выполнить требования террористов, эксперты должны найти ответ на следующие вопросы:

1. какие из этих пе­ременных могут быть полезными для предсказания судьбы за­ложников:

2. как эти переменные могут быть связаны в матема­тическую функцию для предсказания наиболее вероятного исхо­да:

3. какова точность предсказания.

Дискриминантный анали­з с успехом применяется в таких областях как психологическое тестирование, личностное и в целях профотбора или аттестации кадров, анализ переписи населе­ния, изучение эффекта от како­го-либо метода лечения, исследование экономических различий между географическими районами и предприятиями, предсказание итогов голосо­вания и др.

Основным предположением дискриминантного анали­за является то, что существуют две или более группы, которые по некоторым переменным отличаются от других групп, причем такие переменные могут быть измерены по интервальной шкале либо по шкале отношений. Дискриминантный анализ помогает выявлять различия между группами и дает возможность класси­фицировать объекты по принципу максимального сходства.

Объекты(наблюдения) должны принадлежать од­ному из двух (или более) классов (групп). Объекты являются основными единицами анализа. Объектами изучения могут быть люди, животные, страны, экономика в различные моменты вре­мени и вообще все, что угодно. В примере с террористами каж­дый предыдущий террористический акт есть объект. Класс (группа) дол­жен быть определен таким образом, чтобы каждое наблюдение принадлежало одному и только одному классу. Последствия тер­рористических актов могут быть отнесены к одному из двух клас­сов: случаи успешного освобождения заложников и случаи, когда пострадали некоторые или все заложники. Главная задача в случае с террористами состоит в точном предсказании результатов будущих инцидентов. Поэтому будущие инциденты могут рассматриваться как «нерасклассифицированные» («несгруппированные»).

«Дискриминантный анализ» можно разделить на методы интерпретации межгрупповых различий и методы классификации наблюдений по группам.

При интерпретации необходимо ответить на вопросы: возможно ли, используя данный набор характеристик (переменных), отличить один класс от дру­гого: насколько хорошо эти характеристики позволяют провести различение и какие из них наиболее информативны.

Метод, отно­сящийся к классификации, связан с получением одной или не­скольких функций (уравнений), обеспечивающих возможность отнести данный объект к одной из групп (классов). Эти функции, называются классифицирующими. Например, если значения характеристик нового террори­стического акта близки к соответствующим значениям прошлых инцидентов, в которых все заложники были освобождены, классифицирующая функция покажет, что для рассматриваемого со­бытия более вероятен благоприятный исход. (После того как ин­цидент будет исчерпан, станет известно, оправдался ли прогноз, однако для многих других приложений подтвердить точность классификации не представляется возможным.)

Характеристики, применяемые для того, чтобы отличать один класс от другого, называются дискриминантными переменными. В примере с террористами были упомянуты семь дискриминантных переменных (число террористов, степень поддержки, количество оружия и т. д.). В общем случае, число дискриминантных переменных не ограничено, но в сумме число объектов должно всегда превышать число переменных по крайней мере на два.

Итак, дискриминантный анализ используется для изучения различий между несколькими группами по определенному набору дискриминантных переменных.

 


Поделиться:



Популярное:

Последнее изменение этой страницы: 2017-03-03; Просмотров: 1205; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.023 с.)
Главная | Случайная страница | Обратная связь