Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Геометрический подход к факторному анализу
Корреляционные матрицы можно представить в геометрическом выражении. Переменные изображаются в виде векторов равной длины, берущих начало в одной точке. Эти векторы располагаются таким образом, что корреляции между переменными представляют значения косинусов углов между ними. В табл. 3 приводятся несколько значений косинусов углов. Следует помнить, что в том случае, когда угол между двумя векторами маленький, значение косинуса будет большим и положительным, когда два вектора находятся под прямым углом друг к другу, корреляция (косинус) равна нулю. Когда два вектора направлены в противоположные стороны, корреляция (косинус) будет отрицательной. Вектор проводится на любом месте страницы и представляет одну из переменных, неважно какую именно. Другие переменные изображаются с помощью других векторов равной длины, причем все они исходят из той же точки, что и первый вектор. Углы между переменными, по договоренности, измеряются в направлении, задаваемом направлением движения часовой стрелки. Переменные, между которыми имеются большие положительные корреляции, располагаются близко друг к другу, поскольку табл. 3 показывает, что большие корреляции (или косинусы) соответствуют маленьким углам между векторами. Векторы высоко коррелирующих переменных имеют одно и то же направление; переменные, имеющие высокие отрицательные корреляции друг с другом, обращены в противоположные стороны, а векторы переменных, которые не коррелируют между собой, указывают на совершенно разные направления. - Таблица 3.3 Таблица косинусов для графического изображения корреляции между переменными
На рис.1 приводится простой пример. Корреляции между переменными VI и V2 должны быть равны 0, и это выражается двумя векторами равной длины, выходящими из одной точки, но под прямым углом друг к другу (90°), как изображено в табл. 3. Корреляция между VI и V3 равна 0, 5, а корреляция между V2 и V3 составляет 0, 867, поэтому переменная V3 располагается, как показано на рисунке. п VI V3 V2 Рис. 3.1. Корреляции между тремя переменными и их геометрическое выражение. Рис. 3. 2. Геометрическое выражение корреляций между пятью переменными. Корреляции не всегда возможно представить в двух измерениях (т.е. на плоском листе бумаги). Последнее не является проблемой для собственно математических процедур факторного анализа, однако оно означает, что нельзя использовать этот геометрический метод, чтобы проводить факторной анализ в реальной жизни. Рис. 3 является хорошей апроксимацией данных, представленных в табл. 2. Игнорируя векторы F1 и F2, можно видеть, что корреляции между переменными VI, V2 и V3, показанные на этом рисунке, очень большие и положительные (т.е. между этими векторами – маленькие углы). Сходным образом корреляции между переменными с V4 по V6 – тоже большие и положительные. Поскольку переменные с VI по V3 имеют близкие к 0 корреляции с V4, V5 и V6, то переменные VI, V2 и V3 с V4, V5 и V6 образуют прямой угол. Компьютерная программа по факторному анализу, по существу, попытается «объяснить» корреляции между переменными в категориях меньшего числа факторов. Полезно говорить об «общих факторах» вместо просто «факторов» – они означают то же самое, но позволяют обеспечить большую точность. Данный пример ясно указывает на то, что существует два кластера корреляций, поэтому информация, полученная из табл. 2, может быть апроксимирована двумя общими факторами, каждый из которых проходит через группу больших корреляций. Общие факторы на рис. 3 изображены в виде более длинных векторов, обозначенных F1 и F2. Должно быть ясно, что измеряя угол между каждым общим фактором и каждой переменной, можно вычислить корреляции между каждой переменной и каждым общим фактором. Переменные VI, V2 и V3 будут иметь большие корреляции с фактором Fl (V2 фактически будет иметь корреляцию, близкую к 1, 0, с фактором F1, поскольку фактор F1, по сути, находится на вершине этой переменной). Переменные VI, V2 и V3 будут иметь корреляции, близкие к 0, с фактором F2, поскольку они фактически находятся под прямым углом к нему. Подобно этому фактор F2 имеет высокую корреляцию с V4, V5, V6 и, по сути, не коррелирует с VI, V2, V3 (потому что между этим фактором и указанными переменными угол составляет 90°). Пока не будем беспокоиться по поводу того, как возникают эти факторы и как они располагаются по отношению к переменным, поскольку эти вопросы будут обсуждаться в далее. Рис.3. 3.Приблизительное геометрическое выражение корреляций, которые даны в табл.2. F1 F2 В приведенном выше примере два кластера переменных (и, следовательно, два общих фактора) находятся под прямыми углами друг к другу. Методика этого варианта известна как «ортогональное решение. Однако это не значит, что оно применяется всегда. Рассмотрим корреляции, представленные в графической форме на рис. 4. Очевидно, что здесь имеются два отдельных кластера переменных, и ясно, что нет способа, с помощью которого два ортогональных (т.е. некоррелирующих) общих фактора, изображенных векторами F1 и F2, могут быть проведены через центр каждого кластера. Очевидно, что имело бы смысл создать условия для факторов, чтобы они могли коррелировать, и провести один общий фактор через середину каждого кластера переменных. Разновидности факторного анализа, в которых вычисляются корреляции между самими факторами (расположенными не под прямыми углами), известны как «облические решения». Рис. 3. 4. Корреляции между шестью переменными, образующими два ортогональных фактора. Корреляции между факторами формируют так называемую «матрицу взаимных корреляций факторов». Когда осуществляется ортогональное решение, все корреляции между различными факторами равны 0. (Корреляция, равная 0, предполагает наличие угла в 90° между каждой парой факторов, что представляет, по существу, другой способ констатировать независимость факторов.) Таблица 3.4 Приблизительная матрица факторной структуры, полученная на основе рис.3.
Все корреляции между каждым заданием и каждым общим фактором можно представить в таблице, называемой «факторной матрицей» или «матрицей факторной структуры». Корреляции между заданиями и общими факторами известны как «факторные нагрузки». По традиции общие факторы располагаются в таблице в столбцах, а переменные в – строках. В табл. 4 величины были получены с помощью оценки углов между каждым общим фактором и каждой переменной, изображенных на рис. 14.3, и переводом (довольно приблизительным) этих значений в корреляции с использованием табл. 3. Факторная матрица крайне важна. Прежде всего, она показывает, какие переменные образуют каждый общий фактор. Это может быть выявлено путем выбора тех переменных, которые имеют нагрузки большие (по абсолютной величине), чем 0, 4 или 0, 3, что соответствует углу от 60 до 75° между переменной и общим фактором. Из табл. 4 следует вывод, что фактор F1 – это сочетание переменных VI, V2 и V3 (но не V4, V5 и V6, поскольку их факторные нагрузки меньше чем 0, 4), а фактор F2 представляет собой сочетание переменных V4, V5 и V6. Таким образом, факторная матрица может быть использована для того, чтобы дать пробное наименование общему фактору. Например, представим себе, что факторизации подвергались 100 заданий, оценивающих способности, и было установлено, что переменные, которые имеют существенные нагрузки (больше 0, 4) по первому общему фактору, были связаны с правописанием, словарем, знанием пословиц и вербальным пониманием, в то время как ни одно из других заданий (математические задачи, головоломки, требующие визуализации объектов, тесты памяти и т.д.) не обнаружили больших нагрузок по этому фактору. Поскольку все задания, имеющие высокую нагрузку, включали использование языка, можно назвать общий фактор фактором «вербальных способностей», «языковых способностей» или чем-нибудь подобным. Однако, нет никакой гарантии правильности наименований, данных таким образом. Необходимо точно валидизировать фактор, чтобы убедиться, что наименование полностью ему соответствует. Однако если задания, определяющие общий фактор, образуют надежную шкалу, которая позволяет прогнозировать данные учителями оценки языковых способностей, значимо коррелируют с другими хорошо проверенными тестами вербальных способностей и практически совсем не коррелируют с другими показателями личности или способностей, можно с высокой вероятностью утверждать, что фактор был идентифицирован правильно. Вспомним, что квадрат коэффициента корреляции показывает, какая часть «вариативности» является общей для двух переменных, или, говоря проще, он показывает, насколько сильно они перекрываются. Две переменные с корреляцией 0, 8 перекрываются со степенью 0, 8 х 0, 8 = 0, 64. Поскольку факторные нагрузки представляют просто корреляции между общими факторами и заданиями, подразумевается, что возведенная в квадрат каждая факторная нагрузка показывает долю перекрытия между каждой переменной и каждым общим фактором. Этот простой факт формирует основу для двух других главных направлений использования факторной матрицы. Факторная матрица может выявить долю перекрытия между каждой переменной и всеми общими факторами. Если общие факторы образуют прямые углы («ортогональное» решение), то вычислить, какая часть вариативности каждой переменной измеряется ими, не составит труда: это делается просто суммированием квадратов факторных нагрузок по всем факторам. Из табл. 4 можно увидеть, что 0, 92 + 0, 102 = 0, 82 вариативности VI «объясняется» двумя факторами. Эта доля называется общностью данной переменной. Переменная с высокой общностью имеет большую степень перекрытия с одним или большим числом общих факторами. Низкая общность подразумевает, что все корреляции между переменными и общими факторами невелики, другими словами, ни один из общих факторов не имеет большого перекрытия с этой переменной. Это может означать, что переменная измеряет нечто концептуально отличающееся от других переменных, включенных в анализ. Например, одно задание, связанное с оценкой личности, среди ста заданий, оценивающих способности, будет иметь общность, близкую к нулю. Это может также означать, что определенное задание испытывает на себе сильное влияние ошибки измерения или степени сложности, например, задание настолько простое, что каждый испытуемый дает на него правильный ответ, или задание было настолько двусмысленно сформулировано, что никто не смог понять суть вопроса. Какова бы ни была причина, низкая общность подразумевает, что задание не совмещается с общими факторами либо потому, что оно измеряет другую черту, либо из-за большой ошибки измерения, либо потому, что существуют некоторые индивидуальные различия между людьми, обусловливающие вариативность ответов на это задание. Наконец, факторная матрица показывает относительную значимость общих факторов. Можно вычислить, какую часть вариативности объясняет каждый общий фактор. Общий фактор, который объясняет 40% перекрытия между переменными в исходной корреляционной матрице, очевидно, является более значимым, чем другой, который объясняет только 20% вариативности. Еще раз подчеркнем, что необходимо допущение ортогональности общих факторов (т.е. их взаимного расположения под прямым углом). Первый шаг состоит в том, чтобы вычислить так называемое собственное значение {eigenvalue) для каждого фактора. Это можно сделать с помощью возведения в квадрат факторных нагрузок и их сложения по столбцу. Используя данные, представленные в табл. 4, можно убедиться, что собственное значение фактора 1 составляет (0, 902 + 0, 982 + 0, 902 + 0, 102 + 0, 02 + (-0, 10)2 = 2, 60. Если собственное значение фактора разделить на число переменных (шесть в этом примере), это число покажет, какая пропорция вариативности объясняется каждым общим фактором. Здесь фактор 1 объясняет 0, 43 или 43%, информации в исходной корреляционной матрице. • Прежде чем завершить изучение факторной матрицы, целесообразно разобраться с вопросом, который может возникнуть у читателя. Представим себе, что один из факторов в анализе имеет ряд нагрузок, больших по абсолютной величине и отрицательных (например, -0, 6; –0, 8), а некоторые его нагрузки близки к нулю (–0, 1, +0, 2) и в нем нет больших положительных нагрузок. Предположим также, что задания с большими отрицательными нагрузками принадлежат к утверждениям такого типа, где согласие кодируется «1», несогласие – «0» (например: «вы нервозный человек? » и «много ли вы беспокоитесь? »). Большие отрицательные корреляции подразумевают, что фактор измеряет психологическую характеристику, противоположную нервозности и склонности к беспокойству. Она может быть гипотетически идентифицирована как «эмоциональная стабильность» или что-то близкое к ней. Хотя интерпретировать факторы таким способом абсолютно приемлемо, иногда может быть удобнее изменить все знаки всех нагрузок переменных по данному фактору на противоположные. Так, нагрузки, упоминавшиеся выше, будут изменены с –0, 6; –0, 8; –0, 1 и +0, 2 на +0, 6; +0, 8; +0, 1 и –0, 2. Подобная процедура выполняется только ради удобства.
Факторный анализ, по сути, представляет собой методику для компактного представления информации – для построения широких обобщений на основе детально подобранных данных. В нашем примере мы рассматривали корреляции между шестью переменными, наблюдали, как они распадаются на два отдельных кластера, и поэтому решили, что наиболее экономно анализировать материал в понятиях двух факторов, а не шести исходных переменных. Другими словами, число конструктов, необходимых для описания данных, уменьшилось с шести (число переменных) до двух (число общих факторов). Данная апроксимация полезна, но несовершенна, как и любая другая. Часть информации в исходной корреляционной матрице была принесена в жертву построению широкого обобщения. Она может рассматриваться как неизбежное следствие уменьшения числа конструктов с шести до двух.
Популярное:
|
Последнее изменение этой страницы: 2017-03-03; Просмотров: 751; Нарушение авторского права страницы