Изменчивости главных компонент.

⇐ ПредыдущаяСтр 3 из 12Следующая ⇒

На рис. 4.1 изображен вариант изменения кумулятивной изменчивости главных компонент. Из графика непосредственно видно, что первые четыре компоненты определяют около 95% общей изменчивости переменных , так что доля 5-й и последующих компонент явно незначительна. В этом случае в модель целесообразно включить лишь первые четыре компоненты.

В том случае, если ½ ½ = 0, матрица имеет ранг r< n, у нас имеется лишь r отличных от нуля собственных чисел, которым соответствуют r главных компонент, определяющих суммарную изменчивость переменных , i=1, 2,..., n. Тогда число включаемых в модель компонент не превосходит числа r. В исследованиях реальных процессов число главных компонент обычно существенно меньше количества независимых переменных.

Отобрав существенные главные компоненты можно приступить к построению эконометрической модели, в которой они выступают в качестве независимых переменных, опосредованно отображая влияние факторов , i=1, 2,..., n на характер изменения зависимой переменной .

Представим такую модель в линейном виде.

где g₁,..., g_k; x_t– ошибка модели в момент t.

Вследствие ортогональности новых независимых переменных z₁, z₂, ..., z_k при использовании МНК для определения неизвестных коэффициентов g_j, j=1, 2,..., k модели (4.48) вычислительных проблем не возникает. Заметим, что ковариационная матрица оценок с_j коэффициентов модели g_jна практике имеет следующий вид:

Соv ( с )=s_u²( Z ¢ Z )^–1=s_u²( В ¢ В )^–1=s_u², (4.49)

где рассматривается как оценка дисперсии ошибки x_tмодели (4.48) и – расчетные значения центрированной переменной , t=1, 2,..., Т. Таким образом, дисперсия оценки j-го коэффициента модели и взаимные ковариации этих оценок определяются следующими выражениями:

s²(с_j)=s_u²× m_j=s_u² b _j¢ ( )^–1 b _j, (4.50)

cov(с_j, с_i)=0; j, i=1, 2,..., k; j¹ i.

Следует однако заметить, что использование моделей с главными компонентами в социально-экономических исследованиях порождает ряд проблем содержательного характера. Дело в том, что каждая из компонент, будучи линейной комбинацией изначально отобранных в модель факторов, в общем случае не допускает четкого содержательного толкования, поскольку эти факторы часто имеют различную природу и возможно разные единицы измерения. В такой ситуации дать удовлетворительное содержательное (экономическое) обоснование закономерностям изменения переменной у_t в зависимости от изменения компонент, природа которых не поддается четкому объяснению, довольно затруднительно.

Содержание компонент достаточно сложно установить и в ситуациях, когда факторы х_i имеют сходное содержание (например, в экономических исследованиях все факторы часто удается представить в стоимостном виде). Однако и в этом случае компонентам, которые являются различными вариантами экономически не определенных линейных комбинаций пусть и объективных стоимостных характеристик, дать убедительное содержательное обоснование обычно не представляется возможным.

С содержательной точки зрения более обоснованным представляется другой подход, согласно которому после построения модели с главными компонентами, осуществляется переход к модели с изначально отобранными факторами. Это несложно сделать путем подстановки в выражение (4.48) уже сформированных линейных комбинаций (выражение (4.21)). Проделав несложные преобразования, получим:

где – коэффициенты, которые можно рассматривать как “оценки оценок” коэффициентов исходной модели (4.18).

Однако, если количество включенных в модель компонент k меньше числа изначальных факторов п (k < п), имеется в виду случай, когда матрица ( ) имеет ранг п, то уравнение (4.51) не соответствует исходному варианту эконометрической модели (4.18), т. е. Отличия этих уравнений обусловлены потерями информации вследствие невключения в модель нескольких “малозначимых” компонент. Формальное соответствие этих показателей достигается только в том случае, когда в модель включают все п компонент. Вместе с тем заметим, что увеличивать число главных компонент за счет “малозначимых” также нецелесообразно, поскольку если собственное число матрицы близко к нулю при его определении в ходе решения характеристического уравнения

½ ( )–m Е ½ =0. (4.52)

возникают ошибки округления. Они опять же способствуют тому, что модель, построенная с использованием процедуры (4.51) не будет соответствовать истинной модели процесса.

Заметим, что рассмотренный подход неприемлем и в ситуации, когда две или несколько изначальных переменных связаны строгой линейной зависимостью (например, =a₀+a₁ ), т. е. матрица имеет ранг r< п. В этом случае можно показать, что коэффициенты при зависимых переменных, полученные из модели с главными компонентами, оказываются пропорциональны угловому параметру этой зависимости a₁ и не имеют отношения к истинным их взаимосвязям с переменной .

Таким образом, при использовании главных компонент обычно приходятся выбирать “меньшее из нескольких зол”, порожденных проблемами с вычислениями, проблемами с содержательной интерпретацией компонент, проблемами с потерей точности при построении модели. Частичный компромисс при решении этих проблем возможен, когда компоненты строятся на основе неполного набора исходных факторов, между которыми существует сильная зависимость, а остальные факторы включаются в модель без преобразования. Например, если исходные переменные х₁,..., х_mсвязаны между собой и с переменными х_m₊₁,..., х_n относительно слабой корреляционной зависимостью, а между последними эта зависимость является достаточно сильной, что служит причиной плохой обусловленности матрицы , то главные компоненты целесообразно формировать только на основе переменных с индексами i=т+1,..., п. Этот прием оказывается особенно полезным, когда переменные х_m₊₁,..., х_nявляются однородными по своему содержанию. В таких ситуациях иногда удается придать им вполне конкретный смысл.

В заключении данного раздела заметим, что при разномасштабных исходных факторах различной природы рекомендуется главные компоненты строить на основе их нормированных безразмерных величин. Их получают путем следующего преобразования:

где – cреднеквадратическое отклонение переменной x_i, i=1, 2,..., n.

В этом случае удается избежать влияния масштаба переменных x_iна оценки параметров моделей и легко оценивается истинное влияние каждой из них и на главные компоненты и на зависимую переменную у_t.

⇐ Предыдущая 1 234 5 6 7 8 9 10 Следующая ⇒