Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Выборочная ковариация между х и y определяется какСтр 1 из 3Следующая ⇒
Другим эквивалентным выражением является Теоретическая ковариация Если х и y— случайные величины, то теоретическая ковариация определяется как математическое ожидание произведения отклонений этих величин от их средних значений: рор.соv(х, y)=sxy =M{(x-mx)(y-my)}, (4) где mx, и my - теоретические средние значения х и y соответственно. Если теоретическая ковариация неизвестна, то для ее оценки может быть использована выборочная ковариация, вычисленная по ряду наблюдений. Оценка будет иметь отрицательное смещение, так как (5) Если х и y независимы, то их теоретическая ковариация равна нулю, поскольку (6) благодаря свойству независимости, и факту, что Е(х) и Е (y) равняются соответственно mx, и my. Выборочная дисперсия Для выборки из n наблюдений х1 ,..., хn выборочная дисперсия определяется как среднеквадратичное отклонение в выборке: (7) Выборочная дисперсия представляет собой смещенную оценку теоретической дисперсии. S2 определенная как является несмещенной оценкой s2. Отсюда следует, что ожидаемое значение величины Var(x) равно [(n - 1)/n] s 2 и что, следовательно, она имеет отрицательное смещение. Отметим, что если размер выборки n становится большим, то (n-1)/n стремится к единице и, таким образом, математическое ожидание величины Var(х) стремится к s2. Ее предел по вероятности (plim) равен s2 и, следовательно, она является примером состоятельной оценки, которая смещена для небольших выборок. Правила расчета дисперсии Правила для расчета дисперсии, являются аналогами правил для ковариации. Они используются как для выборочной, так и для теоретической дисперсии. 1. Если , то 2. Если где а является постоянной, то 3. Если y=а, где а является постоянной, то Var(y) = 0. 4. Если y = n+а, где а является постоянной, то Var(y) = Var(n). Заметим, что дисперсия переменной х может рассматриваться как ковариация между двумя величинами х: (8) Используя соотношение (3) для выборочной ковариации, получим: (9) Теоретическая дисперсия выборочного среднего Если две переменные независимы (и следовательно, их совокупная ковариация равняется нулю), то теоретическая дисперсия суммы этих переменных будет равна сумме их теоретических дисперсий: pop. var (х + y) = pop. var (х) + pop. var (y) + 2 pop. cov (x, y) = Следовательно, теоретическая дисперсия суммы любого числа переменных равняется сумме их дисперсий при условии, что наблюдения независимы друг от друга. Если случайная переменная х имеет дисперсию s2, то дисперсия выборочного среднего х будет равна s2/n, где n - число наблюдений в выборке: Выборочное среднее является наиболее эффективной несмещенной оценкой теоретического среднего при условии, что наблюдения проводятся независимо друг от друга на основе одного и того же распределения. Коэффициент корреляции Более точной мерой зависимости является тесно связанный с ней коэффициент корреляции. Подобно дисперсии и ковариации, коэффициент корреляции имеет две формы - теоретическую и выборочную. Для переменных х и y теоретический коэффициент корреляции определяется следующим образом: (12) Если х и y независимы, то r равно нулю, так как равна нулю теоретическая ковариация. Если между переменными существует положительная зависимость, то sxy, а следовательно, и rxy, будут положительными. Если существует строгая положительная линейная зависимость, то rxy примет максимальное значение, равное 1. Аналогичным образом при отрицательной зависимости rxy будет отрицательным с минимальным значением –1. Выборочный коэффициент корреляции r определяется путем замены теоретических дисперсий и ковариации в выражении (12) на их несмещенные оценки. Такие оценки могут быть получены умножением выборочных дисперсий и ковариации на n/(n- 1). Следовательно, (13) Множители n/(n-1) сокращаются, поэтому можно определить выборочную корреляцию как (14) Подобно величине р, r имеет максимальное значение, равное единице, которое получается при строгой линейной положительной зависимости между выборочными значениями х и y (когда на диаграмме рассеяния все точки находятся точно на восходящей прямой линии). Аналогичным образом r принимает минимальное значение —1, когда существует линейная отрицательная зависимость (точки лежат точно на нисходящей прямой линии). Величина r = 0 показывает, что зависимость между наблюдениями х и y в выборке отсутствует. Разумеется, тот факт, что r=0, необязательно означает, что р=0, и наоборот. Экспериментальная часть В качестве примера рассматриваются данные по личному располагаемому доходу и совокупным личным расходам населения некоторого региона нашей страны за 1970-1994 гг. Таблица 1
Демонстрация вычисления выборочного коэффициента корреляции на примере данных таблицы 1. Для его вычисления сначала найдем средние (для рассматриваемого выборочного периода) значения показателей дохода и расходов и . Затем вычисляются отклонения величин от их средних и перемножаются. Средняя величина этого произведения будет выборочной ковариацией. Данные вычислений приведены в таблице 2. Таблица 2
В данном случае ковариация положительна. Построим диаграмму рассеивания (см. Рис.2). Видно, что положительные вклады доминируют над отрицательными, что подтверждает расчетное значение ковариации Cov (х, y) = 34513, 68 Демонстрация и доказательство 1 правила ковариации Обратимся снова к данным Таблицы 1, заметим, что совокупные личные расходы делятся на две части: расходы на жилье и расходы на питание. Рассчитаем Cov (х, n) и Cov (х, w). Расчетные данные приведены в таблицах 3 и 4. Таблица 3
Таблица 4
Таким образом Cov(х, n)=20287, 055 и Cov(х, w)=14226, 6249, а Cov (х, n)+Cov (х, w)= 34513, 68. Видно, что Cov(х, y) является суммой Cov (х, v) и Cov (х, w). Покажем, что именно так и должно быть. Рассмотрим i-ый показатель, —это его вклад в величину Соv(х, y). Поскольку yi=vi+wi, и , то = = + , Таким образом, показано, что вклад, показателя i в Cov(x, y) является суммой его вкладов в Cov(x, n) и Cov(x, w). То же самое справедливо для всех показателей и, соответственно, для ковариации в целом. Демонстрация и доказательство 2 правила ковариации Для доказательства второго правила ковариации увеличим y в 10 раз, обозначив полученное число z и рассчитаем Cov(x, z). Для вычисления Cov(x, z), как и ранее, необходимы значения , а также рассчитанные в таблице 5. Таблица 5
Из Таблицы 5 видно, что Cov(x, z)=345136, 8, что в точности равно удесятеренной Cov(x, y). Таким образом проверено, что Соv(х, 10y) совпадает с 10Cov(x, y). Для доказательства рассмотрим первый показатель. Поскольку zi =10y1 и =10 , а = и, следовательно, равно 10 , то вклад первого показателя в величину Cov(x, z) в точности равен удесятеренной величине его вклада в Cov(x, y). То же самое справедливо для всех других показателей. Средняя величина поэтому равна удесятеренной средней величине 10 и, таким образом, Cov(x, z) = 10Cov(x, y). Обобщая, получим, что если z=аy (и отсюда z=аy), то Демонстрация и доказательство 3 правила ковариации Поскольку каждый показатель в выборке имеет два пути расходования (жилье и питание), предположим, что надо вычислить ковариацию между личным располагаемым доходом и числом путей расходования (а). Естественно, что a1 = a2 =... = a20 = 2. Таким образом, a = 2. Отсюда (а-а)=0 и, следовательно, (x-x)(a-a)=0. Поэтому Cov(x, a)==0. Таблица, обычно используемая в таких случаях будет выглядеть так: Таблица 6
Для расчета выборочной дисперсии x и y воспользуемся соотношениями и . Полученные результаты приведены в таблице 6. Таблица 6
Таким образом Var(x)=38047, 99, а Var(y)= 31373, 1. Вычисление выборочного коэффициента корреляции рассмотрим на примере данных из таблицы 1. Ранее была рассчитана Cov(x, y)= 34513, 68, поэтому можно рассчитать коэффициент корреляции по формуле: Подставив в формулу необходимые значения, получим: rx, y=0, 99896. Покажем, что коэффициент корреляции, в отличие от ковариации, не зависит от единиц, в которых измеряются переменные х и y. Допустим, что единица измерения одной из переменных изменилась: пересчитаем значения переменной y (совокупные личные расходы) в долларах по курсу 1: 20. Т. е. для переменной y вводится постоянный коэффициент перерасчета а=1/20. Воспользовавшись 2 правилом расчета ковариации получим: Y=1/20y, Cov(x, Y)=1/20Cov(x, y). Исполь-зуя 2 правило расчета дисперсии: Y=1/20y, Var(Y)=1/400Var(y). Подставляем полученные выражения в формулу коэффициента корреляции: Т.о. мы доказали, что величина коэффициента корреляции не зависит от единиц измерения переменных. Вывод Коэффициент корреляции является более подходящим измерителем зависимости, чем ковариация. Основная причина этого заключается в том, что ковариация зависит от единиц, в которых измеряются переменные х и y, в то время как коэффициент корреляции есть величина безразмерная. Задание на расчетную работу 1. Изучить материалы лекций по теме " Ковариация, дисперсия и корреляция". 2. Рассчитать показатели выборочной ковариации и выборочного коэффициента корреляции и дать их экономическую трактовку. Построить диаграмму рассеяния наблюдений. 3. Продемонстрировать основные правила ковариации. 4. Вычислить коэффициент корреляции, используя формулы для выборочной ковариации и дисперсии. 5. Сравнить полученные результаты и прокомментировать возможные причины положительной корреляции между двумя переменными. 6. Показать, что коэффициент корреляции остается неизменным при изменении единицы измерения одной из переменных. При выполнении данной расчетной работы рекомендуется использовать пакет прикладных программ Microsoft Excel. Содержание отчета Отчет должен содержать: - титульный лист; - задание; - постановку задачи; - результаты выполнения задания; - выводы с экономической трактовкой. 5. Контрольные вопросы 1. Приведите формулу для вычисления показателя выборочной ковариации. 2. Перечислите основные правила расчета ковариации. 3. Определите понятие теоретической ковариации. 4. Дайте определение понятия выборочной дисперсии. 5. Приведите расчетную формулу для выборочной дисперсии. 6. Перечислите правила расчета дисперсии. 7. Определите понятие теоретической дисперсии. 8. Приведите расчетную формулу для коэффициента выборочной корреляции. 9. В каком случае коэффициент выборочной корреляции принимает максимальное значение, равное единице?
Практическая работа №2 ПРИМЕНЕНИЕ ПАРНОГО РЕГРЕССИОННОГО АНАЛИЗА. ОПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТОВ ПО МНК Цель практической работы Цель: освоение методики построения уравнения парной линейной регрессии. |
Последнее изменение этой страницы: 2017-04-13; Просмотров: 916; Нарушение авторского права страницы