Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Выборочная ковариация между х и y определяется как



Другим эквивалентным выражением является

Теоретическая ковариация

Если х и y— случайные величины, то теоретическая ковариация определяется как математическое ожидание произведения отклонений этих величин от их средних значений:

рор.соv(х, y)=sxy =M{(x-mx)(y-my)}, (4)

где mx, и my - теоретические средние значения х и y соответственно.

Если теоретическая ковариация неизвестна, то для ее оценки может быть использована выборочная ковариация, вычисленная по ряду наблюдений. Оценка будет иметь отрицательное смещение, так как

(5)

Если х и y независимы, то их теоретическая ковариация равна нулю, поскольку

(6)

благодаря свойству независимости, и факту, что Е(х) и Е (y) равняются соответственно mx, и my.

Выборочная дисперсия

Для выборки из n наблюдений х1 ,..., хn выборочная дисперсия определяется как среднеквадратичное отклонение в выборке:

(7)

Выборочная дисперсия представляет собой смещенную оценку теоретической дисперсии. S2 определенная как

является несмещенной оценкой s2. Отсюда следует, что ожидаемое значение величины Var(x) равно [(n - 1)/n] s 2 и что, следовательно, она имеет отрицательное смещение. Отметим, что если размер выборки n становится большим, то (n-1)/n стремится к единице и, таким образом, математическое ожидание величины Var(х) стремится к s2. Ее предел по вероятности (plim) равен s2 и, следовательно, она является примером состоятельной оценки, которая смещена для небольших выборок.

Правила расчета дисперсии

Правила для расчета дисперсии, являются аналогами правил для ковариации. Они используются как для выборочной, так и для теоретической дисперсии.

1. Если , то

2. Если где а является постоянной, то

3. Если y=а, где а является постоянной, то Var(y) = 0.

4. Если y = n+а, где а является постоянной, то Var(y) = Var(n).

Заметим, что дисперсия переменной х может рассматриваться как ковариация между двумя величинами х:

(8)

Используя соотношение (3) для выборочной ковариации, получим:

(9)

Теоретическая дисперсия выборочного среднего

Если две переменные независимы (и следовательно, их совокупная ковариация равняется нулю), то теоретическая дисперсия суммы этих переменных будет равна сумме их теоретических дисперсий:

pop. var (х + y) = pop. var (х) + pop. var (y) + 2 pop. cov (x, y) =
= pop. var (x) + pop. var (y) =sx2+sy2. (10)

Следовательно, теоретическая дисперсия суммы любого числа переменных равняется сумме их дисперсий при условии, что наблюдения независимы друг от друга. Если случайная переменная х имеет дисперсию s2, то дисперсия выборочного среднего х будет равна s2/n, где n - число наблюдений в выборке:

Выборочное среднее является наиболее эффективной несмещенной оценкой теоретического среднего при условии, что наблюдения проводятся независимо друг от друга на основе одного и того же распределения.

Коэффициент корреляции

Более точной мерой зависимости является тесно связанный с ней коэффициент корреляции.

Подобно дисперсии и ковариации, коэффициент корреляции имеет две формы - теоретическую и выборочную. Для переменных х и y теоретический коэффициент корреляции определяется следующим образом:

(12)

Если х и y независимы, то r равно нулю, так как равна нулю теоретическая ковариация. Если между переменными существует положительная зависимость, то sxy, а следовательно, и rxy, будут положительными. Если существует строгая положительная линейная зависимость, то rxy примет максимальное значение, равное 1. Аналогичным образом при отрицательной зависимости rxy будет отрицательным с минимальным значением –1.

Выборочный коэффициент корреляции r определяется путем замены теоретических дисперсий и ковариации в выражении (12) на их несмещенные оценки. Такие оценки могут быть получены умножением выборочных дисперсий и ковариации на n/(n- 1). Следовательно,

(13)

Множители n/(n-1) сокращаются, поэтому можно определить выборочную корреляцию как

(14)

Подобно величине р, r имеет максимальное значение, равное единице, которое получается при строгой линейной положительной зависимости между выборочными значениями х и y (когда на диаграмме рассеяния все точки находятся точно на восходящей прямой линии). Аналогичным образом r принимает минимальное значение —1, когда существует линейная отрицательная зависимость (точки лежат точно на нисходящей прямой линии). Величина r = 0 показывает, что зависимость между наблюдениями х и y в выборке отсутствует. Разумеется, тот факт, что r=0, необязательно означает, что р=0, и наоборот.

Экспериментальная часть

В качестве примера рассматриваются данные по личному располагаемому доходу и совокупным личным расходам населения некоторого региона нашей страны за 1970-1994 гг.

Таблица 1

№ п/п Показатели Совокупные личные расходы (у) Расходы на жилье (n) Расходы на питание (w) Личный располагаемый доход (х)
1. 440, 4 264, 24 176, 16 479, 7
2. 271, 2 180, 8 489, 7
3. 461, 4 322, 98 138, 42 503, 8
4. 385, 6 96, 4 524, 9
5. 500, 5 300, 3 200, 2 542, 3
6. 580, 8
7. 557, 5 390, 25 167, 25 616, 3
8. 585, 7 351, 42 234, 28 646, 8
9. 602, 7 482, 16 120, 54 673, 5
10. 634, 4 444, 08 190, 32 701, 3
11. 657, 9 592, 11 65, 79 722, 5
12. 672, 1 403, 26 268, 84 751, 6
13. 696, 8 418, 08 278, 72 779, 2
14. 737, 1 515, 97 221, 13 810, 3
15. 768, 5 614, 8 153, 7 865, 3
16. 763, 6 534, 52 229, 08 858, 4
17. 780, 2 390, 1 390, 1 875, 8
18. 823, 1 411, 55 411, 55 906, 8
19. 864, 3 691, 44 172, 86 942, 9
20. 903, 2 541, 92 361, 28 988, 8
21. 927, 6 649, 32 278, 28 1015, 5
22. 931, 8 559, 08 372, 72 1021, 6
23. 950, 9 475, 45 475, 45 1049, 3
24. 963, 3 674, 31 288, 99 1058, 3
25. 1009, 2 605, 52 403, 68 1095, 4

Демонстрация вычисления выборочного коэффициента корреляции на примере данных таблицы 1. Для его вычисления сначала найдем средние (для рассматриваемого выборочного периода) значения показателей дохода и расходов и . Затем вычисляются отклонения величин от их средних и перемножаются. Средняя величина этого произведения будет выборочной ковариацией. Данные вычислений приведены в таблице 2.

Таблица 2

№ п/п x y
479, 7 440, 4 -300, 332 -267, 368 80299, 17
489, 7 -290, 332 -255, 768 74257, 63
503, 8 461, 4 -276, 232 -246, 368 68054, 73
524, 9 -255, 132 -225, 768 57600, 64
542, 3 500, 5 -237, 732 -207, 268 49274, 24
580, 8 -199, 232 -179, 768 35815, 54
616, 3 557, 5 -163, 732 -150, 268 24603, 68
646, 8 585, 7 -133, 232 -122, 068 16263, 36
673, 5 602, 7 -106, 532 -105, 068 11193, 1
701, 3 634, 4 -78, 732 -73, 368 5776, 409
722, 5 657, 9 -57, 532 -49, 868 2869, 006
751, 6 672, 1 -28, 432 -35, 668 1014, 113
779, 2 696, 8 -0, 832 -10, 968 9, 125376
810, 3 737, 1 30, 268 29, 332 887, 821
865, 3 768, 5 85, 268 60, 732 5178, 496
858, 4 763, 6 78, 368 55, 832 4375, 442
875, 8 780, 2 95, 768 72, 432 6936, 668
906, 8 823, 1 126, 768 115, 332 14620, 41
942, 9 864, 3 162, 868 156, 532 25494, 05
988, 8 903, 2 208, 768 195, 432 40799, 95
1015, 5 927, 6 235, 468 219, 832 51763, 4
1021, 6 931, 8 241, 568 224, 032 54118, 96
1049, 3 950, 9 269, 268 243, 132 65467, 67
1058, 3 963, 3 278, 268 255, 532 71106, 38
1095, 4 1009, 2 315, 368 301, 432 95062, 01
Сумма 19500, 8 17694, 2    
Среднее 780, 032 707, 768     34513, 68

В данном случае ковариация положительна. Построим диаграмму рассеивания (см. Рис.2). Видно, что положительные вклады доминируют над отрицательными, что подтверждает расчетное значение ковариации Cov (х, y) = 34513, 68


Рис. 2.

Демонстрация и доказательство 1 правила ковариации

Обратимся снова к данным Таблицы 1, заметим, что совокупные личные расходы делятся на две части: расходы на жилье и расходы на питание. Рассчитаем Cov (х, n) и Cov (х, w). Расчетные данные приведены в таблицах 3 и 4.

Таблица 3

№ п/п x n
479, 7 264, 24 -300, 332 -197, 906 59437, 625
489, 7 271, 2 -290, 332 -190, 946 55437, 85
503, 8 322, 98 -276, 232 -139, 166 38442, 213
524, 9 385, 6 -255, 132 -76, 5464 19529, 436
542, 3 300, 3 -237, 732 -161, 846 38476, 068
580, 8 -199, 232 -198, 146 39477, 104
616, 3 390, 25 -163, 732 -71, 8964 11771, 741
646, 8 351, 42 -133, 232 -110, 726 14752, 3
673, 5 482, 16 -106, 532 20, 0136 -2132, 0888
701, 3 444, 08 -78, 732 -18, 0664 1422, 4038
722, 5 592, 11 -57, 532 129, 9636 -7477, 0658
751, 6 403, 26 -28, 432 -58, 8864 1674, 2581
779, 2 418, 08 -0, 832 -44, 0664 36, 663245
810, 3 515, 97 30, 268 53, 8236 1629, 1327
865, 3 614, 8 85, 268 152, 6536 13016, 467
858, 4 534, 52 78, 368 72, 3736 5671, 7743
875, 8 390, 1 95, 768 -72, 0464 -6899, 7396
906, 8 411, 55 126, 768 -50, 5964 -6414, 0044
942, 9 691, 44 162, 868 229, 2936 37344, 59
988, 8 541, 92 208, 768 79, 7736 16654, 175
1015, 5 649, 32 235, 468 187, 1736 44073, 393
1021, 6 559, 08 241, 568 96, 9336 23416, 056
1049, 3 475, 45 269, 268 13, 3036 3582, 2338
1058, 3 674, 31 278, 268 212, 1636 59038, 341
1095, 4 605, 52 315, 368 143, 3736 45215, 445
Сумма 19500, 8 11553, 66     507176, 37
Среднее 780, 032 462, 1464     20287, 055

 

Таблица 4

№ п/п x w
479, 7 176, 16 -300, 332 -69, 4616 20861, 5413
489, 7 180, 8 -290, 332 -64, 8216 18819, 7848
503, 8 138, 42 -276, 232 -107, 202 29612, 5124
524, 9 96, 4 -255, 132 -149, 222 38071, 2053
542, 3 200, 2 -237, 732 -45, 4216 10798, 1678
580, 8 -199, 232 18, 3784 -3661, 56539
616, 3 167, 25 -163, 732 -78, 3716 12831, 9388
646, 8 234, 28 -133, 232 -11, 3416 1511, 06405
673, 5 120, 54 -106, 532 -125, 082 13325, 193
701, 3 190, 32 -78, 732 -55, 3016 4354, 00557
722, 5 65, 79 -57, 532 -179, 832 10346, 0716
751, 6 268, 84 -28, 432 23, 2184 -660, 145549
779, 2 278, 72 -0, 832 33, 0984 -27, 5378688
810, 3 221, 13 30, 268 -24, 4916 -741, 311749
865, 3 153, 7 85, 268 -91, 9216 -7837, 97099
858, 4 229, 08 78, 368 -16, 5416 -1296, 33211
875, 8 390, 1 95, 768 144, 4784 13836, 4074
906, 8 411, 55 126, 768 165, 9284 21034, 4114
942, 9 172, 86 162, 868 -72, 7616 -11850, 5363
988, 8 361, 28 208, 768 115, 6584 24145, 7729
1015, 5 278, 28 235, 468 32, 6584 7690, 00813
1021, 6 372, 72 241, 568 127, 0984 30702, 9063
1049, 3 475, 45 269, 268 229, 8284 61885, 4336
1058, 3 288, 99 278, 268 43, 3684 12068, 0379
1095, 4 403, 68 315, 368 158, 0584 49846, 5615
Сумма 19500, 8 6140, 54     355665, 624
Среднее 780, 032 245, 6216     14226, 6249

Таким образом Cov(х, n)=20287, 055 и Cov(х, w)=14226, 6249, а Cov (х, n)+Cov (х, w)= 34513, 68. Видно, что Cov(х, y) является суммой Cov (х, v) и Cov (х, w).

Покажем, что именно так и должно быть. Рассмотрим i-ый показатель, —это его вклад в величину Соv(х, y). Поскольку yi=vi+wi, и , то

= = + ,

Таким образом, показано, что вклад, показателя i в Cov(x, y) является суммой его вкладов в Cov(x, n) и Cov(x, w). То же самое справедливо для всех показателей и, соответственно, для ковариации в целом.

Демонстрация и доказательство 2 правила ковариации

Для доказательства второго правила ковариации увеличим y в 10 раз, обозначив полученное число z и рассчитаем Cov(x, z). Для вычисления Cov(x, z), как и ранее, необходимы значения , а также рассчитанные в таблице 5.

Таблица 5

№ п/п x z
479, 7 -300, 332 -2673, 68 802991, 66
489, 7 -290, 332 -2557, 68 742576, 35
503, 8 -276, 232 -2463, 68 680547, 25
524, 9 -255, 132 -2257, 68 576006, 41
542, 3 -237, 732 -2072, 68 492742, 36
580, 8 -199, 232 -1797, 68 358155, 38
616, 3 -163, 732 -1502, 68 246036, 8
646, 8 -133, 232 -1220, 68 162633, 64
673, 5 -106, 532 -1050, 68 111931, 04
701, 3 -78, 732 -733, 68 57764, 094
722, 5 -57, 532 -498, 68 28690, 058
751, 6 -28, 432 -356, 68 10141, 126
779, 2 -0, 832 -109, 68 91, 25376
810, 3 30, 268 293, 32 8878, 2098
865, 3 85, 268 607, 32 51784, 962
858, 4 78, 368 558, 32 43754, 422
875, 8 95, 768 724, 32 69366, 678
906, 8 126, 768 1153, 32 146204, 07
942, 9 162, 868 1565, 32 254940, 54
988, 8 208, 768 1954, 32 407999, 48
1015, 5 235, 468 2198, 32 517634, 01
1021, 6 241, 568 2240, 32 541189, 62
1049, 3 269, 268 2431, 32 654676, 67
1058, 3 278, 268 2555, 32 711063, 79
1095, 4 315, 368 3014, 32 950620, 07
Сумма 19500, 8    
Среднее 780, 032 7077, 68     345136, 8

Из Таблицы 5 видно, что Cov(x, z)=345136, 8, что в точности равно удесятеренной Cov(x, y). Таким образом проверено, что Соv(х, 10y) совпадает с 10Cov(x, y). Для доказательства рассмотрим первый показатель. Поскольку zi =10y1 и =10 , а = и, следовательно, равно 10 , то вклад первого показателя в величину Cov(x, z) в точности равен удесятеренной величине его вклада в Cov(x, y). То же самое справедливо для всех других показателей. Средняя величина поэтому равна удесятеренной средней величине 10 и, таким образом, Cov(x, z) = 10Cov(x, y). Обобщая, получим, что если z=аy (и отсюда z=аy), то

Демонстрация и доказательство 3 правила ковариации

Поскольку каждый показатель в выборке имеет два пути расходования (жилье и питание), предположим, что надо вычислить ковариацию между личным располагаемым доходом и числом путей расходования (а). Естественно, что a1 = a2 =... = a20 = 2. Таким образом, a = 2. Отсюда (а-а)=0 и, следовательно, (x-x)(a-a)=0. Поэтому Cov(x, a)==0.

Таблица, обычно используемая в таких случаях будет выглядеть так:

Таблица 6

№ п/п x a
479, 7 -300, 332
489, 7 -290, 332
503, 8 -276, 232
524, 9 -255, 132
542, 3 -237, 732
580, 8 -199, 232
616, 3 -163, 732
646, 8 -133, 232
673, 5 -106, 532
701, 3 -78, 732
722, 5 -57, 532
751, 6 -28, 432
779, 2 -0, 832
810, 3 30, 268
865, 3 85, 268
858, 4 78, 368
875, 8 95, 768
906, 8 126, 768
942, 9 162, 868
988, 8 208, 768
1015, 5 235, 468
1021, 6 241, 568
1049, 3 269, 268
1058, 3 278, 268
1095, 4 315, 368
Сумма 19500, 8    
Среднее 780, 032    

Для расчета выборочной дисперсии x и y воспользуемся соотношениями и . Полученные результаты приведены в таблице 6.

Таблица 6

№ п/п x y
479, 7 440, 4 90199, 31 71485, 65
489, 7 84292, 67 65417, 27
503, 8 461, 4 76304, 12 60697, 19
524, 9 65092, 34 50971, 19
542, 3 500, 5 56516, 5 42960, 02
580, 8 39693, 39 32316, 53
616, 3 557, 5 26808, 17 22580, 47
646, 8 585, 7 17750, 77 14900, 6
673, 5 602, 7 11349, 07 11039, 28
701, 3 634, 4 6198, 728 5382, 863
722, 5 657, 9 3309, 931 2486, 817
751, 6 672, 1 808, 3786 1272, 206
779, 2 696, 8 0, 692224 120, 297
810, 3 737, 1 916, 1518 860, 3662
865, 3 768, 5 7270, 632 3688, 376
858, 4 763, 6 6141, 543 3117, 212
875, 8 780, 2 9171, 51 5246, 395
906, 8 823, 1 16070, 13 13301, 47
942, 9 864, 3 26525, 99 24502, 27
988, 8 903, 2 43584, 08 38193, 67
1015, 5 927, 6 55445, 18 48326, 11
1021, 6 931, 8 58355, 1 50190, 34
1049, 3 950, 9 72505, 26 59113, 17
1058, 3 963, 3 77433, 08 65296, 6
1095, 4 1009, 2 99456, 98 90861, 25
Сумма 19500, 8 17694, 2 951199, 7 784327, 6
Среднее 780, 032 707, 768 38047, 99 31373, 1

Таким образом Var(x)=38047, 99, а Var(y)= 31373, 1.

Вычисление выборочного коэффициента корреляции рассмотрим на примере данных из таблицы 1. Ранее была рассчитана Cov(x, y)= 34513, 68, поэтому можно рассчитать коэффициент корреляции по формуле:

Подставив в формулу необходимые значения, получим: rx, y=0, 99896.

Покажем, что коэффициент корреляции, в отличие от ковариации, не зависит от единиц, в которых измеряются переменные х и y. Допустим, что единица измерения одной из переменных изменилась: пересчитаем значения переменной y (совокупные личные расходы) в долларах по курсу 1: 20. Т. е. для переменной y вводится постоянный коэффициент перерасчета а=1/20. Воспользовавшись 2 правилом расчета ковариации получим: Y=1/20y, Cov(x, Y)=1/20Cov(x, y). Исполь-зуя 2 правило расчета дисперсии: Y=1/20y, Var(Y)=1/400Var(y).

Подставляем полученные выражения в формулу коэффициента корреляции:

Т.о. мы доказали, что величина коэффициента корреляции не зависит от единиц измерения переменных.

Вывод

Коэффициент корреляции является более подходящим измерителем зависимости, чем ковариация. Основная причина этого заключается в том, что ковариация зависит от единиц, в которых измеряются переменные х и y, в то время как коэффициент корреляции есть величина безразмерная.

Задание на расчетную работу

1. Изучить материалы лекций по теме " Ковариация, дисперсия и корреляция".

2. Рассчитать показатели выборочной ковариации и выборочного коэффициента корреляции и дать их экономическую трактовку. Построить диаграмму рассеяния наблюдений.

3. Продемонстрировать основные правила ковариации.

4. Вычислить коэффициент корреляции, используя формулы для выборочной ковариации и дисперсии.

5. Сравнить полученные результаты и прокомментировать возможные причины положительной корреляции между двумя переменными.

6. Показать, что коэффициент корреляции остается неизменным при изменении единицы измерения одной из переменных.

При выполнении данной расчетной работы рекомендуется использовать пакет прикладных программ Microsoft Excel.

Содержание отчета

Отчет должен содержать:

- титульный лист;

- задание;

- постановку задачи;

- результаты выполнения задания;

- выводы с экономической трактовкой.

5. Контрольные вопросы

1. Приведите формулу для вычисления показателя выборочной ковариации.

2. Перечислите основные правила расчета ковариации.

3. Определите понятие теоретической ковариации.

4. Дайте определение понятия выборочной дисперсии.

5. Приведите расчетную формулу для выборочной дисперсии.

6. Перечислите правила расчета дисперсии.

7. Определите понятие теоретической дисперсии.

8. Приведите расчетную формулу для коэффициента выборочной корреляции.

9. В каком случае коэффициент выборочной корреляции принимает максимальное значение, равное единице?

 

 


Практическая работа №2

ПРИМЕНЕНИЕ ПАРНОГО РЕГРЕССИОННОГО АНАЛИЗА.

ОПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТОВ ПО МНК

Цель практической работы

Цель: освоение методики построения уравнения парной линейной регрессии.


Поделиться:



Последнее изменение этой страницы: 2017-04-13; Просмотров: 878; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.08 с.)
Главная | Случайная страница | Обратная связь