|
Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Выборочная ковариация. Выборочная дисперсия. Коэффициент корреляции
Выборочная ковариация Для изложения идей и понятий регрессионного анализа необходимо ввести понятия ковариации и корреляции [5, 15]. Различают выборочную и теоретическую ковариацию. Выборочной ковариацией двух переменных х и у называется средняя величина произведения отклонений этих переменных от своих средних, т.е.
Или где Выборочная ковариация является мерой взаимосвязи между двумя переменными. Пусть данные наблюдений переменных х и у представлены в виде точечного графика - диаграммы рассеяния наблюдений (рисунок 3.1). Точка Вертикальная и горизонтальная прямые, проведенные через точку Если положительные вклады преобладают над отрицательными, то ковариация будет положительной, в противном случае она будет отрицательной.
Рисунок 3.1 При положительной (прямой) связи с увеличением одной переменной другая переменная в среднем также увеличивается и наоборот при отрицательной связи. Правила расчета ковариации. 1) 2) Если 3) 4) 5) Теоретической ковариацией случайных величин где В записи Свойства теоретической ковариации: 1) 2) если случайные величины Доказательство:
Правила вычисления теоретической ковариации точно такие же, как и для выборочной ковариации. Пример 3.1. В некоторой бюрократической стране годовой доход каждого индивида у определяется по формуле: у = 10000+500 s + 200 t, где s – число лет обучения индивида; t – трудовой стаж(в годах); х – возраст индивида. Рассчитать cov (x, y ), cov (x, s), и cov (x, t) для выборки из пяти индивидов, описанной в таблице 3.1, и проверьте, что cov(x, y) = 500cov(x, s) + 200cov(x, t). Таблица 3.1
Объясните аналитически, почему так происходит. Решение. Вычислим средние значения:
Cov(x, y) = 4840 Cov(x, y) = 500 cov(x, s) +200 cov(x, t) = 500*4+200*14.2 = 4840 4840 = 4840.
Выборочная дисперсия Пусть имеем выборку из n наблюдений Выборочная дисперсия (вариация) определяется как среднеквадратическое отклонение в выборке Замечание 1. Определенная таким образом выборочная дисперсия представляет собой смещенную оценку теоретической дисперсии. Если Причем она имеет отрицательные смещения. Если размер выборки становится больше, то Так как, Правила расчета выборочной дисперсии: 1) 2) 3) 4) если 5)
6) Правила расчета выборочной дисперсии с помощью ковариации. 1) Если y=v+w , то 2) Коэффициент корреляции Более точной мерой зависимостей между величинами является коэффициент корреляции. Подобно дисперсии и ковариации коэффициент корреляции имеет две формы: - выборочную; - теоретическую. Теоретический коэффициент корреляции определяется выражением
где
Теоретический коэффициент корреляции показывает тесноту линейной связи двух случайных величин: - если между переменными - если существует строгая положительная линейная зависимость, то Аналогично:
Выборочный коэффициент корреляции определяется выражением:
Это выражение получено из выражения (3.1) путем замены теоретических дисперсий и ковариации на их несмещенные оценки. Эти оценки могут быть получены умножением выборочных дисперсий и ковариации на
Выборочный коэффициент корреляции является случайной величиной.
Геометрический смысл коэффициента корреляции (рисунок 3.2 (а, б, в, г)):
Рисунок 3.2 (а, б, в, г) На рисунке 3.2(а, б) Случайные величины Свойства коэффициента корреляции. - Eсли случайные величины - Равенство - Если
Контрольные вопросы: 1.Что такое выборочная, теоретическая ковариация? 2.Что такое выборочная дисперсия? 3.Какие две формы имеет коэффициент корреляции? 4.Правила расчета ковариации, дисперсии. 5. Что означает r =0. 6. Перечислите свойства коэффициентов корреляции
Парный регрессионный анализ |
Последнее изменение этой страницы: 2017-03-17; Просмотров: 389; Нарушение авторского права страницы