Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Методом наименьших квадратов
При совместном исследовании двух случайных величин по имеющейся выборке (х1, у2), (х2, у2), …, (xk, yk) возникает, как указывалось выше, задача определения зависимости между ними. Если вид функции y = f (x, a, b,...) задан, то требуется найти значения коэффициентов a, b,..., при которых yi наименее отличаются от f (xi). В методе наименьших квадратов, как отмечалось, коэффициенты должны быть такими, что принимает минимальное значение. а) Линейная зависимость y = ax + b. Если , то из условия получаем: б) Квадратичная зависимость y = (ax + b)2. Отсюда и система для определения a, b может быть получена по аналогии с предыдущим случаем с помощью замены yi на : в) Показательная зависимость Логарифмируя, получаем: lny=ax + b, и система уравнений для a, b имеет вид: г) Зависимость вида Тогда y2 = ax + b, и условия для а и b можно задать так: д) Логарифмическая зависимость y = ln(ax + b), то есть ey = ax + b, и
Пример. Найти параметры зависимости между х и у для выборки
для случаев: 1) линейной зависимости y = ax + b; 2) квадратичной зависимости y = (ax + b)2; 3) показательной зависимости y = eax + b. Определить, какая из функций является лучшим приближением зависимости между х и у. По виду выборки достаточно очевидно, что связь между х и у скорее всего не является линейной – у растет не пропорционально х. Проверим это предположение, найдя коэффициенты а и b для каждой из функций. Для этого вычислим предварительно = 3, 1; = 40, 0; Теперь можно решать линейные системы для а и b: 1) то есть линейная зависимость имеет вид: у = 27, 34х – 44, 74. 2) квадратичная функция: у = (2, 29х – 1, 68)2. 3) показательная функция: у = е0, 94х + 0, 04. Вычислим значения :
Итак, наилучшим приближением является квадратичная функция. ◄
2.3. Ранговая корреляция Пусть объекты генеральной совокупности обладают двумя качественными признаками (то есть признаками, которые невозможно измерить точно, но которые позволяют сравнивать объекты между собой и располагать их в порядке убывания или возрастания качества). Договоримся для определенности располагать объекты в порядке ухудшения качества. Пусть выборка объема п содержит независимые объекты, обладающие двумя качественными признаками: А и В. Требуется выяснить степень их связи между собой, то есть установить наличие или отсутствие ранговой корреляции. Расположим объекты выборки в порядке ухудшения качества по признаку А, предполагая, что все они имеют различное качество по обоим признакам. Назовем место, занимаемое в этом ряду некоторым объектом, его рангом х i: х1 = 1, х2 = 2, …, хп = п. Теперь расположим объекты в порядке ухудшения качества по признаку В, присвоив им ранги уi , где номер i равен порядковому номеру объекта по признаку А, а само значение ранга равно порядковому номеру объекта по признаку В. Таким образом, получены две последовательности рангов: по признаку А … х1, х2, …, хп по признаку В … у1, у2, …, уп. При этом, если, например, у3 = 6, то это означает, что данный объект занимает в ряду по признаку А третье место, а в ряду по признаку В – шестое. Сравним полученные последовательности рангов. 1. Если xi = yi при всех значениях i, то ухудшение качества по признаку А влечет за собой ухудшение качества по признаку В, то есть имеется «полная ранговая зависимость». 2. Если ранги противоположны, то есть х1 = 1, у1 = п; х2 = 2, у2 = п – 1; …, хп = п, уп = 1, то признаки тоже связаны: ухудшение качества по одному из них приводит к улучшению качества по другому («противоположная зависимость»). 3. На практике чаще всего встречается промежуточный случай, когда ряд уi не монотонен. Для оценки связи между признаками будем считать ранги х1, х2, …, хп возможными значениями случайной величины Х, а у1, у2, …, уп – возможными значениями случайной величины Y. Теперь можно исследовать связь между Х и Y, вычислив для них выборочный коэффициент корреляции , (2) где (условные варианты). Поскольку каждому рангу xi соответствует только одно значение yi, то частота любой пары условных вариант с одинаковыми индексами равна 1, а с разными индексами – нулю. Кроме того, из выбора условных вариант следует, что , поэтому формула (2) приобретает более простой вид: . (3) Итак, требуется найти и . Можно показать, что . Учитывая, что , можно выразить через разности рангов . После преобразований получим: , , откуда . Подставив эти результаты в (3), получим выборочный коэффициент ранговой корреляции Спирмена: . (4)
|
Последнее изменение этой страницы: 2017-05-11; Просмотров: 463; Нарушение авторского права страницы