Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
ПОСТРОЕНИЕ МОДЕЛИ МНОЖЕСТВЕННОЙ РЕГРЕССИИ
Цель работы: овладеть способами построения модели множественной линейной регрессии и выработать умения и навыки нахождения параметров уравнения, оценки надежности уравнения регрессии и его параметров, проведения экономической интерпретации полученных результатов.
Содержание работы: на основании опытных данных требуется 1. Рассмотреть результативные и факторные признаки и определить форму связи между ними. Построить все корреляционные поля (попарно). И на основании этого записать уравнение множественной регрессии. 2. Исключить лишние факторы, обосновав математически данный выбор. 3. Измерить тесноту связи между факторами. 4. Используя метод наименьших квадратов оценить уравнение регрессии. 5. Проверить на адекватность уравнение регрессии используя следующие способы: – используя критерий Фишера; – с помощью коэффициента детерминации; – используя среднюю ошибку аппроксимации. 6. Дать экономическую интерпретацию найденных оценок уравнения регрессии. Задача. Исходные данные для признаков , , , – для различных нефтегазодобывающих управлений — приведены в табл. 2. 21.
Таблица 2.21
В таблице обозначено: – коэффициент эксплуатации скважин; – дебит скважин (тн/сут.); – уровень автоматизации труда (%); – производительность труда (тн/чел.).
Выполнение работы Определим форму связи. Для чего строим корреляционные поля, по которым можно предположить, что зависимость между факторными признаками , , и результативным признаком может носить линейный характер. Решим вопрос о включении факторных признаков , , в уравнение линейной регрессии. Найдем коэффициенты парной корреляции. Предварительно составим расчетную табл. 2.22. Пользуясь табл. 2.22 и формулами находим: , . , . , . , . . Таблица 2.22 Коэффициенты парной корреляции равны соответственно: , . По найденным коэффициентам парной корреляции видно, что сильно коррелируют между собой факторы или . Для решения вопроса о том, какой из факторов или следует исключить из модели множественной линейной регрессии, вычислим коэффициенты парной корреляции и : , .
Так как , то между признаками и связь сильнее, чем между и . Этот факт подтверждается путем вычисления коэффициентов частной корреляции и :
, .
Поэтому из модели множественной линейной регрессии исключаем фактор . Тогда в модель будут включены факторы и и уравнение регрессии запишется в виде:
.
Включение фактора в модель обосновано значимостью коэффициента парной корреляции :
.
Для выяснения вопроса о силе линейной связи между факторами, включенными в модель, вычисляем множественный коэффициент корреляции R: .
Так как в нашем примере объем выборки небольшой ( ), то произведем корректировку R:
.
Проверяем значимость по критерию Стьюдента. Вычисляем среднеквадратическую ошибку :
,
Вычисляем статистику (ф.1.102):
По таблице критических точек распределения Стьюдента при уровне значимости с числом степеней свободы находим (приложение 5). Так как , то делаем вывод, что значим. Для нахождения оценок , , уравнения регрессии решаем систему нормальных уравнений:
Решив эту систему, получаем , , . Тогда уравнение регрессии, устанавливающее зависимость производительности труда от коэффициента эксплуатации и дебита скважин запишется в виде . Проверяем адекватность уравнения регрессии. Используем коэффициент детерминации , полагая . Для полученной модели . Это означает, что полученная модель приблизительно на 66% объясняет изменение производительности труда в зависимости от изменения включенных в модель факторов и , что является не плохим показателем. Проведем проверку модели на адекватность по критерию Фишера – Снедекора. Найдем статистику по формуле (ф.1.78), полагая в ней :
.
По таблице критических точек распределения Фишера — Снедекора при уровне значимости и числах степеней свободы , (p — число факторов , включенных в модель, n — объем выборки) находим . Так как , то найденное уравнение регрессии, устанавливающее зависимость производительности труда на десяти нефтегазодобывающих управлениях (НГДУ) от коэффициента эксплуатации скважин и дебита скважин , значимо описывает опытные данные и может быть принято для руководства. Оценим адекватность уравнения регрессии по средней ошибке аппроксимации , которую вычислим по формуле (ф.1.63):
.
Для нахождения суммы составляем расчетную табл. 2.23.
По данной таблице находим: . Среднеквадратическая ошибка небольшая, что дает основание считать, что построенная модель адекватно описывает опытные данные. Итак, все три метода проверки модели на адекватность подтвердили гипотезу о том, что уравнение регрессии в целом статистически значимо и хорошо соответствует данным наблюдений. Дадим экономическую интерпретацию найденных коэффициентов уравнения регрессии. Значение свободного члена характеризует влияние неучтенных в модели факторов, в частности фактора (уровень автоматизации труда). Знак минус говорит о том, что отсутствие этого фактора в модели отрицательно сказывается на повышении производительности труда. Величина коэффициента показывает, что при увеличении коэффициента эксплуатации на 0, 01 производительность труда увеличивается в среднем на 86, 3271 тн/чел. Коэффициент показывает, что при увеличении дебита скважин на одну тонну производительность труда увеличивается в среднем на 0, 360611 тн/чел. Лабораторная работа № 6. Популярное:
|
Последнее изменение этой страницы: 2016-04-10; Просмотров: 543; Нарушение авторского права страницы