Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Построение моделей множественной регрессии включает
несколько этапов: 1. выбор формы связи (уравнения регрессии); 2. отбор факторных признаков; 3. обеспечение достаточного объема совокупности для получения несмещенных оценок. Рассмотрим более подробно каждый этап. 1. Выбор формы связи Выбор формы связи затрудняется тем, что, используя математический аппарат, теоретически зависимость между признаками может быть выражена большим числом различных функций. Выбор типа уравнения осложнен тем, что для любой формы зависимости выбирается целый ряд уравнений, которые в определенной степени будут описывать эти связи. Некоторые предпосылки для выбора определенного уравнения регрессии получают на основе анализа предшествующих аналогичных исследований или на базе анализа подобных работ в смежных отраслях знаний. Наиболее приемлемым способом определения вида исходного уравнения регрессии является метод перебора различных уравнений. Суть данного метода: с помощью специально разработанного алгоритма перебирается большое число уравнений с последующей статистической проверкой, главным образом, на основе t- критерия Стьюдента и F- критерия Фишера. Практика показывает, что все реально существующие зависимости между социально-экономическими явлениями можно описать, используя пять типов моделей: 1) линейная:
2) степенная: 3) показательная: 4) параболическая: 5) гиперболическая: где - факторные признаки; - параметры модели (искомые коэффициенты регрессии); - значения результативного признака. Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации. Нелинейные формы зависимости приводятся к линейным путем линеаризации. 2. Отбор факторных признаков Важным этапом построения уже выбранного уравнения множественной регрессии является отбор и последующее включение факторных признаков. Сложность формирования уравнения множественной регрессии заключается в том, что почти все факторные признаки находятся в зависимости один от другого. Проблема размерности модели связи , т. е. определение оптимального числа факторных признаков, является одной из основных проблем построения множественного уравнения регрессии. С одной стороны, чем больше факторных признаков включено в уравнение, тем оно лучше описывает явление. Однако модель размерностью 100 и более факторных признаков сложно реализуема и требует больших затрат машинного времени. Сокращение размерности модели за счет исключения второстепенных, экономически и статистически несущественных факторов способствует простоте и качеству ее реализации. В то же время построение модели регрессии малой размерности может привести к тому, что такая модель будет недостаточно адекватна исследуемым явлениям и процессам. Проблема отбора факторных признаков для построения моделей взаимосвязи может быть решена на основе эвристических или многомерных статистических методов анализа. Метод экспертных оценок как эвристический метод анализа основных макроэкономических показателей основан на интуитивно-логических предпосылках, содержательно-качественном анализе. Анализ экспертной информации проводится на базе расчета и анализа непараметрических показателей связи: ранговых коэффициентов корреляции Спирмена, Кендалла и конкордации. Наиболее приемлемым способом отбора факторных признаков является шаговая регрессия (шаговый регрессионный анализ). Сущность метода шаговой регрессии заключается в последовательном включении факторов в уравнение регрессии и последующей проверке их значимости. Факторы поочередно вводятся в уравнение так называемым «прямым методом». При проверке значимости введенного фактора определяется, насколько уменьшается сумма квадратов остатков и увеличивается вeличина мнoжecтвeннoro кoэффициента (R). Одновременно используется и обратный метод, т. е. исключение факторов, ставших незначимыми на основе t-критерия Стьюдента. Фактор является незначимым, если его включение в уравнение регрессии только изменяет значение коэффициентов регрессии, не уменьшая суммы квадратов остатков и не увеличивая их значения. Если при включении в модель соответствующего факторного признака величина множественного коэффициента корреляции увеличивается, а коэффициент регрессии не изменяется (или меняется несущественно), то данный признак существенен и его включение в уравнение регрессии необходимо. Если же при включении в модель факторного признака коэффициенты регрессии меняют не только величину, но и знаки, а множественный коэффициент корреляции не возрастает, то данный факторный признак признается нецелесообразным для включения в модель связи. Сложность и взаимное переплетение отдельных факторов, обусловливающих исследуемое экономическое явление (процесс), могут проявляться в так называемой мультиколлинеарности. Под мультиколли-неарностью понимается тесная зависимость между факторными признаками, включенными в модель. В решении проблемы мультиколлинеарности можно выделить несколько этапов: - установление наличия мультиколлинеарности; Наличие мультиколлинеарности между признаками приводит к: • искажению величины параметров модели, которые имеют тенденцию к завышению; • изменению смысла экономической интерпретации коэффициентов регрессии; • слабой обусловленности системы нормальных уравнений; • осложнению процесса определения наиболее существенных факторных признаков. - определение причин возникновения мультиколлинеарности; Причинами возникновения мультиколлинеарности между признаками являются: • изучаемые факторные признаки, характеризующие одну и ту же сторону явления или процесса. Например, показатели объема производимой продукции и среднегодовой стоимости основных фондов одновременно включать в модель не рекомендуется, так как они оба характеризуют размер предприятия; • использование в качестве факторных признаков показателей, суммарное значение которых представляет собой постоянную величину; • факторные признаки, являющиеся составными элементами друг друга; • факторные признаки, по экономическому смыслу дублирующие друг друга. - разработка мер по ее устранению. Устранение мультиколлинеарности может реализовываться через исключение из корреляционной модели одного или нескольких линейно-связанных факторных признаков или преобразование исходных факторных признаков в новые, укрупненные факторы. Вопрос о том, какой из факторов следует отбросить, решается на основании качественного и логического анализов изучаемого явления. 3. Обеспечение достаточного объема совокупности для получения несмещенных оценок Качество уравнения регрессии зависит от степени достоверности и надежности исходных данных и объема совокупности. Исследователь должен стремиться к увеличению числа наблюдений, так как большой объем наблюдений является одной из предпосылок построения адекватных статистических моделей. Для определения параметров уравнения регрессии используют метод наименьших квадратов. Например, для линейной множественной регрессии минимизируется выражение: Например, по параметру а1: В результате соответствующих преобразований система нормальных уравнений с k неизвестными (по числу параметров аi) имеет вид: Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии с помощью t-критерия Стьюдента. Проверка адекватности всей модели осуществляется с помощью расчета F-критерия и величины средней ошибки аппроксимации x.
Популярное:
|
Последнее изменение этой страницы: 2016-08-24; Просмотров: 692; Нарушение авторского права страницы