Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Тема 2. Линейная модель парной регрессии
Изучая эту тему, следует рассмотреть понятия статистической связи экономических данных. Выделяют две категории зависимости: 1) функциональные и 2) корреляционные. Измерение тесноты линейной связи между показателями, проверку значимости коэффициентов корреляции и анализ матрицы коэффициентов парной корреляции следует изучить по материалу параграфа 3.2.2 «Оценка тесноты линейной связи» (Здесь и далее ссылки даны на учебное пособие Орлова И.В., Половников В.А.Экономико-математические методы и модели: компьютерное моделирование: Учеб. пособие – М.: Вузовский учебник, 2012). Особое внимание необходимо уделить решению комплексного примера 3.2.1. этого параграфа. При решении аналогичных примеров следует использовать статистические функции EXCEL и инструменты Анализа данных. экономические данные представляют собой количественные характеристики каких-либо экономических объектов или процессов. Они формируются под действием множества факторов, не все из которых доступны внешнему контролю. Неконтролируемые факторы могут принимать случайные значения из некоторого множества значений и тем самым обуславливать случайность данных, которые они определяют. Стохастическая (вероятностная) природа экономических данных обуславливает необходимость применения соответствующих статистических методов для их обработки и анализа. Статистические распределения характеризуются наличием более или менее значительной вариации в величине признака у отдельных единиц совокупности. Естественно, возникает вопрос о том, какие же причины формируют уровень признака в данной совокупности и каков конкретный вклад каждой из них. Изучение зависимости вариации признака от окружающих условий и составляет содержание теории корреляции (Основоположниками теории корреляции считаются английские биометрики Ф. Гальтон (1822-1911) и К.Пирсон (1857-1936). Термин «корреляция» был заимствован из естествознания и обозначает соотношение, соответствие. Представление о корреляции как об отношении взаимозависимости между случайными переменными величинами лежит в основе математико-статистической теории корреляции). Изучение действительности показывает, что вариация каждого изучаемого признака находится в тесной связи и взаимодействии с вариацией других признаков, характеризующих исследуемую совокупность единиц. Вариация уровня производительности труда работников предприятий зависит от степени совершенства применяемого оборудования, технологии, организации производства, труда и управления и других самых различных факторов. При изучении конкретных зависимостей одни признаки выступают в качестве факторов, обусловливающих изменение других признаков. Признаки этой первой группы в дальнейшем будем называть признаками-факторами (факторными признаками); а признаки, которые являются результатом влияния этих факторов, будем называть результативными. Например, при изучении зависимости между производительностью труда рабочих и энерговооруженностью их труда уровень производительности труда является результативным признаком, а энерговооруженность труда рабочих - факторным признаком. Рассматривая зависимости между признаками, необходимо выделить прежде всего две категории зависимости: 1) функциональные и 2) корреляционные. Функциональные связи характеризуются полным соответствием между изменением факторного признака и изменением результативной величины, и каждому значению признака-фактора соответствуют вполне определенные значения результативного признака. Функциональная зависимость может связывать результативный признак с одним или несколькими факторными признаками. Так, величина тока в цепи зависит от напряжения и сопротивления, площадь прямоугольника от величины его сторон. В корреляционных связях между изменением факторного и результативного признака нет полного соответствия, воздействие отдельных факторов проявляется лишь в среднем при массовом наблюдении фактических данных. Одновременное воздействие на изучаемый признак большого количества самых разнообразных факторов приводит к тому, что одному и тому же значению признака-фактора соответствует множество значений результативного признака, поскольку в каждом конкретном случае прочие факторные признаки могут изменять силу и направленность своего воздействия. При сравнении функциональных и корреляционных зависимостей следует иметь в виду, что при наличии функциональной зависимости между признаками можно, зная величину факторного признака, точно определить величину результативного признака. При наличии же корреляционной зависимости устанавливается лишь тенденция изменения результативного признака при изменении величины факторного признака. В отличие от жесткости функциональной связи корреляционные связи характеризуются множеством причин и следствий и устанавливаются лишь их тенденции. Основная задача корреляционного анализа заключается в выявлении взаимосвязи между случайными переменными путем точечной и интервальной оценки парных (частных) коэффициентов корреляции, вычисления и проверки значимости множественных коэффициентов корреляции и детерминации. Кроме того, с помощью корреляционного анализа решаются следующие задачи: отбор факторов, оказывающих наиболее существенное влияние на результативный признак, на основании измерения степени связи между ними; обнаружение ранее неизвестных причинных связей. Корреляция непосредственно не выявляет причинных связей между параметрами, но устанавливает численное значение этих связей и достоверность суждений об их наличии. Изучив основы корреляционного анализа, следует перейти к изучению основ регрессионного анализа на примере модели парной регрессии. Предпосылки применения метода наименьших квадратов (МНК) изложены в учебном пособии в параграфе 3.3.1. Здесь же приведены свойства оценок МНК. В тех случаях, когда предпосылки выполняются, оценки, полученные по МНК, будут обладать свойствами несмещенности, состоятельности и эффективности. Несмещенность оценки означает, что математическое ожидание остатков равно нулю. Если оценки обладают свойством несмещенности, то их можно сравнивать по разным исследованиям. Для практических целей важна не только несмещенность, но и эффективность оценок. Оценки считаются эффективными, если они характеризуются наименьшей дисперсией. Поэтому несмещенность оценки должна дополняться минимальной дисперсией. Степень достоверности доверительных интервалов параметров регрессии обеспечивается, если оценки будут не только несмещенными и эффективными, но и состоятельными. Состоятельность оценок характеризует увеличение их точности с увеличением объема выборки. Оценка параметров регрессионного уравнения с помощью метода наименьших квадратов (МНК) описана в параграфе 3.3.2. Показатели качества регрессии модели парной регрессии рекомендуется изучить по материалу параграфа 3.3.3. При оценке качества уравнения регрессии особо следует выделить коэффициент детерминации и критерий Фишера. F-критерий Фишера, вычисляемый как отношение дисперсии исходного ряда и несмещенной дисперсии остаточной компоненты используется для проверки значимости модели регрессии. Если расчетное значение с n1= k и n2 = (n - k - 1) степенями свободы, где k – количество факторов, включенных в модель, больше табличного при заданном уровне значимости, то модель считается значимой В этом же параграфе приведены сведения о показателях оценки точности модели регрессии. Порядок расчета точечного прогноза по модели и доверительного интервала прогноза изложен в параграфе 3.3.4. Там же рассмотрены важные методологические вопросы экономического прогнозирования на основе трендовых моделей. Изучение примера 3.3.1 позволит на практике проверить полученные знания. Подробное изложение применения инструмента Регрессия (Анализ данных в EXCEL) изложено в параграфе 3.4.3. Регрессионный анализпредназначен для исследования зависимости исследуемой переменной от различных факторов и отображения их взаимосвязи в форме регрессионной модели. В регрессионных моделях зависимая (объясняемая) переменная Y может быть представлена в виде функции f (X 1, X 2, X 3, … X m), где X 1, X 2, X 3, … X m - независимые (объясняющие) переменные, или факторы. В качестве зависимой переменной может выступать практически любой показатель, характеризующий, например, деятельность предприятия или курс ценной бумаги. В зависимости от вида функции f (X 1, X 2, X 3, … X m) модели делятся на линейные и нелинейные. В зависимости от количества включенных в модель факторов Х модели делятся на однофакторные (парная модель регрессии) и многофакторные. Основная часть курса «эконометрики» посвящена регрессионному анализу. рассматривается метод наименьших квадратов, основная модель линейной регрессии, методы оценки параметров регрессии в случаях, когда нарушаются требования основной модели (мультиколлинеарность, автокорреляция и гетероскедастичность ошибок по наблюдениям, ошибки в переменных), способы включения в регрессионное уравнение качественных факторов (фиктивные или псевдопеременные). Большое внимание уделяется применению основных критериев проверки статистических гипотез в регрессионном анализе (тестированию): критерии Стьюдента, Фишера и Дарбина-Уотсона. Завершается эта часть изложением некоторых проблем и методов оценки параметров одновременных систем уравнений. регрессионный анализ используют для оценки уравнения, которое в наибольшей степени соответствует совокупности наблюдений зависимых и независимых переменных, и тем самым дающему наилучшую оценку истинного соотношения между этими переменными. С помощью оцененного таким образом уравнения можно предсказать, каково будет значение зависимой переменной для данного значения независимой переменной. Простейшим примером регрессии является парная линейная регрессия всего одной независимой переменной и одной зависимой переменной (скажем, располагаемый доход и потребительские расходы). Задача будет заключаться в подборе прямой линии к совокупности данных, состоящих из пар наблюдений дохода и потребления. Линию, которая лучше всего подходит к данным, нужно выбирать так, чтобы сумма квадратов значений вертикальных отклонений точек от линии была минимальной. Этот метод наименьших квадратов применяется при анализе большинства регрессий. Степень приближения регрессионной линии к наблюдениям измеряется коэффициентом корреляции. Регрессионное уравнение не дает точного прогноза зависимой переменной для любого заданного значения независимой переменной, так как коэффициенты регрессии подвержены случайным искажениям. Чтобы учесть погрешности оцененного уравнения регрессии, отражающего действительные закономерности поведения всего населения на основе выборочного наблюдения, уравнение регрессии обычно записывается как: Y = a + bx + В уравнении — дополнительный остаточный член, который отражает остаточное действие случайной вариации и действие других независимых переменных (например, влияние процентных ставок на потребительский кредит), которые воздействуют на потребительские расходы, но в уравнение регрессии явным образом не включены. Исходная форма уравнения регрессии используется для оценки параметров, если факторы-регрессоры детерминированы и наблюдаются без ошибок, а ошибки не зависят друг от друга и имеют (по всем наблюдениям) одинаковую дисперсию. Это весьма жесткие требования, и экономическая информация практически никогда им не удовлетворяет. Как правило, необходимо проверить множество различных гипотез, прежде чем будет найдена наиболее приемлемая форма регрессионного уравнения (способ преобразования массива исходных наблюдений). С помощью эконометрических моделей отражают особенности экономических переменных и связи между ними. В уравнения регрессии могут включаться переменные не только в первой, но и во второй степени — с целью отразить свойство оптимальности экономических переменных: наличия значений, при которых достигается мини - максное воздействие на зависимую переменную. Таково, например, влияние внесения удобрений на урожайность: до определенного уровня насыщение почвы удобрениями способствует росту урожайности; по достижении оптимального уровня насыщения удобрениями его дальнейшее наращивание не приводит к росту урожайности и даже может вызвать ее снижение. То же можно сказать о воздействии многих социально-экономических переменных (скажем, возраста рабочего на уровень производительности труда или влияния дохода на потребление некоторых продуктов питания и т. д.). В конкретных условиях нелинейность влияния переменных может не подтвердиться, если данные варьируют в узких пределах, т.е. являются однородными. В качестве основного литературного источника рекомендуется использовать [2, 4], в качестве дополнительного – [3].
|
Последнее изменение этой страницы: 2017-05-11; Просмотров: 99; Нарушение авторского права страницы