Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Формирование регрессионных моделей на компьютере с помощью ППП Excel



Однофакторная регрессия.

Параметры линейной регрессии у=ах+b можно получить с помощью статистической функции ЛИНЕЙН, которая входит в набор стандартных функций Excel .Однако использование этой функции довольно трудоемко.

Предпочтительней для получения однофакторных регрессий графиков и их применять Мастер диаграмм, строя предварительно точечный график исходных данных (диаграмму рассеяния), а затем использовать режим Добавить линию тренда (для этого необходимо установить курсор на любую точку точечной диаграммы и щелкнуть правой кнопкой мышки), причем в этом режиме кроме линейной функции Excel предоставляет возможность выбора еще пяти функций – логарифмической, полиномиальной, степенной, экспоненциальной и скользящей средней. После выбора функции в режиме Параметры необходимо задать флажки на Показать уравнение на диаграмме, и на Поместить на диаграмму значение достоверности аппроксимации(R^2).

 

Многофакторная регрессия.

Построение линейной многофакторной модели производится с помощью инструментов пакета анализа данных Корреляция и Регрессия. Корреляция используется для расчета таблицы парных коэффициентов корреляции. С помощью Регрессии, помимо результатов регрессионной статистики, дисперсионного анализа и доверительных интервалов, можно получить сумму квадратов остатков. Порядок действий следующий:

1) проверить доступ к пакету анализа. Пакет анализа является программой, доступной при надстройке Microsoft Office Excel, для чего необходимо сначала загрузить ее. Для версии 2003 в главном меню необходимо последовательно выбрать Сервис/Надстройки. Установить флажок Пакет анализа, затем нажать кнопку ОК.

Для версии 2007 щелкнуть Кнопку Microsoft Office , затем щелкнуть Параметры Excel. Выбрать команду Надстройки, в окошке Управление выбрать пункт Надстройки Excel. Нажать кнопку Перейти, в окошке Доступные надстройки установить флажок Пакет анализа, затем нажать кнопку ОК.

При появлении сообщения о том, что программа статистического анализа не установлена на компьютере и предлагается установить ее, нажать кнопку Да.

2) после окончания надстройки пакета анализа в версии 2003 Анализ данных становится доступной в пункте Сервис, а в версии 2007 на вкладке Данные справа.

3) ввести данные или открыть имеющийся файл, содержащий анализируемые данные;

4) в меню Анализ данных выбрать пункт Корреляция;

5) заполнить диалоговое окно входных данных и параметров вывода:

Входной интервал – номера ячеек, содержащих анализируемые данные (все столбцы или строки);

Группирование – по столбцам или по строкам;

Метки – задается, если первая строка содержит названия столбцов;

Выходной интервал – можно указать только левую верхнюю ячейку диапазона;

6) результаты вычислений – таблица парных коэффициентов корреляции, анализ которых позволяет выполнить первый этап процесса моделирования, описанный в 2.4;

7) в меню Анализ данных выбрать пункт Регрессия;

8) заполнить диалоговое окно входных данных и параметров вывода как в пункте 4, только интервал для результативного признака Y и для факторов Х надо задавать отдельно (причем входной интервал Х должен включать все столбцы, содержащие значения факторных признаков);

9) в результате получим регрессионную статистику, таблицу дисперсионного анализа и таблицу коэффициентов модели, в которой первая строка (Y-пересечение) соответствует коэффициенту а0, а следующие строки описывают коэффициенты регрессии аi.В 4 столбце находятся коэффициенты t-статистики, определяющие достоверность вычисленных коэффициентов регрессии: t=1 соответствует примерно 70% достоверности, t=2 соответствует примерно 95% достоверности, t=3 соответствует примерно 100% достоверности.

 

2.6. Практический блок

Примеры

Задача 2.1. В таблице указаны парные коэффициенты корреляции. Проведите анализ целесообразности включения заданных факторов в уравнение множественной линейной регрессии.

  y x1 x2 x3 x4
y        
x1 0, 71      
x2 0, 58 0, 53    
x3 0, 08 0, 2 0, 13  
x4 0, 62 0, 81 0, 3 0, 25

РЕШЕНИЕ. Между y и x3 связь практически отсутствует. Между y и x1 связь сильная, между y и x2, x4 – умеренная.

Отсюда следует вывод о нецелесообразности включения фактора x3 в уравнение множественной линейной регрессии (коэффициент парной корреляции су равен 0, 08).

Между факторами x1 и x4 существует сильная прямая связь (коэффициент парной корреляции > 0, 8). Для того, чтобы избежать явления мультиколлинеарности, один из этих факторов должен быть исключен из анализа. Исключается фактор x1, умеренно коррелирующий с x2 (коэффициент их парной корреляции равен 0, 53).

Факторы, включенные в модель множественной регрессии: x2, x4.

 

Задача 2. Построить линейную множественную регрессию общей суммы налогов и платежей на сумму поступлений по налогу на добавленную стоимость ( x1 ) и налогу на прибыль (доход) ( x2 ).

Время наблюдения y, млрд. руб. x1, млрд. руб. x2, млрд. руб.
январь 38, 9 5, 6 13, 4
февраль 45, 3 6, 7 15, 4
март 61, 1 13, 1 16, 7
I квартал 145, 3 25, 3 45, 5
апрель 70, 4 16, 9 16, 2
май 63, 8 18, 4
июнь 67, 7 19, 1
II квартал 201, 9 54, 4 44, 2
I полугодие 347, 2 79, 8 89, 7
июль 70, 6 16, 1 20, 8
август 78, 9 23, 3 16, 4
сентябрь 73, 2 19, 2 17, 4
III квартал 222, 7 58, 6 54, 6
9 месяцев 569, 9 138, 3 144, 3
октябрь 78, 1 16, 1 23, 6
ноябрь 31, 8 23, 9
декабрь 133, 4 35, 4 34, 4
IV квартал 314, 5 83, 3 81, 9
IIполугодие 537, 2 141, 9 136, 5
январь-декабрь 884, 4 221, 6 226, 1
 

а0=–9.7а1=1.84а2=2.62

Полученное уравнение

 

Контрольные вопросы.

1. Из каких этапов состоит проверка качества оцененного уравнения регрессии?

2. Что такое множественная регрессия?

3. Назовите задачи, решаемые при построении регрессии?

4. Назовите задачи, решаемые при спецификации модели?

5. Перечислите требования, предъявляемые к факторам, которые включаются в уравнение регрессии?

6. Что такое коллинеарность и мультиколлинеарность факторов?

7. Каким образом проверяется коллинеарность и мультиколлинеарность?

8. Какие методы применяются для устранения межфакторной корреляции?

9. Какие функции используются для построения множественной регрессии?

10. Как строится система нормальных уравнений при использовании метода наименьших квадратов для построения линейной многофакторной регрессии?

11. Какая формула используется для вычисления индекса множественной корреляции?

12. Когда необходимо выведение из рассмотрения незначимых объясняющих переменных и добавление новых переменных?

13. Что означает малое значение индекса множественной корреляции?

14. Как осуществляется проверка значимости уравнения регрессии и ее отдельных коэффициентов?

15. Таблицы каких распределений используются при оценке качества линейной регрессии?

16. Как вычисляются средние частные коэффициенты эластичности?

17. Как рассчитывается и что показывает коэффициент детерминации R2?

18. В каких задачах эконометрики используется распределение Фишера?

19. Как оценивается значимость факторов?

20. Какую формулу используют для вычисления частных коэффициентов корреляции?

21. Какой показатель характеризует долю объясненной с помощью регрессии дисперсии?

22. Какие показатели характеризуют независимость отклонений зависимой переменной от линии регрессии? Как осуществляется проверка этой независимости?

23. В каких случаях возникают трудности использования множественной линейной регрессии в моделировании? В чем реальная ситуация может не соответствовать предпосылкам модели?

Задания и задачи

1. Имеются данные по 10 фирмам, продающим компакт-диски, – объемы продаж, тыс. шт. / мес. (y), цены, руб. (x1), вложения в рекламу, тыс. руб. / мес. (x2).

y
x1
x2

А) Построить регрессионную зависимость

Б) Проверить гипотезу о значимости коэффициентов регрессии при уровнях значимости и .

В) Построить доверительные интервалы для коэффициентов регрессии а0, а1, а2 с вероятностью .

Г) Вычислить множественный коэффициент корреляции, проверить гипотезу о значимости модели при уровнях значимости и .

2. Известны данные: – цена квартиры, x1 – общая площадь, x2– площадь кухни.

 

y x1 x2
31, 5 6, 2
31, 8 5, 6
48, 8 7, 9
5, 6
7, 2
6, 8
6, 5

А) Построить регрессионную зависимость

Б) Проверить гипотезу о значимости коэффициентов регрессии при уровнях значимости и .

В) Построить доверительные интервалы для коэффициентов регрессии а0, а1, а2 с вероятностью .

Г) Вычислить множественный коэффициент корреляции, проверить гипотезу о значимости модели при уровнях значимости и .

3. Имеются данные по ценам на квартиры, тыс.руб. (y) в зависимости от общей площади, м2 (x1) и площади кухни, м2 (x2).

А) Построить регрессионную зависимость

Б) Обосновать наличие гетероскедастичности.

В) С помощью обобщенного метода наименьших квадратов построить зависимость с учетом гетероскедастичности.

y
x1
x2

4. Имеется информация по странам.

Страна Подушевой доход, $, y Индекс челове­ческой бедности, x1 Индекс челове­ческого развития, x2
ОАЭ 14, 9 0, 866
Таиланд 11, 7 0, 833
Уругвай 11, 7 0, 883
Ливия 18, 8 0, 801
Колумбия 10, 7 0, 848
Иордания 10, 9 0, 730
Египет 34, 8 0, 514
Марокко 41, 7 0, 566
Перу 22, 8 0, 717
Шри-Ланка 20, 7 0, 711
Филиппины 17, 7 0, 672
Боливия 22, 5 0, 589
Китай 17, 5 0, 626
Зимбабве 17, 3 0, 513
Пакистан 46, 8 0, 445
Уганда 41, 3 0, 328
Нигерия 41, 6 0, 393
Индия 36, 7 0, 446

Индекс челове­ческой бедности задается как средневзвешенная величина между абсолютным (меньше 1.5 $ на душу) и относительным (меньше 3 $ на душу) индексами бедности.

Индекс челове­ческого развития включает в себя показатели валового внутреннего продукта на душу населения, уровня грамотности и продолжительности жизни.

Задание.

Построить уравнение множественной линейной регрессии и пояснить экономический смысл полученных параметров.

Рассчитать частные коэффициенты эластичности.

Определить коэффициенты регрессии.

Сделать вывод о силе взаимосвязи результата и факторов.

Определить коэффициенты корреляции, сделать выводы.

Дать оценку полученной регрессии по коэффициенту детерминации.

Тесты

1. Значимость частных и парных коэффициентов корреляции проверяется с помощью:

а) нормального закона распределения;

б) t-критерия Стъюдента;

в) F–критерия;

г) таблицы Фишера – Иейтса.

 

2. В регрессионном анализе x j рассматриваются как:

а) неслучайные величины;

б) случайные величины;

в) любые величины.

 

3. Коэффициент регрессии изменяется в пределах:

a) от –1 до 1,

б) от 0 до 1,

в) принимает любое значение.

 

4. Квадратичная форма

соответствует

a) методу максимального правдоподобия,

б) методу наименьших квадратов,

в) методу средней связи,

г) двухшаговому методу наименьших квадратов.

 

5. Коэффициент детерминации изменяется в пределах:

a) от 0 до 1,

б) от –1 до 0,

в) от –1 до 1,

г) от 0 до 10.

 

6. В адекватной модели остатки:

a) Должны иметь нормальный закон распределения с равным нулю математическим ожиданием и неизменной дисперсией,

б) не должны коррелировать друг с другом,

в) должны иметь экспоненциальный закон распределения,

г) хаотично разбросаны,

д) могут иметь любую форму и вид распределения.

 

7. Ошибочный выбор вида функции или объясняющих переменных называется

a) ошибками спецификации,

б) ошибками прогноза,

в) гетероскедастичностью.

 

8. Коэффициент детерминации это

a) квадрат парного коэффициента корреляции,

б) квадрат множественного коэффициента корреляции,

в) квадрат частного коэффициента корреляции.

 

9. Величина какого коэффициента в квадрате указывает на долю дисперсии одной переменной, обусловленную вариацией другой:

a) коэффициент детерминации,

б) парный коэффициент корреляции,

в) множественный коэффициент корреляции,

г) частный коэффициент корреляции.

 

10. Величина, рассчитанная по формуле

является оценкой

a) коэффициента детерминации,

б) парного коэффициента корреляции,

в) частного коэффициента корреляции,

г) множественного коэффициента корреляции.

 

11.По абсолютной величине выборочный коэффициент корреляции r

a) не превосходит единицы,

б) не превосходит нуля,

в) принимает любые значения.

 

12. Отметьте основные виды ошибок спецификации

a) отбрасывание значимой переменной,

б) добавление незначимой переменной,

в) низкое значение коэффициента детерминации,

г) выбор неправильной формы модели.

 

13. Компоненты вектора

a) независимы между собой,

б) зависимы между собой,

в) имеют нормальный закон распределения с равным нулю математическим ожиданием ( ) и неизвестной дисперсией .

 

14. На практике при построении регрессионных моделей рекомендуется, чтобы n превышало т не менее, чем

a) в два раза,

б) в три раза,

в) не имеет значения.

 

2.7. Самостоятельная работа студентов

Литература для самостоятельной работы

1. Эконометрика: учебник / К. В. Балдин, В. Н. Башлыков, Н. А. Брызгалов и др.; под ред. В. Б. Уткина. –М.: Дашков и К, 2008. –304 с.

2. Новиков, А. И. Эконометрика: учеб. пособие: Дашков и К, 2013, -224 с.

3. Кремер, Н. Ш. Эконометрика: Учеб. для вузов / Н. Ш. Кремер, Б. А. Путко.-М.: ЮНИТИ, 2012. -310с.

4. Бывшев, В. А. Эконометрика: учеб. пособие / В. А. Бывшев. -М.: Финансы и статистика, 2009. -477с.

Интернет-ресурсы:

1.http: //www.kgtu.runnet.ru/WD/TUTOR/textbook/modules/stmulreg.html

2. http: //www.shpargalka.ru/statis.ru/doc/shpr_e31.htm

3.http: //dsmu.donetsk.ua/~statbook/modules/stmulreg.html#cunique

4. http: //www3.unicor.ac.ru/d024/p011993.htm

5. http: //www.gauss.ru/educat/systemat/butenkov/.asp

6.http: //crow.academy.ru/econometrics/seminars_/sem_08_/sem_08.htm

7.http: //crow.academy.ru/econometrics/lectures_/lect_03_/index.htm

8. http: //u-pereslavl.botik.ru/UP/ECON/econometrics/


Поделиться:



Популярное:

  1. I.3. Формирование сербского этноса на территории Османской и Габсбургской империй.
  2. I.3. Формирование сербского этноса на территории Османской империи и Австро-Венгерской(Габсбургской) империи.
  3. III. Решение логических задач с помощью рассуждений
  4. XII. Формирование и обнародование списка абитуриентов, рекомендованных к зачислению
  5. Анализ влияния ошибочных действий на формирование самоконтроля над двигательными действиями
  6. Анализ моделей реального уровня
  7. Анализ мотивационных моделей, применяемых в турфирме «Жар-птица».
  8. Анализируя опыт мирового развития, можно выделить пять наиболее типичных моделей капиталистической экономики, базирующейся на многообразии форм собственности.
  9. Ведение групповых мероприятий с помощью интеллект-карт
  10. Ведомость разложения составов поездов, прибывающих в расформирование
  11. Взятие крови из вены на биохимическое исследование с помощью шприца
  12. Взятие крови из вены с помощью вакуумной системы (вакутайнером)


Последнее изменение этой страницы: 2016-05-30; Просмотров: 2397; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.072 с.)
Главная | Случайная страница | Обратная связь