Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Лабораторная работа 1 Репрезентативность информации,Стр 1 из 10Следующая ⇒
Васильев В.П.
ЭКОНОМЕТРИЯ и Статистический анализ с применением Excel
Для всех экономических специальностей. .
Минск 2017
Лабораторная работа 1 Репрезентативность информации, 3 Лабораторная работа 2 Оценка степени соответствия эмпирического распределения нормальному с использованием значений асимметрии и эксцесса. 4 Лабораторная работа 3. Исследование распределений случайных величин методами описательной статистики. 8 Лабораторная работа 4. Корреляционный анализ двухфакторных выборок. 13 Лабораторная работа 5. Регрессионно-корреляционный анализ двухфакторных выборок. 20 Лабораторная работа 6. Корреляционный анализ многофакторных выборок. 25 Лабораторная работа 7. Регрессионно-корреляционный анализ многофакторных выборок. 29 Лабораторная работа 8.Нелинейная регрессия. 32 Лабораторная работа 9.Статистический анализ выборок с категорийными переменными. 37 Лабораторная работа 10. Построение модели регрессии при наличии гетероскедастичности и автокорреляции. 42 Лабораторная работа11. Системы эконометрических уравнений. 48 Лабораторная работа 12 Расчет и оценка параметров динамической эконометрической модели. 51 Приложение 1. 55 Приложение 2. 56 Лабораторная работа 1 Репрезентативность информации, Назначение. Для упрощения сбора информации и проведения расчетов экономическое исследование может проводиться не по всей совокупности единиц, подлежащих обследованию, а по её части, которая репрезентирует (представляет) данную совокупность. Подлежащая изучению совокупность, из которой производят отбор, называется генеральной совокупностью, а часть её, подлежащая обследованию, — выборочной совокупностью или выборкой. Результаты изучения выборки дают возможность судить о всей совокупности. Пример. Рассчитайте численность выборки, характеризующей цену реализации некоторого товара, если известно, что на рынке присутствует 200 фирм, занимающихся его реализацией, а ошибка полученных результатов не должна превышать 1 ден. ед. с вероятностью 90%. Дисперсия цены реализации равна 15, 7. Методика выполнения. Поскольку обследованию подвергаются не все объекты, а только часть из них, невозможно избежать ошибок в полученных результатах. Поэтому численность выборки должна быть достаточной для обеспечения заданной точности, которая характеризуется предельной ошибкой (e) и вероятностью (р) того, что полученное значение не выйдет за границы предельной ошибки. Для расчета численности выборки используется не само значение вероятности, а коэффициент t, непосредственно от неё зависящий. Некоторые значения t для часто встречающихся в расчетах вероятностей следующие:
Численность выборки для бесповторного отбора определяется по формуле ,
где N – численность генеральной совокупности; s – стандартное (среднее квадратическое) отклонение признака в генеральной совокупности. Значение дисперсии может быть заимствовано из проводимых ранее обследований данной или аналогичной совокупности, а если таковых нет, проводится специальное выборочное обследование небольшого объема. В рассматриваемом случае численность выборки должна быть равна
т. е. для обеспечения заданной точности необходимо иметь 35 наблюдений.
Задания
Задание 1. Какой должна быть численность выборки для нахождения средней себестоимости 1 т прироста крупного рогатого скота по 350 сельскохозяйственным организациям региона, ошибка которой не должна превышать 0, 3 млн. рублей с вероятностью 75%. Стандартное отклонение признака – 2, 1 млн. рублей. Задание 2. Определите численность выборки для расчета удоя на среднегодовую корову в 200 сельскохозяйственных организациям региона, если необходимо, чтобы ошибка не превышала 100 кг с вероятностью 90%. Стандартное отклонение признака – 653 кг. Задание 3. Сколько сельскохозяйственных организаций из 350 необходимо обследовать, чтобы определить среднюю себестоимость производства 1 т зерна, ошибка которой не будет превышать 15 тыс. рублей с вероятностью 75%. Стандартное отклонение признака – 76, 5 тыс. рублей. Задание 4. Определите численность выборки для нахождения среднего значения среднесуточного прироста свиней по 190 сельскохозяйственным организациям региона, ошибка которого не будет превышать 20 г с вероятностью 75%. Стандартное отклонение признака – 116 г. Лабораторная работа 3. Исследование распределений случайных величин методами описательной статистики.
Цель работы: научиться обрабатывать выборки из генеральных совокупностей средствами компьютерной графики и с использованием инструментов MS EXCEL Задачи: -изучить средства для генерации наборов случайных чисел; -уметь производить выборку из множества случайных чисел; -проводить ранжирование выборок и генеральных совокупностей; -вычислять моменты распределения случайных величин; -строить диаграммы распределения выборок. Инструментарий: приложение «Анализ данных».-вкладка Данные Если отсутствует приложение, то необходимо загрузить команду Настройки, установив опцию Пакет анализа.В случае если в настройках отсутствует данное приложение, то необходимо войти в библиотеку системы и инсталлировать приложение(делать это лучше под руководством системного программиста). Теоретические сведения 1.Для выполнения этой работы необходимо знать элементы теории вероятности и математической статистики, в частности иметь понятия о моментах случайной величины, распределениях, способах представления распределений. 2.Сведения о возможностях приложения « Анализ данных» 2.1.Генерация случайных чисел используется для моделирования явлений, имеющих случайную природу, по известному закону распределения.В составе приложения Анализ данных имеются несколько популярных распределений: Нормальное, дискретное, модельное, Пуассона, биномиальное и др. Параметрами окна генерации случайных чисел являются: -число переменных- целое; -число случайных чисел- целое число, характеризует количество чисел по каждой переменной; -тип распределения (равномерное, Бернулли, Пуассона, нормальное и т.д.); -параметры распределения табл.1; -выходной интервал (на том же листе, на новом листе, в новой книге) и место куда поместить сгенерированные последовательности. 2.2.Инструмент выборка, производит выборку подмножества мощности n< m из заданного множества, либо случайным, либо периодическим образом. 2.3.Инструмент Гистограмма -позволяет построить интервальную гистограмму распределения случайной величины (С.В.). Входные данные –диапазон изменения СВ(блок данных на рабочем листе) и интервал карманов(блок данных сформированный заранее, верхних границ интервалов покрывающих область изменения СВ. 2.4.Инструмент «Описательная статистика» - позволяет вычислять все числовые моменты распределения случайной величины. Входные данные: -диапазоны данных, как минимум два, задаются ссылками; -группирование (строки, столбцы); -выходной интервал (ссылка); -статистики (флажки). 3.Уметь работать с объектами MS- Excel различными статистическими функциями(среднее, дисперсия, эксцесс, минимум, максимум и др.) и диаграммами (гистограммы, графики, точечные) Табл.1.Некоторые законы распределения
Ранжирование рядов данных. 1.Пусть задан набор данных. 2.Проведем сортировку по убыванию(или возрастанию). 3. Меньшему (большему) значению начисляется меньший ранг. Наименьшему значению начисляется ранг 1. 4. Наибольшему (меньшему) значению начисляется ранг, соответствующий количеству ранжируемых значений. Например, если n=7, то наибольшее значение получит ранг 7, за возможным исключением для тех случаев, которые предусмотрены правилом 2 В случае, если несколько значений равны, им начисляется ранг, представляющий собой среднее значение из тех рангов, которые они получили бы, если бы не были равны. Например, 3 наименьших значения равны 10 секундам. Если бы мы измеряли время более точно, то эти значения могли бы различаться и составили бы, скажем, 10.2 сек; 10.5 сек; 10.7 сек. В этом случае они получили бы ранги, соответственно, 1, 2 и 3. Но поскольку полученные нами значения равны, каждое из них получает средний ранг: Пример Задан ряд.
Выполним сортировку по возрастанию
5.Проведем ранжирование Элементу 7 присвоим 1, элементам 6 и 5 ранги 2 и 3, элементу 4 присвоим ранги (4+5+6)/3=5, элементу 3 ранг (7+8+9)/3=8 Проверка сумма рангов должна равняться S=(n+1)*n/2 В данном случае 45. Выполнение работ ы
2. Проведите ранжирование и рассчитайте Моду и Медиану ряда. 3. Определите и задайте интервал «Карманов», например интервал карманов 0 1 2 3 4
Для этого введите исходный диапазон, интервал карманов и место расположения. Получите частотную таблицу и график.
Самостоятельно. Выполните расчет статистических показателей и сравните с результатами инструмента «Описательная статистика», вычислите и оцените средние и дисперсии. Таблица – Посещаемость занятий студентами и их оценки на экзамене см лаб.раб.2
Контрольные вопросы 1. Что такое случайная величина и ее закон распределения. Приведите примеры распределений. 2. Что такое моменты случайной величины. Какие моменты Вы знаете. Охарактеризуйте их. 3.Что такое генеральная совокупность и выборка. 4.Способы представления выборок. 5.Какие инструменты для выполнения статистических расчетов существуют в MS EXCEL Выполнение работы. 1.Занесем данные в ячейки рабочего листа MS EXCEL 2. Заполним столбец Х*У, подсчитаем средние значения и стандартные отклонения используя функции среднее(), стандотглонГ()
. Подсчитаем ковариацию признаков, используя формулу
и корреляцию Результат Коэффициент корреляции равен -0, 945. Значение свидетельствует о сильной обратной связи переменных. 4.Проверим его значимость и вычислим доверительный интервал. Самостоятельно рассчитайте силу связи между факторами таблицы.
Сделайте вывод. Самостоятельно выполните исследование. На предприятии Х проводился социологический опрос удовлетворенности своей работой. Получены данные. Рассчитать коэффициенты ассоциации и контингенции. Примечание: при заполнении таблицы используйте функцию СчетЕсли() Ранговые коэффициенты связи. В анализе социально-экономических явлений часто приходится прибегать к различным условным оценкам с помощью рангов, а взаимосвязь между отдельными признаками измерять с помощью непараметрических коэффициентов связи. Ранжирование — это процедура упорядочивания объектов изучения, которая выполняется на основе предпочтения. Ранг — порядковый номер значений признака, расположенных в порядке возрастания или убывания величин. Если значения признака имеют одинаковую количественную оценку, то ранг всех значений принимается равным средней арифметической из соответствующих номеров мест, которые они занимают. Данные ранги называются связными. Среди непараметрических методов оценки тесноты связи наибольшее значение имеют ранговые коэффициенты Спирмена и Кендэла. Эти коэффициенты могут быть использованы для определения тесноты связи как между количественными, так и между качественными признаками. Коэффициент корреляции Спирмена di квадраты разности рангов, n число наблюдений. Если среди значений признаков х и у встречается несколько одинаковых, образуются связанные ранги, т. е. одинаковые средние номера; например, вместо одинаковых по порядку третьего и четвертого значений признака будут два ранга по 3, 5. В таком случае коэффициент Спирмена вычисляется как:
где
j - номера связок по порядку для признака х; Аj - число одинаковых рангов в j-й связке по х; k - номера связок по порядку для признака у; Вk - число одинаковых рангов в k-й связке по у. Для проверки значимости коэффициента корреляции Спирмена используют те же методы, что и для коэффициента корреляции количественной шкалы. Выполнение работы Рассмотрим данные таблицы 1 Посещаемость занятий студентами и их оценки на экзамене (лабораторной работы 2), фрагмент исходной Excel таблицы.
Выполним ранжирование рядов данных.(фрагмент таблицы ранжирование рядов), используя функцию
Обратите внимание, что вторым аргументом функции является массив, имеющих абсолютные адреса ячеек
Вычислим разности рангов и квадраты разностей
Подсчитаем сумму квадратов рангов S=4548 Так как среди данных встречаются повторения, то для расчета коэффициента корреляции Спирмена, используем формулу
, где, j - номера связок по порядку для признака х; Аj - число одинаковых рангов в j-й связке по х; k - номера связок по порядку для признака у; Вk - число одинаковых рангов в k-й связке по у. Для подсчета одинаковых рангов по связкам, целесообразно скопировать в отдельную часть листа столбцы рангов и выполнить сортировки.
Из отсортированных данных видно, что повторяются 6 наблюдений с рангами 3, 5; 6; 10; 15; 19,; 23, 5 аналогично по оценкам одинаковые ранги у 8 наблюдений-это ранги 1, 5; 3, 5; 5, 5; 9; 12, 5; 16, 19, 5 22 , таким образом Число рангов по связке Пропуск равно 6, число рангов по связке оценка 8 Тогда =17, 5 =42 Число наблюдений-25 Тогда коэффициент корреляции Спирмена равен -0, 767 Подсчитаем значимость Тнабл= =5, 73 Ткр=1, 73 Вывод коэффициент корреляции значим. Самостоятельно рассчитать доверительный интервал. Выполнение работы. 1.Занесем данные в ячейки рабочего листа MS EXCEL. 2. Построим график корреляционного поля, используя диаграмму Точечная, данные оси ОХ Объем производства. Из графика можно предположить о наличии линейной связи данных. 3. Определим количественные характеристики связи, используя настройку Анализ данных \корреляция.
Результат
Коэффициент корреляции равен -0, 87. Значение свидетельствует о сильной связи данных. 4.Проверим его значимость и вычислим доверительный интервал.
4.1. Проверка значимости Вычислим величину Тнабл= Т набл= -5, 015033743 Для вычисления критического значения Используя функцию СТЬЮДРАСПОБР, категория статистические, по заданному уровню значимости α =0, 05 и числу степеней свободы (n-2)=10 определяют критическую точку tα /2, n-2. Если модуль Т меньше tα /2, n-2
С вероятностью 5% и степенями свободы 10 критическое значение распределения Стьюдента равно Ткр = 2, 228139 |Т набл| > Ткр, что свидетельствует о его значимости коэффициента корреляции 4.2..Рассчитаем д доверительные интервалы коэффициента корреляции а)Выполним преобразование Фишера над коэффициентом корреляции, Фишер(ρ ) Ф(ρ )= - 1, 337 б) вычислим отклонение Δ Z = , где t1 значение функции Лапласа, встроенная функция НОРМСТОБР. Величина отклонения с вероятностью 95% Δ Z= 0, 548 в) Предельные значения интервала в пространстве Фишера А= -1, 337-0, 548=-1, 885 В=-1, 337+0, 548=-0, 789 г) Обратное преобразование Фишера даст значения границ доверительного интервала для ρ вероятностью 95% -0, 958 и -0, 658 .5. Построим уравнение регрессии используя Анализ данных \ Регрессия.
Протокол Регрессионного анализа.
6.Оценки значимости. 6.1 Модель работает на 87% Коэффициент детерминации Множественный R= 0.76 Уравнение регрессии У= 10, 82- 0, 9*Х 6.2. Оценки значимости коэффициентов а) По критерию Стьюдента, необходимо сравнить данные Т статистики с критическим значением Стьюдента, найденным в пункте 4.1. Для первого коэффициента 10, 3015 > 2, 228139 для второго 5, 6069> 2, 228139, что свидетельствует о их значимости б) оценка по Р значению. Если величина в столбце Р значение меньше 0, 05, то с вероятностью 0, 95 соответствующий коэффициент значим. в) доверительные интервалы для значимых коэффициентов регрессии 8.4886< 10.827< 13.17 -1.258< -0.9 < -0.542 7. График подбора регрессии
Изобразим на графике граничные линии регрессий доверительного интервала. Для этого используем формулы У=-0, 542 х+13, 69 У=-1, 258Х+8, 486
Подсчитаем среднюю себестоимость продукции, если объем производства составит 5т.у.е. У= -0, 9*5+10, 82=-4.5+10.82=6.32 Определим степень доверия У=-0, 542*5+13, 69=10, 98 У=-1, 258*5+8, 486=2, 196 С вероятностью 95% Себестоимость будет в пределах(2, 196; 10, 98) и в среднем 6, 32 Какой будет объем производства, если себестоимость равна 2, 5 Х=-(2, 5-10, 82) / 0, 9=9, 24 Самостоятельно провести анализ данных из таблиц и построить модель
Теоретические сведения Большинство экономических объектов и явлений описываются не одним, а целой системой показателей. С этой целью необходимо провести выборку банков и провести их оценку по ряду признаков. В качестве примеров можно назвать уставной фонд, привлекаемые средства, оборотные средства, вклады населения, невозвращенные кредиты и т.д. Обозначим символами Х, а соответствующие анализируемые признаки символами Хjполучим таблицу
Данные представленные в таблице можно интерпретировать матрицей А размерности (10*4) и представляют собой многомерную случайную величину (МСВ), строки которой элементы выборки, а столбцы случайные значения признаков. Данная матрица представляет собой СМВ. Строки и столбцы которой представляют случайные величины. Каждая случайная величина характеризуется системой моментов средними, отклонениями и др. сами же величины могут быть независимыми или связаны друг с другом. Связи между ними характеризуются не одним, а целой системой величин, которые образуют матрицы парных ковариаций и корреляций. Задачи, решаемые в данной работе, связаны с вычислением и исследованием свойств этих матриц. Выполнение работы 1.Центрирование МСВ 1.1.Вычислим средние и стандартные отклонения по значениям элементов каждого столбца Получим для средних и для стандартных отклонений строки
В свободном месте листа, например в ячейки Н6: К6 Введем формулу вида Не забудьте нажать Ctrl+Shift+Enter Получим
и скопируем ее на остальные ячейки
Получим матрицу В Подсчитаем среднее для преобразованной матрицы В. 1.2.Нормирование матрицы. В свободном месте листа, например в ячейки М6: Р6 Введем формулу вида и скопируем ее на остальные ячейки
Подсчитайте среднее и стандартное отклонение для столбцов матрицы. Самостоятельно Постройте матрицу парных корреляций для выборки и вычислите частные и множественные коэффициенты корреляции
Выполнение работы. 1.Занесем данные в ячейки рабочего листа MS EXCEL. 2. Определим количественные характеристики связи, используя настройку Анализ данных \корреляция.
3.Проверим значимость коэффициентов парных корреляций и вычислим их доверительные интервалы. 3.1. Проверка значимости Вычислим величину Тнабл=
Таблица Т расч, для каждого коэффициента корреляции
Т кр=2, 048 Отсюда можем сделать вывод о значимости только 4 коэффициентов Для вычисления интервальных оценок воспользуемся методикой предыдущей работы, раздел 4.2 Данные удобно представить таблицей.
После выполнения обратных преобразований Фишера получим.
4.Расчет частных коэффициентов корреляции. Частные коэффициенты корреляции характеризуют силу линейной связи двух факторов, без учета влияния остальных Р= , Р I, j алгебраическое дополнение соответствующего элемента матрицы парных корреляций. Для вычисления их используем прием. а) вычислим обратную матрицу матрицы парных корреляций б) вычислим ее определитель в) с помощью специальной вставки, выполним умножение элементов обратной матрицы на значение определителя. а)Обратная матрица.
Определитель 0, 2257 Матрица алгебраических дополнений
Теперь использованием формулы, для частных коэффициентов корреляции, вычислим их значение, но только для значимых коэффициентов.
Оценим их значимость по тем же критериям 5. Построение модели регрессии У-рентабельность Протокол регрессии
|
Последнее изменение этой страницы: 2019-05-17; Просмотров: 470; Нарушение авторского права страницы