Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


В результате изучения темы специалист должен



Математическая статистика

Методические указания для самостоятельного изучения

темы «Математическая статистика»

для студентов всех направлений и всех форм обучения

Мариуполь


 

УДК 519.2 (075.8)

 

Методические указания для самостоятельного изучения темы «Математическая статистика» для студентов всех направлений и всех форм обучения / составители В.П. Сударев, А.М. Холькин.- Мариуполь: ПГТУ, 2015.- 59 с.

 

В методических указаниях рассмотрено применение основных методов математической статистики к обработке результатов наблюдений. Методические указания содержат темы лекций, контрольные вопросы к изучению курса, методические указания к выполнению индивидуальных заданий, варианты заданий, список основной и дополнительной литературы.

 

 

Составители: В.П. Сударев, доктор экономических наук, професор

А.М. Холькин, доктор физико-математических наук, профессор

 


 

СОДЕРЖАНИЕ

ВВЕДЕНИЕ…………………………………………………………

1.ОБЩИЕ МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО САМОСТОЯТЕЛЬНОМУ ИЗУЧЕНИЮ ТЕМЫ………………………………………………………………………..

2.МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО ИЗУЧЕНИЮ ТЕОРЕТИЧЕСКОГО МАТЕРИАЛА………………………………………………………………………………

3.МЕТОДИЧЕСКИЕ УКАЗАНИЯ К ВЫПОЛНЕНИЮ ИНДИВИДУАЛЬНОГО ЗАДАНИЯ

§ 1. Выборочный метод

1.1. Статистическое распределение выборки

1.2. Эмпирическая функция распределения

1.3. Полигон и гистограмма

§ 2. Статистические оценки параметров распределения

2.1. Точечные оценки

2.2. Интервальные оценки

§ 3. Методы расчета сводных характеристик выборки

3.1. Метод произведений вычисления выборочной средней и дисперсии

3.2. Асимметрия и эксцесс эмпирического распределения

§ 4. Проверки гипотез о законе распределения

4.1. Применение критерия Пирсона к проверке гипотезы о нормальном распределении генеральной совокупности

4.2. Применение критерия Колмогорова к проверке гипотезы о нормальном распределении генеральной совокупности

4.3. Критерий В.И. Романовского

4.4. Критерий Б.С. Ястремского

§ 5. Регрессионный анализ

5.1. Линейная корреляция

5.2. Проверка гипотезы о значимости выборочного коэффициента корреляции

§ 6. Криволинейная корреляция

§ 7. Индивидуальные задания

7.1. Содержание заданий

7.2. Варианты заданий

7.3.

4.ВОПРОСЫ ДЛЯ ПОДГОТОВКИ К ЭКЗАМЕНУ……………………….

5. СПИСОК РЕКОМЕНДОВАННЫХ ИСТОЧНИКОВ…… ………………………


ВВЕДЕНИЕ

Неотъемлемым условием успешного управления производством и экономикой является овладение экономико-математическими методами на строго научной основе. Выполнение заданий по математической обработке результатов наблюдения методами математической статистики является важным этапом процесса подготовки специалиста. После окончания университета в процессе работы студентам неоднократно придется столкнуться с обработкой статистических данных.

Цель преподавания дисциплины: формирование системы теоретических знаний и практических навыков по основам математического аппарата, основных методов количественного измерения случайности действия факторов, которые влияют на любые процессы, основ математической статистики, которая используется во время планирования, организации и управления производством, оценивания качества продукции, системного анализа экономических структур и технологических процессов. Цель выполнения этого задания – приобретение студентами умений и навыков по математической обработке и статистическому анализу результатов наблюдений. В частности, рассмотрены вопросы определения эмпирической функции распределения, точечных и интервальных оценок параметров распределения, проверки статистических гипотез, линейной и нелинейной корреляции.

Цель преподавания дисциплины заключается в изучении основных принципов и инструментария математического аппарата, который используется для решения инженерных и экономических задач, математических методов систематизации, обработки и применения статистических данных для научных и практических выводов.

Задача преподавания дисциплины заключается в том, что в результате изучения дисциплины студенты должны научиться приемам исследования и решения математически формализованных заданий, научиться анализировать полученные результаты, владеть методами систематизации, обработки и анализа массовых статистических данных, приобрести навыки самостоятельной работы с литературой по математике и ее применением.

Методические указания предназначены для студентов дневных и заочных факультетов и будут использованы ими в самостоятельной внеаудиторной работе при выполнению индивидуального задания по математической статистике, состоящего из шести частей.

Настоящие методические указания составлены с использованием методического пособия В.П. Сударева [18].

Основное содержание темы изложено в учебниках авторов: Гмурман В.Е. [1], Вентцель Е.С. [3], Румшинский Л.З. [9], Феллер В. [10], [11] (см. список основной и вспомогательной литературы).

 


 

ОБЩИЕ МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО САМОСТОЯТЕЛЬНОМУ ИЗУЧЕНИЮ ТЕМЫ

 

Над изучением темы следует работать систематически, переходя к следующему вопросу после закрепления знаний предыдущего. Рекомендуется составление сжатого конспекта с выписыванием возникающих вопросов для консультаций с преподавателем кафедры.

МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО ИЗУЧЕНИЮ ТЕОРЕТИЧЕСКОГО МАТЕРИАЛА

Содержательный модуль 1. Случайные процессы

Тема 1. Элементы теории случайных процессов и теории массового обслуживания

Простейший поток событий. Марковские процессы. Составление системы уравнений Колмогорова. Нахождение предельных вероятностей. [1, с. 380-385].

Контрольные вопросы для самопроверки:

1. Что такое поток событий?

2. В чем заключается свойство отсутствия последействия потока событий?

3. В чем заключается свойство ординарности потока событий?

4. Что такое простейший (пуассоновский) поток событий?

5. Как определяется интенсивность потока?

6. Сформулируйте определение цепи Маркова.

7. Что такое матрица перехода системы?

8. Запишите равенство Маркова.

 

Содержательный модуль 2. Элементы математической статистики

Тема 2. Первичная обработка статистических данных

Задачи математической статистики. Способы отбора и группировки статистических данных. Генеральная и выборочная совокупности. Статистическое распределение выборки. Эмпирическая функция распределения и ее свойства. Гистограмма и полигон статистических распределений. Выборочная средняя. Дисперсия выборки. Среднеквадратическое отклонение. [1, с. 187-196, с. 197-207]

Контрольные вопросы для самопроверки:

1. Сформулируйте задачи математической статистики.

2. Что такое объем совокупности?

3. Сформулируйте определение повторной и бесповторной выборок.

4. Какие вы знаете способы отбора?

5. Что такое эмпирическая функция распределения?

6. Сформулируйте свойства эмпирической функции распределения.

7. Что такое полигон частот и полигон относительных частот?

8. Что такое гистограмма частот и гистограмма относительных частот?

9. Сформулируйте определение несмещенной, эффективной и состоятельной оценок.

10. Запишите формулу для вычисления выборочной средней.

11. Запишите формулы для вычисления выборочной дисперсии и среднеквадратического отклонения.

 

Содержательный модуль 3. Статистическая проверка статистических гипотез

Содержательный модуль 3. Элементы теории корреляции

Тема 5. Элементы теории регрессии

Условные средние. Выборочное уравнение регрессии. Отыскивание параметров выборочного уравнения регрессии. [1, с. 253-255].

Контрольные вопросы для самопроверки:

1. Что такое функциональная, статистическаяи корреляционная зависимости двух случайных величин?

2. Что такое условная средняя?

3. Сформулируйте определение выборочного уравнения регрессии.

4. Как находятся параметры выборочного уравнения регрессии?

 

МЕТОДИЧЕСКИЕ УКАЗАНИЯ К ВЫПОЛНЕНИЮ ИНДИВИДУАЛЬНОГО ЗАДАНИЯ

Выборочный метод

Полигон и гистограмма

1.3.1. Дискретное распределение признака

Полигоном частот называют ломаную, отрезки которой соединяют точки ( ), ( ), …, ( ), где - варианты выборки, а - соответствующие им частоты.

Полигоном относительных частот называют ломаную, отрезки которой соединяют точки ( ), ( ), …, ( ), где - варианты выборки, а - соответствующие им относительные частоты.

1.3.2. Непрерывное распределение признака

При непрерывном распределении признака интервал, в котором заключены все наблюденные значения признака, разбивают на ряд частичных интервалом длины и находят - сумму частот вариант, попавших в интервал. Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины , а высоты равны отношению (плотность частоты). Площадь частичного прямоугольника равна - сумме частот вариант, попавших в интервал. Площадь гистограммы частот равна сумме частот, всех частот, т.е. объему выборки .

Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины , а высоты равны отношению (плотность относительной частоты). Площадь частичного прямоугольника равна - относительной частоте вариант, попавших в интервал. Площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице.

Пример 1.3. Построить полигон частот по данному распределению выборки:

Решение. Отложим на оси абсцисс варианты , а на оси ординат соответствующие им частоты . Соединив точки ( ) отрезками прямых, получим искомый полигон частот ( см. рисунок).

Рис. 1.2. Полигон частот.

Пример 1.4. Построить гистограмму частот по данному распределению выборки объема :

Номер интервала Частичный интервал Сумма частот вариант интервала Плотность частоты
1-5 5-9 9-13 13-17 17-21 2, 5 12, 5

Решение. Построим на оси абсцисс заданные интервалы длины . Проведем над этими интервалами отрезки, параллельные оси абсцисс, и находящиеся от нее на расстояниях, равных соответствующим плотностям частоты . Например, над интервалом (1, 5) построим отрезок, параллельный оси абсцисс, на расстоянии ; аналогично строят остальные отрезки.

Искомая гистограмма частот изображена на рисунке.

Рис 1.3. Гистограмма частот.

 

Точечные оценки

Точечной называют статистическую оценку, которая определяется одним числом.

Несмещенной называют точечную оценку, математическое ожидание которой равно оцениваемому параметру при любом объеме выборки.

Смещенной называют точечную оценку, математическое ожидание которой не равно оцениваемому параметру.

Несмещенной оценкой генеральной средней (математического ожидания) служит выборочная средняя

где - варианта выборки, - частота варианты , - объем выборки.

Замечание 2.1. Если первоначальные варианты - большие числа, то для упрощения расчета целесообразно вычесть из каждой варианты одно и то же число , т.е. перейти к условным вариантам (в качестве С выгодно принять число, близкое к выборочной средней; поскольку выборочная средняя неизвестна, число С выбирают «на глаз»). Тогда

Смещенной оценкой генеральной дисперсии служит выборочная дисперсия

.

Эта оценка является смещенной, так как

Более удобна формула

Замечание 2.2. Если первоначальные варианты - большие числа, то целесообразно вычесть из всех вариант одно и то же число , равное выборочной средней или близкое к ней, т.е. перейти к условным вариантам (дисперсия при этом не изменится). Тогда

Замечание 2.3. Если первоначальные варианты являются десятичными дробями с десятичными знаками после запятой, то чтобы избежать действий с дробями, умножают первоначальные варианты на постоянное число , т.е. переходят к условным вариантам . При этом дисперсия увеличится в раз. Поэтому, найдя дисперсию в условных вариантах, надо разделить ее на :

.

Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия

Более удобна формула

В условных вариантах она имеет вид

причем, если то если то

Замечание 2.4. При большом числе данных используют метод произведений или метод сумм.

Пример 2.1. В итоге пяти измерений длины одним прибором (без систематических ошибок) получены следующие результаты (в мм ): 92; 94; 103; 105; 106. Найти: а) выборочную среднюю длину стержня; б) выборочную и исправленную дисперсии ошибок прибора.

Решение. а) Найдем выборочную среднюю:

б) Найдем выборочную дисперсию:

Найдем исправленную дисперсию:

 

2.2. Интервальные оценки

Интервальной называют оценку, которая определяется двумя числами – концами интервала, покрывающего оцениваемый параметр.

Доверительным называют интервал, который с заданной надежностью γ покрывает оцениваемый параметр.

Для нормально распределенного количественного признака при известном среднем математическом отклонении оценка математического ожидания генеральной совокупности по выборочной средней осуществляется с использованием доверительного интервала

где - точность оценки; - объем выборки; есть такое значение аргумента функции Лапласа, что .

При неизвестном (и объеме выборки )

где - исправленное среднее квадратическое отклонение, - находят по таблице «Таблица значений » по заданным и γ.

Для оценки среднего квадратического отклонения нормально распределенного количественного признака с надежностью γ по исправленному выборочному среднему квадратическому отклонению служат доверительные интервалы

где находят по таблице «Таблица значений » по заданным и .

Пример 2.2. Найти доверительный интервал для оценки с надежностью 0, 95 неизвестного математического ожидания нормально распределенного признака генеральной совокупности, если даны генеральное среднее квадратическое отклонение выборочная средняя и объем выборки

Решение. Требуется найти доверительный интервал

(2.1)

Здесь все величины, кроме , известны. Найдем . Из соотношения получим . По таблице «Таблица значений функции » находим . Подставим , в формулу (2.1), окончательно получим искомый доверительный интервал

.

Пример 2.3. Произведено 12 измерений одним прибором (без систематической ошибки) некоторой физической величины, причем исправленное среднее квадратическое отклонение случайных ошибок измерений оказалось равным 0, 6. Найти точность прибора с надежностью 0, 99.

Решение. Точность прибора характеризуется средним квадратическим отклонением случайных ошибок измерений. Поэтому задача сводится к отысканию доверительного интервала для среднего квадратического отклонения, покрывающего оцениваемый параметр с заданной надежностью :

(2.2)

По данным и по таблице «Таблица значений » найдем Подставив в неравенство (2.2), окончательно получим

 

Таблица 3.1

-2 -10
-1 -15 -
-25 -
         
   

3.1.2. Неравноотстоящие варианты

Если первоначальные варранты не являются равноотстоящими, то интервал, в котором заключены все варианты выборки, делят на несколько равных, длины , частичных интервалов (каждый частичный интервал должен содержать не менее 8-10 вариант). Затем находят середины частичных интервалов, которые образуют последовательность равноотстоящих вариант. В качестве частоты каждой середины интервала принимают сумму частот вариант, которые попали в соответствующий частичный интервал.

При вычислении выборочной дисперсии для уменьшения ошибки, вызванной группировкой (особенно при малом числе интервалов), делают поправку Шепарда, а именно вычитают из вычисленной дисперсии одну двенадцатую квадрата длины частичного интервала. Таким образом, с учетом поправки Шепарда дисперсия вычисляется по формуле

Таблица 3.2

-2 -10 -40
-1 -15 -15 -
-25 - -55 -
           
   

 

Контроль:

,

Совпадение контрольных сумм свидетельствует о правильности вычислений.

Найдем условные моменты третьего и четвертого порядков (условные моменты первого и второго порядков вычислены в примере 3.1: ):

Найдем центральные эмпирические моменты третьего и четвертого порядков:

Подставляя , получим

Найдем искомые асимметрию и эксцесс, учитывая, что (см. пример 3.1):

 

Таблица 4.3.

0, 30 0, 35 0, 40 0, 45 0, 50 0, 55 0, 60 0, 65 0, 70 1, 000 0, 9997 0, 0972 0, 9874 0, 9689 0, 9228 0, 8643 0, 7920 0, 7112 0, 75 0, 80 0, 85 0, 90 0, 95 1, 00 1, 10 1, 20 1, 30 0, 6272 0, 5441 0, 4653 0, 8927 0, 3275 0, 2700 0, 1777 0, 1122 0, 0681 1, 40 1, 50 1, 60 1, 70 1, 80 1, 90 2, 00 2, 10 2, 20 0, 0897 0, 0222 0, 0120 0, 0062 0, 0082 0, 0015 0, 0007 0, 0003 0, 0001

 

Если найденному значению соответствует очень малая вероятность , то расхождение между эмпирическим и теоретическим распределениями нельзя считать случайным. Если же величина значительна, то расхождение между частотами случайно, и эмпирическое распределение хорошо согласуется с теоретическим.

По данным таблицы 4.1 (см. столбцы 8, 9 и 10) имеем

(4.10)

По таблице вероятностей находим , следовательно, распределение данных о продолжительности периода полировки весьма близко к нормальному распределению.

Критерий В.И. Романовского

Видный советский математик В.И. Романовский предложил более удобную форму использования критерия , введя в рассмотрение величину где - число степеней свободы. Он доказал, что там, где эта величина меньше 3, расхождение между эмпирическим и теоретическим распределениями несущественно. Если же отношение Романовского больше 3, то расхождение между эмпирическим и теоретическим распределениями является неслучайным и теоретическое распределение не может служить моделью взятых эмпирических данных.

По найденным значениям и определим величину

(4.11)

Так как , то расхождение между эмпирическим и теоретическим распределениями данных о продолжительности периода полировки является несущественным.

 

4.4. Критерий Б.С. Ястремского

Критерий крупнейшего советского статистика Б.С. Ястремского выражается отношением

(4.12)

где - число групп, - параметр, зависящий от числа групп.

При величина =0, 6 и поэтому в этом случае отношение Ястремского имеет вид:

(4.13)

Критерий Ястремского имеет тот же смысл, что и критерий Романовского. По данному определим значение отношения (4.12):

(4.14

)

Так как , то гипотеза о нормальном распределении данных о продолжительности периода полировке противоречит результатам наблюдения.

Регрессионный анализ

Линейная корреляция

Если обе линии регрессии на и на - прямые, то корреляцию называют линейной.

Выборочное уравнение прямой линии регрессии на Х имеет вид

(5.1)

где - условная средняя; - выборочные средние признаков и ; - выборочные средние квадратические отклонения; - выборочный коэффициент корреляции, причем

Выборочное уравнение прямой регрессии Х на Y имеет вид

(5.2)

Если данные наблюдений над признаками и заданы в виде корреляционной таблицы с равноотстоящими вариантами, то целесообразно перейти к условным вариантам.

где - «ложный ноль» варианты (новое начало отсчета); в качестве ложного нуля выгодно принять варианту, которая расположена примерно в середине вариационного ряда (условимся принимать в качестве ложного ноля варианту, имеющую наибольшую частоту); - шаг, т.е. разность между двумя соседними вариантами ; - ложный нуль варианты Y; - шаг варианты .

В этом случае выборочный коэффициент корреляции

прилагаем слагаемое удобно вычислять, используя расчетную таблицу 5.3.

Величины могут быть найдены либо методом произведений (при большом числе данных), либо непосредственно по формулам

Зная эти величины, можно определить входящие в уравнения регрессии (5.1) и (5.2) величины по формулам:

Для оценки линейной корреляционной связи служит выборочный коэффициент корреляции ; чем ближе к единице, тем связь сильнее; чем ближе к нулю, тем связь слабее.

Пример 5.1. Найти выборочное уравнение прямой линии регрессии на по данным, приведенным в корреляционной таблице 5.1.

Таблица 5.1

Х   Y
- - -
- - -
- -
- -
- - -

Решение. Составим корреляционную таблицу 5.2 в условных вариантах, выбрав в качестве ложных нулей (каждая из этих вариант расположена в середине соответствующего вариационного ряда).

Найдем и :

Найдем вспомогательные величины :

Найдем

Таблица 5.2

  -2 -1
-2 - - -
-1 - - -
- -
- -
- - -

 

Найдем , для чего составим расчетную таблицу 5.3.

Суммируя числа последнего столбца таблицы 5.3, находим

Для контроля вычислений находим сумму чисел последней строки:

Таблица 5.3


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-06-04; Просмотров: 796; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.113 с.)
Главная | Случайная страница | Обратная связь