Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Упражнение 2. Инструмент анализа данных Описательная статистика



Чем больше характеристик распределения случайной величины нам известно, тем точнее мы можем судить об описываемых ею процессах. Инструмент Описательная статистика автоматически вычисляет наиболее широко используемые в практическом анализе характеристики распределений. При этом значения могут быть определены сразу для нескольких исследуемых переменных.

Чтобы определить параметры описательной статистики для переменных V, Q, P, NCF, NPV, необходимо выполнить следующие шаги.

1. Выберите в главном меню тему Сервис, пункт Анализ данных. Результатом выполнения этих действий будет появление диалогового окна Анализ данных, содержащего список инструментов анализа.

2. Выберите из списка Инструменты анализа пункт Описательная статистика и нажмите кнопку ОК. Результатом будет появление окна диалога инструмента Описательная статистика.

3. Заполните поля диалогового окна, как показано на рис. 4, и нажмите кнопку ОК.

Результатом выполнения указанных действий будет формирование отдельного листа, содержащего вычисленные характеристики описательной статистики для исследуемых переменных. Выполнив операции форматирования, можно привести полученную ЭТ к более наглядному виду (рис. 5).

Многие из приведенных в данной ЭТ характеристик вам хорошо знакомы, а их значения уже определены с помощью соответствующих функций на листе Результаты анализа. Поэтому рассмотрим лишь те из них, которые не упоминались ранее.

Рисунок 4. Заполнение полей диалогового окна "Описательная статистика"

 

Вторая строка ЭТ содержит значения стандартных ошибок e для средних величин распределений. Другими словами, среднее, или ожидаемое, значение случайной величины М(Е) определено с погрешностью ± e .

Медиана – это значение случайной величины, которое делит площадь, ограниченную кривой распределения, пополам (т.е. середина численного ряда или интервала). Как и математическое ожидание, медиана является одной из характеристик центра распределения случайной величины. В симметричных распределениях значение медианы должно быть равным или достаточно близким к математическому ожиданию.

Рисунок 5. Описательная статистика для исследуемых переменных

Вывод: Как следует из полученных результатов, данное условие соблюдается для исходных переменных V, Q, P (значения медиан лежат в диапазоне М(Е) ± e , т.е. практически совпадают со средними). Однако для результатных переменных NCF, NPV значения медиан лежат ниже средних, что наводит на мысль о правосторонней асимметричности их распределений.

Мода – наиболее вероятное значение случайной величины (наиболее часто встречающееся значение в интервале данных). Для симметричных распределений мода равна математическому ожиданию. Иногда мода может отсутствовать. В данном случае ППП EXCEL вернул сообщение об ошибке. Таким образом, вычисление моды не представляется возможным.

Эксцесс характеризует остроконечность (положительное значение) или пологость (отрицательное значение) распределения по сравнению с нормальной кривой. Теоретически эксцесс нормального распределения должен быть равен 0. Однако на практике для генеральных совокупностей больших объемов его малыми значениями можно пренебречь.

Вывод: В рассматриваемом примере примерно одинаковый положительный эксцесс наблюдается у распределений переменных Q, NCF, NPV. Таким образом, графики этих распределений будут чуть остроконечнее по сравнению с нормальной кривой. Соответственно, графики распределений для переменных V и Р будут чуть более пологими по отношению к нормальному.

Асимметричность (коэффициент асимметрии, или скоса, s) характеризует смещение распределения относительно математического ожидания. При положительном значении коэффициента распределение скошено вправо, т.е. его более длинная часть лежит правее центра (математического ожидания) и наоборот. Для нормального распределения коэффициент асимметрии равен 0. На практике его малыми значениями можно пренебречь.

Вывод: В частности, асимметрию распределений переменных V, Q, P в данном случае можно считать несущественной, чего нельзя, однако, сказать о распределении величины NPV.

Осуществим оценку значимости коэффициента асимметрии для распределения NPV. Наиболее простым способом получения такой оценки является определение стандартной (средней квадратической) ошибки асимметрии, рассчитываемой по формуле:

,                                                                                    (3)

где n – число значений случайной величины (в данном случае – 500).

Если отношение коэффициента асимметрии s к величине ошибки s as меньше трех (т.е.: s /s as < 3), то асимметрия считается несущественной, а ее наличие объясняется воздействием случайных факторов. В противном случае асимметрия статистически значима, и факт ее наличия требует дополнительной интерпретации. Осуществим оценку значимости коэффициента асимметрии для рассматриваемого примера.

Введите в любую ячейку ЭТ формулу:

= 0,763 / КОРЕНЬ(6*499 / 501*503) (Результат: 7,06)

Вывод: Поскольку отношение s /s as > 3, асимметрию следует считать существенной. Таким образом, наше первоначальное предположение о правосторонней скошенности распределения NPV подтвердилась.

Для рассматриваемого примера наличие правосторонней асимметрии может считаться положительным моментом, так как это означает, что большая часть распределения лежит выше математического ожидания, т.е. большие значения NPV являются более вероятными.

Аналогичным способом можно осуществить проверку значимости величины эксцесса е. Формула для расчета стандартной ошибки эксцесса имеет следующий вид:

                                                                                (4)

где n – число значений случайной величины.

Если отношение e /s ex < 3, эксцесс считается незначительным, и его величиной можно пренебречь.

Вы можете включить проверку значимости показателей асимметрии и эксцесса в разработанный шаблон, задав соответствующие формулы в листе Результаты анализа. Для удобства предварительно следует определить собственное имя для ячейки В10 листа Имитация, например: Кол_знач. Тогда формула проверки значимости коэффициента асимметрии для распределения NPV может быть задана следующим образом:

=СКОС(ЧСС)/КОРЕНЬ(6*(Кол_знач -1))/((Кол_знач+1)*(Кол_знач+ 3))

Для вычисления коэффициента асимметрии в этой формуле использована статистическая функция СКОС(). Формула для проверки значимости показателя эксцесса задается аналогичным образом. Числителем этой формулы будет функция ЭКСЦЕСС(), а знаменателем соотношение (4), реализованное средствами ППП EXCEL.

Оставшиеся показатели описательной статистики (рис. 5) представляют меньший интерес. Величина Интервал определяется как разность между максимальным и минимальным значением случайной величины (численного ряда). Параметры Счет и Сумма представляют собой число значений в заданном интервале и их сумму соответственно.

Последняя характеристика Уровень надежности показывает величину доверительного интервала для математического ожидания согласно заданному уровню надежности или доверия. По умолчанию, уровень надежности принят равным 95%.

Вывод: Для рассматриваемого примера это означает, что с вероятностью 0,95 (95%) величина математического ожидания NPV попадет в интервал 3412,14 ± 224,88.

Вы можете указать другой уровень надежности, например 98%, путем ввода соответствующего значения в поле Уровень надежности диалогового окна Описательная статистика. Следует отметить что, чем выше принятый уровень надежности, тем больше будет величина доверительного интервала для среднего.

Расчет доверительного интервала для среднего значения можно также осуществить с помощью специальной статистической функции ДОВЕРИТ().

 

Содержание отчета и его форма

Отчет к лабораторной работе оформляется в виде текстового документа по форме простого реферата и должен включать:

1. Название лабораторной работы.

2. Цель и содержание лабораторной работы.

3. Краткие выводы по результатам выполнения заданий к лабораторной работе.

4. Формулировку задания для самостоятельной работы и результат его выполнения.

Задания для самостоятельной работы

Базовый уровень

1. Показатели статистического анализа результатов.

2. Технология проведения статистического анализа средствами MS Excel.

Повышенный уровень

3. Согласно варианту из лабораторной работы 1-2 рассчитать показатели статистического анализа.

Лабораторная работа 6-7


Поделиться:



Последнее изменение этой страницы: 2019-04-11; Просмотров: 283; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.015 с.)
Главная | Случайная страница | Обратная связь