Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Обобщающие показатели одномерного набора данных



  Статистический пакет Анализ данных включает в себя два инструмента для анализа одномерного набора данных: Описательная статистика и Ранг и персентиль. С помощью инструмента Описательная статистика рассчитываются показатели, характеризующие типические значения, изменчивость и ассиметрию данных. Инструмент Ранг и персентиль создает таблицу исходных данных, упорядоченных в соответствии с порядковыми числами (рангами) и персентилем.
Задать последовательность СВ  
Применить инструмент анализа Описательная статистика  
1.Откройте программу Excel. Щелкните на кнопке Сохранить на панели инструментов Стандартная. В появившемся диалоговом окне откройте папку Статистика и задайте имя файлу Описательная статистика.xls.
2. Задать метку 3. Ввести диапазон данных На Листе1 в ячейке A1 задайте метку Цена, а в диапазон A2: A16 введите данные из Таблицы 1.
4. Запустить инструмент Описательная статистика Сервис®Анализ данных®Описательная статистика®OK.
5. Задать входной интервал Навести курсор в окно Входные данные укажите Входной интервал:, выделяя диапазон данных А1: А16 вместе с меткой.
6. Задать группирование 7. Параметр Группирование: выберите по столбцам.
8. Задать метку 9. Установите флажок Метки в первой строке, т.к. выбранные ячейки включают в себя подписи.
10. Проверить заданные атрибуты
11. Задать положения места построения выходных данных Включите В области Параметры вывода параметр Выходной интервал:. щелкните в текстовом поле параметра Выходной интервал:, выделите ячейку С1, указывающую адрес левого верхнего угла области вывода данных.
12. Задать опцию выхода Установите следующие флажки: ü Итоговая статистика Данная опция управляет выводом выходных данных.
13. Задать уровень надежности ü Уровень надежности: Данная опция вычисляет половину длины доверительного интервала для среднего с заданной значимостью (в %). В нашем примере установите значимость равной 90%. Это означает, что вероятность того, что среднее генеральной совокупности данных находится в пределах доверительного интервала, равна 0, 9.
14. Задать критерий К наименьшее и наибольшие значения ü К-ый наименьший: Эта опция определяет k-ое наименьшее значение из входных данных. В нашем примере введите Kравным 4. ü К-ый наибольший: Эта опция определяет k-ое наибольшее значение из входных данных. В нашем примере введите K равным 4.
15. Запустить расчет Щелкните на кнопке OK. Excel вычислит обобщающие показатели и разместит их в виде таблицы в двух столбцах C и D.
16. Просмотреть результаты расчета  
Форматирование таблицы с выходными данными   1. Чтобы ширина столбцов была достаточной для отображения самой длинной ячейки, выделите столбцы C и D, а затем выберите команду: Формат®Столбец ®Автоподбор ширины. 2. Некоторые значения в таблице отображаются с девятью десятичными знаками после запятой. Для удобства чтения выделите одновременно ячейки D4, D7: D10, D18 и уменьшите разрядность значений до двух знаков после запятой, используя соответствующую копку на панели инструментов Форматирование. 3. Измените ширину столбца D, дважды щелкнув на правой границе заголовка этого столбца. Ниже показан полученный вид таблицы выходных данных.
Цена
Среднее 37, 92
Стандартная ошибка 1, 39
Медиана 38, 4
Мода #Н/Д
Стандартное отклонение 5, 38
Дисперсия выборки 28, 94
Эксцесс 0, 30
Асимметричность -0, 73
Интервал 19, 2
Минимум
Максимум 45, 2
Сумма 568, 8
Счет
Наибольший(4) 41, 8
Наименьший(4) 34, 8
Уровень надежности(90, 0%) 2, 45

 

Интерпретация результатов Проанализировать Среднее Медиану Моду 4. Выходные данные содержат три обобщающих показателя, которые называются типическими значениями. Среднее – это средняя цена объектов, равная $37, 92. Получается как результат деления суммы цен всех объектов (Сумма $568, 8) на количество объектов (Счет 15). Среднее можно интерпретировать как равномерное распределение суммы всех значений между элементарными единицами совокупности. Таким образом, если каждое значение из набора данных заменить средним, то общая сумма не изменится. Это свойство среднего полезно в тех ситуациях, когда необходимо планировать общую сумму для большой группы. В этом случае сначала вычисляют среднее для выборки данных из этой группы. Затем полученное среднее умножают на количество элементов в большой группе. В результате получают оценку или прогноз суммы для большей по размеру совокупности. Медиана – значение, расположенное посередине упорядоченного набора данных. В нашем примере значение медианы равно $38, 4. Мода – наиболее часто встречающееся значение. Если встречается несколько часто встречающихся значений, то Excel выводит первое из них. Если каждое значение встречается один раз, то Excel выводит запись #Н/Д. В таком случае надо получить таблицу распределения частот, в которой интервал с наибольшей частотой называется модальным интервалом. Для определения модального интервала рекомендуется использовать гистограммы. В таблице описательной статистики имеется несколько показателей, характеризующих изменчивость (разброс) данных. Ü Интервал – размах значений, равный ($19, 2). Определяется как разность между Максимумом ($45, 2) и Минимумом ($26). Ü Дисперсия выборки (28, 94). Вычисляется как результат деления суммы квадратов отклонений каждого значения от Среднего на n-1. Выражается в единицах в квадрате ($2). Ü Стандартное отклонение ($5, 38) – корень квадратный из Дисперсии выборки. Стандартное отклонение приближенно показывает, насколько отдельные значения выборки отличаются от их Среднего. Измеряется в тех же единицах, что и входные данные. Ü Стандартная ошибка ($1, 39) является характеристикой достоверности Среднего. Вычисляется как Стандартное отклонение, поделенное на . Данная характеристика показывает, насколько Среднее выборки отличается от среднего генеральной совокупности. Ü Нибольший(4) и Наименьший(4) являются соответственно четвертым наибольшим ($41, 8) и четвертым наименьшим ($34, 8) значениями входных данных. Ü Уровень надежности(90, 0%), равный $2, 45, определяет половину длины 90%-го доверительного интервала для Среднего. Следовательно, 90%-й доверительный интервал равен (37, 92-2, 45; 37, 92+2, 45), т.е. (35, 47; 40, 37). 5. Третья группа показателей характеризует степень симметричности данных. Ü Эксцесс (0, 3) является показателем островершинности симметричных распределений. Если распределение более плоское, чем нормальное (т.е. имеет более «тяжелые» хвосты), то Эксцесс будет положительным. Если же распределение имеет более выраженный пик, чем нормальное (т.е. имеет более «легкие» хвосты), то Эксцесс отрицательный. В нашем примере (см. гистограмму) распределение примерно симметричное с небольшим положительным Эксцессом. Ü Ассиметричность (К=–0, 73) определяет степень симметрии данных. Если большинство экстремальных значений расположено в положительном направлении от центра распределения (скошено вправо), то Ассиметричность положительна. В этом случае Среднее больше Медианы. Если же большинство экстремальных значений расположено в отрицательном направлении от центра распределения (скошено влево), то Ассиметричность отрицательна и Среднее меньше Медианы. Ниже приведена интерпретация показателя Ассиметричности (К) для Excel. K < –0, 5 скошено влево –1 £ K £ 1 приблизительно симметрично K > 1 скошено вправо В нашем примере (см. гистограмму) данные приблизительно симметричны с небольшим отрицательным отклонением (скос влево)

 


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-03-17; Просмотров: 1195; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.007 с.)
Главная | Случайная страница | Обратная связь