Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Показатели вариации. Моменты. Показатели формы распределения.
Показатели вариации. Вариация — это различия индивидуальных значений признака у единиц изучаемой совокупности. Абсолютные показатели вариации включают: § размах вариации § среднее линейное отклонение § дисперсию § среднее квадратическое отклонение Размах вариации — это разность между максимальным и минимальным значениями признака Он показывает пределы, в которых изменяется величина признака в изучаемой совокупности. Среднее линейное отклонение — это средняя арифметическая из абсолютных отклонений отдельных значений признака от средней. Среднее линейное отклонение простое: Среднее линейное отклонение взвешенное применяется для сгруппированных данных: Среднее линейное отклонение в силу его условности применяется на практике сравнительно редко (в частности, для характеристики выполнения договорных обязательств по равномерности поставки; в анализе качества продукции с учетом технологических особенностей производства). Дисперсия - представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины. Дисперсия простая: Дисперсия взвешенная: Более удобно вычислять дисперсию по формуле: которая получается из основной путем несложных преобразований. Среднее квадратическое отклонение равно квадратному корню из среднего квадрата отклонений отдельных значений признака от средней арифметической. Для подробного описания особенностей распределения используются дополнительные характеристики, в частности, определяются моменты распределения . Моментом k-го порядка называется средняя из k-x степеней отклонений вариантов х от некоторой постоянной величины А: При использовании в качестве весов частот или частостей моменты называются эмпирическими, а при использовании вероятностей — теоретическими. Показатели формы распределения. Выяснение общего характера распределения предполагает оценку его однородности, а также расчет показателей асимметрии и эксцесса. При сравнительном изучении асимметрии нескольких распределений с разными единицами измерения вычисляется относительный показатель асимметрии: Его величина может быть положительной (для правосторонней асимметрии) и отрицательной (для левосторонней асимметрии). Применение данного показателя дает возможность определить не только величину асимметрии, но и проверить ее наличие в генеральной совокупности. Принято считать, что асимметрия выше 0, 5 (независимо от знака) считается значительной. Если асимметрия меньше 0, 25, она считается незначительной. Наличие асимметрии в генеральной совокупности проверяется с помощью определения оценки существенности на основе средней квадратической ошибки: В случае, если , асимметрия считается существенной и распределение признака в генеральной совокупности несимметрично и неслучайно, а закономерно. Для симметричных распределений может быть рассчитан показатель эксцесса, который показывает, насколько резкий скачок имеет изучаемое явление. Показатель эксцесса определяется на основе центрального момента четвертого порядка по формуле: Если показатель эксцесса больше нуля, то распределение островершинное и скачок считается значительным, если коэффициент эксцесса меньше нуля, то распределение считается плосковершинным и скачок считается незначительным. Среднеквадратическая ошибка эксцесса показывает, насколько существенен скачок в явлении и рассчитывается по формуле:
Дисперсионный анализ.
Дисперсионный анализ (от латинского Dispersio – рассеивание / на английском Analysis Of Variance - ANOVA) применяется для исследования влияния одной или нескольких качественных переменных (факторов) на одну зависимую количественную переменную. В основе дисперсионного анализа лежит предположение о том, что одни переменные могут рассматриваться как причины (факторы, независимые переменные): , а другие как следствия (зависимые переменные). Независимые переменные называют иногда регулируемыми факторами именно потому, что в эксперименте исследователь имеет возможность варьировать ими и анализировать получающийся результат. Основной целью дисперсионного анализа (ANOVA) является исследование значимости различия между средними с помощью сравнения (анализа) дисперсий. Разделение общей дисперсии на несколько источников, позволяет сравнить дисперсию, вызванную различием между группами, с дисперсией, вызванной внутригрупповой изменчивостью. При истинности нулевой гипотезы (о равенстве средних в нескольких группах наблюдений, выбранных из генеральной совокупности), оценка дисперсии, связанной с внутригрупповой изменчивостью, должна быть близкой к оценке межгрупповой дисперсии. Если вы просто сравниваете средние в двух выборках, дисперсионный анализ даст тот же результат, что и обычный t-критерий для независимых выборок (если сравниваются две независимые группы объектов или наблюдений) или t-критерий для зависимых выборок (если сравниваются две переменные на одном и том же множестве объектов или наблюдений). Сущность дисперсионного анализа заключается в расчленении общей дисперсии изучаемого признака на отдельные компоненты, обусловленные влиянием конкретных факторов, и проверке гипотез о значимости влияния этих факторов на исследуемый признак. Сравнивая компоненты дисперсии друг с другом посредством F—критерия Фишера, можно определить, какая доля общей вариативности результативного признака обусловлена действием регулируемых факторов. Исходным материалом для дисперсионного анализа служат данные исследования трех и более выборок: , которые могут быть как равными, так и неравными по численности, как связными, так и несвязными. По количеству выявляемых регулируемых факторов дисперсионный анализ может быть однофакторным (при этом изучается влияние одного фактора на результаты эксперимента), двухфакторным (при изучении влияния двух факторов) и многофакторным (позволяет оценить не только влияние каждого из факторов в отдельности, но и их взаимодействие). Дисперсионный анализ относится к группе параметрических методов и поэтому его следует применять только тогда, когда доказано, что распределение является нормальным. Дисперсионный анализ используют, если зависимая переменная измеряется в шкале отношений, интервалов или порядка, а влияющие переменные имеют нечисловую природу (шкала наименований).
Популярное:
|
Последнее изменение этой страницы: 2016-08-24; Просмотров: 536; Нарушение авторского права страницы