Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Соотношение между средней величиной, медианой и модой
Различие между средней арифметической величиной, медианой и модой в данном распределении невелико. Если распределение по форме близко к нормальному закону, то медиана находится между модой и средней величиной, причем ближе к средней, чем к моде. При правосторонней асимметрии х > Me > Mo; при левосторонней асимметрии х < Me < Mo. Для умеренно асимметричных распределений справедливо равенство: |Мо — х\ = 3|Ме — х\. Показатели размера и интенсивности вариации
Абсолютные средние размеры вариации Следующим этапом изучения вариации признака в совокупности является измерение характеристик силы, величины вариации. Простейшим из них может служить размах, или амплитуда вариации, — абсолютная разность между максимальным и минимальным значениями признака из имеющихся в изучаемой совокупности значений. Таким образом, размах вариации вычисляется по формуле R= Xmax — Xmin. (5.16) Поскольку величина размаха характеризует лишь максимальное различие значений признака, она не может измерять закономерную силу его вариации во всей совокупности. Предназначенный для данной цели показатель должен учитывать и обобщать все различия значений признака в совокупности без исключения. Число таких различий равно числу сочетаний по два из всех единиц совокупности, по данным табл. 5.6 оно составит: С143 = 10 153. Однако нет необходимости рассматривать, вычислять и осреднять все отклонения. Проще использовать среднюю из отклонений отдельных значений признака от среднего арифметического значения признака, а таковых всего 143. Но среднее отклонение значений признака от средней арифметической величины согласно известному свойству последней равно нулю. Поэтому показателем силы вариации выступает не алгебраическая средняя отклонений, а средний модуль отклонения, или среднее линейное отклонение. Этот показатель рассчитывается по формуле Это означает, что в среднем урожайность в изучаемой совокупности хозяйств отклонялась от средней урожайности по области на 6, 85 ц/га. Простота расчета и интерпретации составляют положительные стороны данного показателя, однако математические свойства модулей «плохие»: их нельзя поставить в соответствие с каким-либо вероятностным законом, в том числе и с нормальным распределением, параметром которого является не средний модуль отклонений, а среднее квадратическое отклонение (в англоязычных программах для ПЭВМ называемое «The standard deviation», сокращенно s.d.
или просто s, в русскоязычных — СКО). В статистической литературе среднее квадратическое отклонение от средней величины принято обозначать малой (строчной) греческой Следует указать, что некоторое округление средней величины и середин интервалов, например до целых, мало отражается на величине а, которая составила бы при этом 8, 55 ц/га. Среднее квадратическое отклонение по величине в реальных совокупностях всегда больше среднего модуля отклонений. Соотношение о: а зависит от наличия в совокупности резких, выделяющихся отклонений и может служить индикатором «засоренности» совокупности неоднородными элементами: чем это соотношение больше, тем сильнее подобная «засоренность». Для нормального закона распределения а: а ~ 1, 2.
Понятие дисперсии
Квадрат среднего квадратического отклонения дает величину дисперсии а2. Формула дисперсии: для несгруппированных данных Расчет по формулам (5.21) и (5.23) приведет к погрешности дисперсии того же порядка, что и погрешность, допущенная при округлении средней величины. Математик В. С. Итенберг показал, что расчет по формулам (5.22) и (5.24) приводит к погрешности дисперсии, на порядки большей, нежели допущенная при расчете средней, что видно из приведенного ниже примера (табл. 5.7).
Для распределения сельскохозяйственных предприятий по урожайности в табл. 5.6 q = (36, 25 - 25, 09) = 5, 58 ц/га. Сила вариации в центральной части совокупности, как правило, меньше, чем в целом по всей совокупности. Соотношение между средним модулем отклонений и средним квартильным отклонением также служит для изучения структуры вариации: большое значение такого соотношения говорит о наличии слабоварьирующего «ядра» и сильно рассеянного вокруг этого ядра окружения, или «гало» в изучаемой совокупности. Для данных табл. 5.6 соотношение a: q = 1, 23, что говорит о небольшом различии силу вариации в центральной части совокупности и на ее периферии. Для оценки интенсивности вариации и для сравнения ее в разных совокупностях и тем более для разных признаков необходимы относительные показатели вариации. Они вычисляются как отношения абсолютных показателей силы вариации, рассмотренных ранее, к средней арифметической величине признака. Получаем следующие показатели: 1) относительный размах вариации р (коэффициент осцилляции): 159 Оценка степени интенсивности вариации возможна только для каждого отдельного признака и совокупности определенного состава. Так, для совокупности сельскохозяйственных предприятий вариация урожайности в одном и том же природном регионе может быть оценена как слабая, если v < 10%, умеренная при 10% < v < 25% и сильная при v > 25%. Напротив, вариация роста в совокупности взрослых мужчин или женщин уже при коэффициенте, равном 7%, должна быть оценена и воспринимается людьми как сильная. Таким образом, оценка интенсивности вариации состоит в сравнении наблюдаемой вариации с некоторой обычной ее интенсивностью, принимаемой за норматив. Мы привыкли к тому, что урожайность, заработок или доход на душу населения, число жилых комнат в здании могут различаться в несколько и даже десятки раз, но различие роста людей в полтора раза уже воспринимается как очень сильное. Различная сила, интенсивность вариации обусловлены объективными причинами. Например, цена продажи доллара США в одном из коммерческих банков Санкт-Петербурга на 1 января 2003 г. варьировала от 31.87 руб./долл. до 32.13 руб./долл. при средней цене 32 руб. за доллар США. Относительный размах вариации р = [32.13 - 31.87] = 26 коп.: 32 руб. = 0, 8%. Такая малая вариация вызвана тем, что при значительном различии курса доллара немедленно произошел бы отток покупателей из «дорогого» банка в более «дешевые». Напротив, цена килограмма картофеля или говядины в разных регионах России варьирует очень сильно — на десятки процентов и более. Это объясняется разными затратами на доставку товара из региона-производителя в регион-потребитель, т.е. пословицей «Телушка за морем — полушка, да рубль перевоз». Популярное:
|
Последнее изменение этой страницы: 2016-08-24; Просмотров: 1040; Нарушение авторского права страницы