Запишем формулы различных видов степенных средних, придавая k значения: -1, 0,1,2.

Виды степенных средних

k	Название средней	Формула расчета средней	Область применения
Простая	Взвешенная
-1	Гармоническая			Усреднение относительных величин (за исключением относительных показателей динамики)
	Геометрическая			Усреднение относительных показателей динамики, а также для определения равноудаленной величины от максимального и минимального значений признака
	Арифметическая			Усреднение абсолютных, относительных величин (за исключением относительных показателей динамики)
	Квадратическая			например, для вычисления средней величины стороны n квадратных участков, средних диаметров n труб, стволов и т.п.

Известно, что степенные средние разных видов, исчисленные по одной и той же совокупности, имеют различные количественные значения. Чем больше показатель степени k, тем больше величина соответствующей степенной средней (данное утверждение справедливо для совокупности с положительными значениями признака Х):

Хгарм < Хгеом< Харифм< Хкв

Это свойство степенных средних называется свойством мажорантности средних.

Понятие ведущего показателя

Категорию средней величины можно раскрыть через понятие ведущего показателя. Ведущий показатель - это существенная характеристика совокупности как целого, определяемая всеми единицами этой совокупности и определенным образом связанная со всеми индивидуальными значениями признака: W = f(X₁, X₂, ..., X_N), где X_i - индивидуальные значения признака в совокупности. В большинстве случаев ведущий показатель имеет реальный экономический смысл.

Основное свойство ведущего показателя следующее: он должен сохранять свое значение при замене индивидуальных значений признака их средней величиной. Если в формуле ведущего показателя все величины X₁, X₂, ..., X_N заменить их средней величиной , то значение ведущего показателя должно остаться прежним, т.е.:

f(X₁, X₂, ..., X_N ) = f( , ,..., ).

Вид степенной средней	Ведущий показатель




	W=X₁+X₂+...+X_N
	W=X₁·f₁+X₂·f₂+...
	W=X₁²+X₂²+...+X_N²
	W=X₁²·f₁+X₂²·f₂+...

Применение конкретной формы средней величины зависит от вида усредняемого признака Х (абсолютная, средняя или относительная величина) и от того, в каком виде представлены исходные данные.

Веса усреднения.

Название «вес» выражает тот факт, что разные значения признака имеют неодинаковую «важность» при расчете средней величины. Величина средней взвешенной зависит уже не только от величины индивидуальных значений признака (как в простой средней), но и от соотношения весов. Например, чем больше веса у малых значений вариантов, тем величина средней меньше. Поэтому важное значение имеет обоснование и выбор веса.

Весом может быть: 1) частота повторения индивидуальных значений признака (N_j);

2) частость: q_j=N_j/SN_j (Sq_j=1). Тогда формула средней арифметической взвешенной имеет вид: =SX_j·q_j;

3) объемный показатель, логически связанный с усредняемым признаком (Х). Величина произведения данного показателя на Х, или частного от деления этого показателя на Х или величина, полученная при возведении Х в степень, равную данному показателю, должна иметь смысл, т.е. должна быть некоторым показателем;

4) доля объемного показателя в его суммарном объеме по совокупности в целом.

ВОПРОС 20

Усреднение относительных величин.

ВОПРОС

Если требуется найти среднее значение относительного показателя x, представляющего собой отношение абсолютных показателей (y и z): x=y/z, то используют формулу:

В зависимости от имеющихся данных формула расчета среднего значения x может быть сведена к формуле среднего арифметического взвешенного либо среднего гармонического взвешенного.

Когда имеются данные об индивидуальных значениях относительного показателя x и индивидуальных значениях абсолютного показателя знаменателя (z) в совокупности, то значения показателя y могут быть вычислены как: y=z·x и формула расчета будет иметь вид:

Это формула среднего арифметического взвешенного, где x_i усредняемые значения показателя, z_i - веса усреднения.

Когда имеются данные об индивидуальных значениях относительного показателя x и абсолютного показателя числителя (y), то значения показателя z могут быть вычислены как: z=y/x и формула расчета будет иметь вид:

Это формула среднего гармонического взвешенного, где x_i усредняемые значения показателя, y_i - веса усреднения.

Рассмотрим пример. На основе имеющихся данных (табл.) требуется определить среднюю цену:

Таблица

N магазина	Цена картофеля, руб/кг (x)	Выручка от реализации продукции, тыс.руб. (y)
1-ый
2-ой
3-ий
Итого	-

Расчет средней цены выражается соотношением:

Выручка от реализации известна, а объем реализации нет. Однако мы можем рассчитать объем реализации как частное от деления выручки на цену. Тогда средняя цена 1 кг картофеля по трем магазинам может быть исчислена по формуле средней гармонической взвешенной:

Этот же результат получится и по формуле средней арифметической взвешенной, если в качестве весов принять объем реализации (кг), который необходимо предварительно рассчитать:

Исчисление средней гармонической взвешенной избавляет от предварительного расчета весов, поскольку эта операция заложена в саму формулу.

ВОПРОС 21

Структурные характеристики распределения: квантили распределения и мода.

ОТВЕТ

К структурным характеристикам ряда распределения относят квантили распределения (медиану, квартили, децили и др.) и моду.

Квантили распределения представляют собой обобщающие показатели, характеризующие структуру распределения признака в совокупности.

Квантиль – это значения признака Х, занимающее определенное место в упорядоченной по данному признаку совокупности.

Виды квантилей:

1) медиана – Ме значение признака, приходящееся на середину упорядоченной совокупности,

2) квартили Q_1/4, Q_2/4=Ме, Q_3/4 – значения признака, делящие упорядоченную совокупность на 4 равные части,

3) децили Q_{0, 1}, Q_{0, 2}, …, Q_{0, 9} – значения признака, делящие упорядоченную совокупность на 10 равных частей,

4) процентили Q_{0, 01}, Q_{0, 02}, …, Q_{0, 99} - значения признака, делящие упорядоченную совокупность на 100 равных частей.

Рассмотрим пример. Определим медиану для признака Х «посещаемость практических занятий по статистике» в совокупности 20 студентов. Для этого упорядочим совокупность по Х:

N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

X 0 3 4 5 6 | 7 7 9 10 10 |10 12 12 14 15 | 15 16 16 16 16

Q_1/4 Q_2/4=Ме Q_3/4

В совокупности 20 единиц. Середина приходится на 10 и 11 элементы, значения признака у которых 6 и 7 соответственно. Медианой будет среднее из значений этих элементов Х₁₀=10, Х₁₁=11, т.е. Ме=(10+10)/2=10.

Первый квартиль отделяет первую четверть элементов совокупности (т.е. 5 элементов). Его значение будет равно среднему из значений признака у 5-ого и 6-ого элементов, т.е. Q_1/4=(6+7)/2=6, 5.

Третий квартиль отделяет последнюю четверть элементов совокупности. Его значение будет равно среднему из значений признака у 15-го и 16-го элементов, т.е. Q_3/4=(15+15)/2=15.

Если данные сгруппированы, то значение квантиля определяется по накопленным частотам: номер группы (j), которая содержит i-ый квантиль, определяется как номер первой группы от начала ряда, в которой сумма накопленных частот равна или превышает N·i, где i- индекс квантиля.

Если ряд интервальный, то значение квантиля уточняется по формуле:

(*),

где X_Qi- нижняя граница интервала, в котором находится i-ый квантиль;

F_(-1) – сумма накопленных частот интервалов, предшествующих интервалу, в котором находится i-ый квантиль;

N_Qi – частота интервала, в котором находится i-ый квантиль.

Рассмотрим пример: определим медиану распределения признака «посещаемость практических занятий по статистике» в совокупности студентов по сгруппированным данным (равноинтервальная группировка):

Таблица 1

Посещаемость – (X^н_i; X ^в_i)	Количество студентов	Накопленная частота (количество студентов нарастающим итогом)
[0; 5, 3]
(5, 3; 10, 6]
(10, 6; 16]
Итого	N=20	Х

Определим номер группы, содержащей Ме. Это будет 2-ая группа, т.к. именно в нее попадают серединные элементы совокупности (Накопленная частота F₂=11, что больше N·0, 5=10).

Теперь уточним значение Ме по формуле (*):

Q_2/4=Me=5, 3+5, 3·(10-4)/7=9, 84.

X_Q2/4=5, 3; D_Q2/4=5, 3; F_(-1)=F₁=4; N_Q2/4=7.

Еще один способ определения квантилей - графический по кумуляте распределения (см. рис.1).

Например, для определения медианы высоту наибольшей ординаты кумуляты, которая соответствует общей численности совокупности (N) делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения является медианой. Для определения квартилей высоту наибольшей ординаты делят тремя точками на три равные части. Через эти точки проводят прямые параллельные оси абсцисс до пересечения с кумулятой. Абсциссы точек пересечения и будут искомыми значениями квартилей.

Рис. 1. Определение медианы и квартилей по кумуляте.

Наиболее распространенным видом квантилей является медиана. Медиана не требует знания всех индивидуальных значений признака. Она не чувствительна к крайним значениям признака, которые могут резко отличаться от основной массы его значений. Поэтому медиану используют как наиболее надежный показатель типичного значения признака в неоднородной совокупности (включающей резкие отклонения от ).

Медиана находит практическое применение также вследствие особого математического свойства – сумма абсолютных отклонений чисел ряда от медианы есть величина наименьшая: å (Х_i-Ме)®min.

Мода (Мо[х]) – наиболее часто встречающееся значение признака в совокупности.

Для дискретного ряда мода – это значение признака, которому соответствует наибольшая частота (частость) распределения. Для интервального ряда – это значение признака, которому соответствует наибольшая плотность распределения. Если ряд равноинтервальный, то значение моды можно определить по частотам (частостям): их соотношение будет таким же, что и плотностей распределения. Кроме того, значение моды в случае равноинтервального ряда можно уточнить по формуле:

Мо=Х_Мо+D_Мо ·(N_Mo-N_Mo_-1) / (N_Mo-N_Mo_-1 +N_Mo-N_Mo₊₁),

где N_M_о, N_M_о-1, N_M_о+1– частоты, соответственно, модального, предшествующего и последующего интервалов.

Рассмотрим пример: определим моду для распределения признака «посещаемость практических занятий по статистике» в совокупности студентов, используя данные равноинтервальной группировки (табл.1). Модальный интервал будет [10, 6 –16], т.к. в этом интервале наибольшая частота (N_M₀=9). Приближенное значение Мо определим по формуле: Мо=10, 6+5, 3(9-7)/(9-7+9-0)=11, 56.

Мода равноинтервального ряда графически определяется по гистограмме распределения (см. рис.2). Для этого правую вершину модального прямоугольника соединяем с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения.

Рис.2. Определение моды по гистограмме

Если все значения вариационного ряда имеют одинаковую частоту, то говорят, что этот вариационный ряд не имеет моды. Если две не соседних варианты имеют одинаковую доминирующую частоту, то такой вариационный ряд называют бимодальным; если таких вариант больше двух, то ряд – полимодальный.

Мода также как и медиана не требует знания всех индивидуальных значений признака и поэтому может быть использована в качестве наиболее типичного значения признака в неоднородной совокупности.

ВОПРОС 22

Показатели вариации признака. Свойства и методы расчета показателей вариации.

ОТВЕТ

Средняя величина дает обобщающую характеристику всей совокупности изучаемого явления. Однако два распределения, имеющие одинаковую среднюю арифметическую, могут значительно отличаться друг от друга по степени рассеяния (вариации) признака. Если индивидуальные значения признака ряда мало отличаются друг от друга (рис.3.а), то средняя арифметическая будет достаточно надежной показательной характеристикой типичного уровня в данной совокупности. Если же ряд распределения характеризуется значительным рассеиванием индивидуальных значений признака (рис.3.б), то средняя арифметическая будет ненадежной характеристикой типичного уровня этой совокупности и ее практическое применение будет ограничено.

А) ··········· Х

Б) · · · · · · · · · · · Х

Рис.3. Примеры различных типов вариации признака Х.

Для измерения рассеяния (вариации) признака применяются различные абсолютные и относительные показатели вариации.

К абсолютным показателям вариации относятся:

· Размах вариации - R (самый элементарный показатель вариации) представляет собой разность между максимальным и минимальным значениями признака в совокупности: R=Xmax-Xmin. Недостатком данного показателя является то, что размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов значений признака.

Среднее по совокупности отклонение значения признака от его среднего уровня измеряют два следующих показателя вариации: среднее линейное и среднее квадратическое отклонение.

· Среднее линейное отклонение - d представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической (при этом всегда полагают, что среднюю вычитают из варианта):

где N – объем совокупности; m- число групп;

f_j – частота в j–ой группе (у j–ого варианта значения признака).

Математические свойства модулей плохие, поэтому часто на практике применяют другой показатель среднего отклонения от средней - среднеее квадратическое отклонение.

Среднее квадратическое отклонение - s представляет собой среднюю квадратическую из отклонений отдельных вариантов от их средней арифметической:

Среднее линейное и квадратическое отклонение показывают как расположена основная масса единиц совокупности относительно среднего арифметического значения; они выражаются в тех же единицах, что и варианты (Х_j), поэтому экономически хорошо интерпретируются.

· Дисперсия – s² это квадрат среднего квадратического отклонения. Она представляет собой средний квадрат отклонений вариантов от их средней величины. Она может быть также вычислена, как разность среднего квадрата значения признака и квадрата среднего арифметического значения признака:

Для несгруппированных данных:

Для сгруппированных данных:

Среднее квадратическое отклонение наряду с дисперсией входят в большинство теорем теории вероятности и математической статистики, что обусловливает их широкое применение на практике. Кроме того, дисперсия может быть разложена на составные части, позволяющие оценить влияние различных факторов, обусловливающих вариацию признака.

Основные вычислительные свойства дисперсии:

1) дисперсия постоянной величины равна 0;

2) если все варианты значений признака уменьшить на одно и то же число, то дисперсия не изменится;

3) если все варианты значений признака уменьшить в одно и то же число А раз (А-const), то дисперсия уменьшится в А² раз.

При вычислении показателей вариации сгруппированных данных используют формулу взвешенной средней. Для интервальных рядов распределения в качестве вариантов значений признака используют центральные (серединные) значения. В результате получают приближенные значения статистических показателей.

Относительные показатели вариации применяют, если необходимо оценить интенсивность вариации, или сравнить вариацию признака в различных совокупностях, или сравнить вариацию различных признаков. Показатель относительной вариации рассчитывается как отношение абсолютного показателя вариации к среднему значению.

Самым распространенным относительным показателем рассеяния является коэффициент вариации. Он представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической: .

Коэффициент вариации используют также как характеристику однородности совокупности. Совокупность считается количественно однородной, если коэффициент вариации не превышает 33%.

ВОПРОС 23

Теорема о разложении дисперсии при группировании.

ОТВЕТ

Пусть при группировке совокупности по некоторому признаку Х было образовано m однородных групп. Согласно правилу о разложении дисперсии общая дисперсия признака Х (по совокупности в целом) может быть разложена на две составные части: 1) межгрупповую и 2) остаточную (среднюю из внутригрупповых) дисперсии: s²_х=d²+e².

Общая дисперсия рассчитывается по формуле простой дисперсии и показывает величину вариации признака, обусловленную всеми факторами, влияющими на данный признак.

Межгрупповая дисперсия характеризует ту часть общей вариации признака, которая обусловлена делением совокупности на группы. То есть она характеризует вариацию признака, обусловленную факторами, с которыми связано деление совокупности на группы. Поэтому ее еще называют факторной дисперсией. Межгрупповая дисперсия равна среднему взвешенному квадрату отклонений групповых (частных) средних от общей средней :

Где Nj- численность единиц в j-ой группе.

Средняя из внутригрупповых дисперсий (или остаточная )- e² характеризует остаточную вариацию, несвязанную с группированием. То есть, она характеризует вариацию признака, обусловленную прочими факторами, не связанными с делением совокупности на группы. Вычисляется она как средняя взвешенная из внутригрупповых дисперсий.

, j=1; m

s_j² - дисперсия признака внутри j–ой группы.

Очевидно, что чем больше межгрупповая дисперсия d², тем лучше проведена группировка (выделенные при группировки группы сильнее различаются между собой). Поэтому межгрупповая дисперсия является критерием группирования для группировок с одинаковым числом групп. Лучшей будет та группировка, у которой величина d²больше.

Пользуясь правилом сложения дисперсий, можно всегда по двум известным дисперсиям отыскать третью – неизвестную, а также судить о силе влияния группировочного признака.

ВОПРОС 24

⇐ Предыдущая 1 2 345 6 7 8 9 10 Следующая ⇒