Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Глава 7. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ



Способы формирования выборочной совокупности

Под выборочным наблюдением понимается такое несплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергаются единицы изучаемой совокупности, отобранные специальным способом. Выборочное наблюдение ставит перед собой задачу: по обследуемой части дать характеристику всей совокупности единиц при условии соблюдения всех правил и принципов проведения статистического наблюдения и научно организованной работы по отбору единиц.

При этом методе обследованию подвергаются не все объекты совокупности. Совокупность единиц, из которой производится отбор, называется генеральной совокупностью, а специальным образом отобранная часть из генеральной совокупности называется выборочной совокупностью , она отражает все свойства генеральной.

Основные характеристики параметров генеральной и выборочной совокупности приведены в табл. 7.1.

Таблица 7.1

№ п/п Характеристики Генеральная совокупность Выборочная совокупность
Объем совокупности (численность единиц) N n
Численность единиц, обладающих обследуемым признаком М m
Доля единиц, обладающих обследуемым признаком P=M/N W=m/n
Средний размер признака
Дисперсия количественного признака
Дисперсия доли

 

Как правило, выборочные характеристики отклоняются от характеристик генеральной совокупности, т. е. обычно имеют место ошибки репрезентативности, разность между средними и относительными показателями выборочной и генеральной совокупностями. Основная задача выборочного метода сводится к минимизации ошибок репрезентативности.

Главными условиями выборки являются:

1 . Равновозможность каждой единицы генеральной совокупности попасть в выборку.

Если из совокупности, состоящей из N единиц, обладающих некоторыми признаками, отбирается одна единица и при этом никакой из единиц, составляющих данную совокупность, не отдается предпочтение по сравнению с другими, то говорят, что каждой единице обеспечена равная возможность быть отобранной (принцип равновозможности). О равновозможности отбора можно судить либо исходя из общих свойств изучаемых явлений, либо по числу появлений событий в достаточно большой серии испытаний.

В случае соблюдения принципа равновозможности выбор вполне определенной конкретной единицы имеет один шанс (случай) из числа N таких же шансов. Выбор же единицы, обладающей данным значением признака (например, первосортные детали, число которых во всей совокупности М), имеет М равновозможных шансов из N таких же шансов.

2. Достаточная численность выборки.

Для обеспечения равновозможности единиц генеральной совокупности попасть в выборку применяются следующие виды, методы и способы отбора.

По виду различают индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности, при групповом отборе – группы единиц, а комбинированный отбор предполагает сочетание группового и индивидуального отбора.

Отбор единиц из совокупности, при котором каждая отобранная и обследованная единица возвращается в генеральную совокупность и может быть повторно отобрана, называется повторным методом. Если же после отбора обследованная единица не возвращается в совокупность и в дальнейших испытаниях не участвует, то отбор называют бесповторным методом.

Способ отбора определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности. В практике выборочных обследований наибольшее распространение получили следующие выборки:

1) собственно-случайная выборка;

2) механическая выборка;

3) типическая выборка;

4) серийная выборка;

5) комбинированная выборка [1, 3–7].

Ошибки выборки

Расхождения между величиной какого-либо показателя, найденного посредством статистического наблюдения, и действительными его размерами называются ошибками наблюдения. В зависимости от причин возникновения различают ошибки регистрации и ошибки репрезентативности.

Ошибки регистрации возникают в результате неправильного установления фактов или ошибочной записи в процессе наблюдения или опроса. Они бывают случайными или систематическими. Случайные ошибки регистрации могут быть допущены как опрашиваемыми в их ответах, так и регистраторами. Систематические ошибки могут быть и преднамеренными, и непреднамеренными. Преднамеренные – сознательные, тенденциозные искажения действительного положения дела. Непреднамеренные вызываются различными случайными причинами (небрежность, невнимательность).

Ошибки репрезентативности (представительности) возникают в результате неполного обследования и в случае, если обследуемая совокупность недостаточно полно воспроизводит генеральную совокупность. Они могут быть случайными и систематическими. Случайные ошибки репрезентативности – это отклонения, возникающие при несплошном наблюдении из-за того, что совокупность отобранных единиц наблюдения (выборка) неполно воспроизводит всю совокупность в целом. Систематические ошибки репрезентативности – это отклонения, возникающие вследствие нарушения принципов случайного отбора единиц. Ошибки репрезентативности органически присущи выборочному наблюдению и возникают в силу того, что выборочная совокупность не полностью воспроизводит генеральную. Избежать ошибок репрезентативности нельзя, однако, пользуясь методами теории вероятностей, основанными на использовании предельных теорем закона больших чисел, эти ошибки можно свести к минимальным значениям, границы которых устанавливаются с достаточно большой точностью.

Ошибки выборки – разность между характеристиками выборочной и генеральной совокупности. Для среднего значения ошибка будет определяться по формуле

(7.1)

где

Величина называется предельной ошибкой выборки.

Предельная ошибка выборки – величина случайная. Исследованию закономерностей случайных ошибок выборки посвящены предельные теоремы закона больших чисел. Наиболее полно эти закономерности раскрыты в теоремах П. Л. Чебышева и А. М. Ляпунова.

Теорему П. Л. Чебышева применительно к рассматриваемому методу можно сформулировать следующим образом: при достаточно большом числе независимых наблюдений можно с вероятностью, близкой к единице (т. е. почти с достоверностью), утверждать, что отклонение выборочной средней от генеральной будет сколько угодно малым. В теореме П. Л. Чебышева доказано, что величина ошибки не должна превышать . В свою очередь величина , выражающая среднее квадратическое отклонение выборочной средней от генеральной средней, зависит от колеблемости признака в генеральной совокупности и числа отобранных единиц n. Эта зависимость выражается формулой

, (7.2)

где зависит также от способа производства выборки.

Величину = называют средней ошибкой выборки. В этом выражении – генеральная дисперсия, n – объем выборочной совокупности.

Рассмотрим, как влияет на величину средней ошибки число отбираемых единиц n. Логически нетрудно убедиться, что при отборе большого числа единиц расхождения между средними будут меньше, т. е. существует обратная связь между средней ошибкой выборки и числом отобранных единиц. При этом здесь образуется не просто обратная математическая зависимость, а такая зависимость, которая показывает, что квадрат расхождения между средними обратно пропорционален числу отобранных единиц.

Увеличение колеблемости признака влечет за собой увеличение среднего квадратического отклонения, а следовательно, и ошибки. Если предположить, что все единицы будут иметь одинаковую величину признака, то среднее квадратическое отклонение станет равно нулю и ошибка выборки также исчезнет. Тогда нет необходимости применять выборку. Однако следует иметь в виду, что величина колеблемости признака в генеральной совокупности неизвестна, поскольку неизвестны размеры единиц в ней. Можно рассчитать лишь колеблемость признака в выборочной совокупности. Соотношение между дисперсиями генеральной и выборочной совокупности выражается формулой

Поскольку величина при достаточно больших n близка к единице, можно приближенно считать, что выборочная дисперсия равна генеральной дисперсии, т. е.

Следовательно, средняя ошибка выборки показывает, какие возможны отклонения характеристик выборочной совокупности от соответствующих характеристик генеральной совокупности. Однако о величине этой ошибки можно судить с определенной вероятностью. На величину вероятности указывает множитель

Теорема А. М. Ляпунова. А. М. Ляпунов доказал, что распределение выборочных средних (следовательно, и их отклонений от генеральной средней) при достаточно большом числе независимых наблюдений приближенно нормально при условии, что генеральная совокупность обладает конечной средней и ограниченной дисперсией.

Математически теорему Ляпунова можно записать так:

(7.3)

где , (7.4)

где – математическая постоянная;

предельная ошибка выборки, которая дает возможность выяснить, в каких пределах находится величина генеральной средней.

Значения этого интеграла для различных значений коэффициента доверия t вычислены и приводятся в специальных математических таблицах. В частности, при:

Поскольку t указывает на вероятность расхождения , т. е. на вероятность того, на какую величину генеральная средняя будет отличаться от выборочной средней, то это может быть прочитано так: с вероятностью 0, 683 можно утверждать, что разность между выборочной и генеральной средними не превышает одной величины средней ошибки выборки. Другими словами, в 68, 3 % случаев ошибка репрезентативности не выйдет за пределы С вероятностью 0, 954 можно утверждать, что ошибка репрезентативности не превышает (т. е. в 95 % случаев). С вероятностью 0, 997, т. е. довольно близкой к единице, можно ожидать, что разность между выборочной и генеральной средней не превзойдет трехкратной средней ошибки выборки и т. д.

Логически связь здесь выглядит довольно ясно: чем больше пределы, в которых допускается возможная ошибка, тем с большей вероятностью судят о ее величине.

Зная выборочную среднюю величину признака и предельную ошибку выборки , можно определить границы (пределы), в которых заключена генеральная средняя

(7.5)

1. Собственно-случайная выборка – этот способ ориентирован на выборку единиц из генеральной совокупности без всякого расчленения на части или группы. При этом для соблюдения основного принципа выборки – равной возможности всем единицам генеральной совокупности быть отобранным – используются схема случайного извлечения единиц путем жеребьевки (лотереи) или таблицы случайных чисел. Возможен повторный и бесповторный отбор единиц

Средняя ошибка собственно-случайной выборкипредставляет собойсреднеквадратическое отклонение возможных значений выборочной средней от генеральной средней. Средние ошибки выборки при собственно-случайном методе отбора представлены в табл. 7.2.

Таблица 7.2

Средняя ошибка выборки μ При отборе
повторном бесповторном
Для средней  
Для доли  

 

В таблице использованы следующие обозначения:

– дисперсия выборочной совокупности;

– численность выборки;

– численность генеральной совокупности;

– выборочная доля единиц, обладающих изучаемым признаком;

– число единиц, обладающих изучаемым признаком;

– численность выборки.

Для увеличения точности вместо множителя следует брать множитель , но при большой численности N различие между этими выражениями практического значения не имеет.

Предельная ошибка собственно-случайной выборки рассчитывается по формуле

, (7.6)

где t – коэффициент доверия зависит от значения вероятности.

Пример. При обследовании ста образцов изделий, отобранных из партии в случайном порядке, 20 оказалось нестандартными. С вероятностью 0, 954 определите пределы, в которых находится доля нестандартной продукции в партии.

Решение. Вычислим генеральную долю (Р): .

Доля нестандартной продукции: .

Предельная ошибка выборочной доли с вероятностью 0, 954 рассчитывается по формуле (7.6) с применением формулы табл. 7.2 для доли:

С вероятностью 0, 954 можно утверждать, что доля нестандартной продукции в партии товара находится в пределах 12 % ≤ P ≤ 28 %.

В практике проектирования выборочного наблюдения возникает потребность определения численности выборки, которая необходима для обеспечения определенной точности расчета генеральных средних. Предельная ошибка выборки и ее вероятность при этом являются заданными. Из формулы и формул средних ошибок выборки устанавливается необходимая численность выборки. Формулы для определения численности выборки (n) зависят от способа отбора. Расчет численности выборки для собственно-случайной выборки приведен в табл. 7.3.

 

 

Таблица 7.3

Предполагаемый отбор Формулы
для средней для доли
Повторный
Бесповторный

 

2. Механическая выборка – при этом методе исходят из учета некоторых особенностей расположения объектов в генеральной совокупности, их упорядоченности (по списку, номеру, алфавиту). Механическая выборка осуществляется путем отбора отдельных объектов генеральной совокупности через определенный интервал (каждый 10-й или 20-й). Интервал рассчитывается по отношению , где n – численность выборки, N – численность генеральной совокупности. Так, если из совокупности в 500 000 единиц предполагается получить 2 %-ную выборку, т. е. отобрать 10 000 единиц, то пропорция отбора составит Отбор единиц осуществляется в соответствии с установленной пропорцией через равные интервалы. Если расположение объектов в генеральной совокупности носит случайный характер, то механическая выборка по содержанию аналогична случайному отбору. При механическом отборе применяется только бесповторная выборка [1, 5–10].

Средняя ошибка и численность выборки при механическом отборе подсчитывается по формулам собственно-случайной выборки (см. табл. 7.2 и 7.3).

3. Типическая выборка, при котрой генеральная совокупность делится по некоторым существенным признакам на типические группы; отбор единиц производится из типических групп. При этом способе отбора генеральная совокупность расчленяется на однородные в некотором отношении группы, которые имеют свои характеристики, и вопрос сводится к определению объема выборок из каждой группы. Может быть равномерная выборка – при этом способе из каждой типической группы отбирается одинаковое число единиц Такой подход оправдан лишь при равенстве численностей исходных типических групп. При типическом отборе, непропорциональном объему групп, общее число отбираемых единиц делится на число типических групп, полученная величина дает численность отбора из каждой типической группы.

Более совершенной формой отбора является пропорциональная выборка. Пропорциональной называется такая схема формирования выборочной совокупности, когда численность выборок, взятых из каждой типической группы в генеральной совокупности, пропорциональна численностям, дисперсиям (или комбинированно и численностям, и дисперсиям). Условно определяем численность выборки в 100 единиц и отбираем единицы из групп:

пропорционально численности их генеральной совокупности (табл. 7.4). В таблице обозначено:

Ni – численность типической группы;

dj – доля (Ni/N);

N – численность генеральной совокупности;

ni – численность выборки из типической группы вычисляется:

, (7.7)

n – численность выборки из генеральной совокупности.

Таблица 7.4

Группы Ni dj ni
0, 3
0, 5
0, 2
  1, 0

пропорционально среднему квадратическому отклонению (табл. 7.5).

здесь si – среднее квадратическое отклонение типических групп;

ni – численность выборки из типической группы вычисляется по формуле

(7.8)

Таблица 7.5

Ni si ni
0, 25
0, 35
0, 40
1, 0

– комбинированно (табл. 7.6).

Численность выборки вычисляется по формуле

. (7.9)

Таблица 7.6

si siNi
0, 23
0, 53
0.24
1, 0

При проведении типической выборки непосредственный отбор из каждой группы проводится методом случайного отбора.

Средние ошибки выборки рассчитываются по формулам табл. 7.7 в зависимости от способа отбора из типических групп.

Таблица 7.7

Способ отбора Повторный Бесповторный
для средней для доли для средней для доли
Непропорциональный объему групп
Пропорциональный объему групп
Пропорциональный колеблемости в группах (является наивыгоднейшим)

здесь – средняя из внутригрупповых дисперсий типических групп;

– доля единиц, обладающих изучаемым признаком;

– средняя из внутригрупповых дисперсий для доли;

– среднее квадратическое отклонение в выборке из i-й типической группы;

– объем выборки из типической группы;

– общий объем выборки;

– объем типической группы;

– объем генеральной совокупности.

Численность выборки из каждой типической группы должна быть пропорциональна среднему квадратическому отклонению в этой группе . Расчет численности производится по формулам, приведенным в табл. 7.8.

Таблица 7.8

  Повторный Бесповторный
Для определения средней
Для определения доли

4. Серийная выборка – удобена в тех случаях, когда единицы совокупности объединены в небольшие группы или серии. При серийной выборке генеральную совокупность делят на одинаковые по объему группы – серии. В выборочную совокупность отбираются серии. Сущность серийной выборки заключается в случайном или механическом отборе серий, внутри которых производится сплошное обследование единиц. Средняя ошибка серийной выборки с равновеликими сериями зависит от величины только межгрупповой дисперсии. Средние ошибки сведены в табл. 7.9.

 

 

Таблица 7.9

Способ отбора серии Формулы
для средней для доли
Повторный
Бесповторный

Здесь R – число серий в генеральной совокупности;

r – число отобранных серий;

– межсерийная (межгрупповая) дисперсия средних;

– межсерийная (межгрупповая) дисперсия доли.

При серийном отборе необходимую численность отбираемых серий определяют так же, как и при собственно-случайном методе отбора.

Расчет численности серийной выборки производится по формулам, приведенным в табл. 7.10.

Таблица 7.10

  Повторный Бесповторный
Для определения среднего признака
Для определения доли

Пример. В механическом цехе завода в десяти бригадах работает 100 рабочих. В целях изучения квалификации рабочих была произведена 20 %-ная серийная бесповторная выборка, в которую вошли две бригады. Получено следующее распределение обследованных рабочих по разрядам:

Рабочие Разряды рабочих в бригаде 1 Разряды рабочих в бригаде 2 Рабочие Разряды рабочих в бригаде 1 Разряды рабочих в бригаде 2

Необходимо определить с вероятностью 0, 997 пределы, в которых находится средний разряд рабочих механического цеха.

Решение. Определим выборочные средние по бригадам и общую среднюю как среднюю взвешенную из групповых средних:

Определим межсерийную дисперсию по формулам (5.25):

Рассчитаем среднюю ошибку выборки по формуле табл. 7.9:

Вычислим предельную ошибку выборки с вероятностью 0, 997:

С вероятностью 0, 997 можно утверждать, что средний разряд рабочих механического цеха находится в пределах

5. Комбинированная выборка

В практике статистических исследований, помимо рассмотренных выше способов отбора, применяется и их комбинация. Например, можно комбинировать типическую и серийную выборки, когда серии отбираются в установленном порядке из нескольких типических групп. Возможна также комбинация серийного и случайного отборов, при которой отдельные единицы отбираются внутри серии в случайном порядке
[1, 5–11].

Малая выборка

При большом числе единиц выборочной совокупности (n> 100) распределение случайных ошибок выборочной средней, в соответствии с теорией А. М. Ляпунова, нормально или приближается к нормальному по мере увеличения числа наблюдений. Вероятность выхода ошибки за определенные пределы оценивается на основе таблиц интеграла Лапласа. Расчет ошибки выборки базируется на величине генеральной дисперсии , так как при больших n коэффициент , на который для получения генеральной умножается выборочная дисперсия, большой роли не играет.

Однако в практике статистического исследования в условиях рыночной экономики все чаще приходится сталкиваться с небольшими по объему так называемыми малыми выборками. Под малой выборкой понимается такое выборочное наблюдение, численность единиц которого не превышает 30-ти. В настоящее время малая выборка используется более широко, чем раньше, прежде всего за счет статистического изучения деятельности малых и средних предприятий, коммерческих банков, фермерских хозяйств и т. д.

Разработка теории малой выборки была начата английским статистиком В. С. Госсетом (печатавшимся под псевдонимом «Стьюдент») в 1908 г. Он доказал, что оценка расхождения между средней малой выборки и генеральной средней имеет особый закон распределения.

При оценке результатов малой выборки величина генеральной дисперсии в расчетах не используется. Для определения возможных пределов ошибки пользуются так называемым критерием Стьюдента , определяемым по формуле

, (7.10)

где . (7.11)

Ее называют мерой случайных колебаний выборочной средней в малой выборке. Величина вычисляется на основе данных выборочного наблюдения. Она равна

(7.12)

Данная величина используется лишь для исследуемой совокупности, а не в качестве приближенной оценки в генеральной совокупности. При небольшой численности выборки распределение Стьюдента отличается от нормального. Предельная ошибка малой выборки в зависимости от средней ошибки представлена как

(7.13)

Но в данном случае величина t иначе связана с вероятной оценкой, чем при большой выборке. Согласно распределению Стьюдента, вероятная оценка зависит как от величины t, так и от объема выборки в случае, если предельная ошибка не превысит t-кратную среднюю ошибку в малых выборках.

В заключение отметим, что расчет ошибок в малой выборке мало отличается от аналогичных вычислений в большой выборке. Различие заключается в том, что при малой выборке вероятность нашего утверждения несколько меньше, чем при большой выборке. Однако все это не означает, что можно использовать малую выборку тогда, когда нужна большая выборка. Во многих случаях расхождения между найденными пределами могут достигать значительных размеров, что вряд ли удовлетворяет исследователей. Поэтому малую выборку следует применять в статистическом исследовании социально-экономических явлений с большой осторожностью, при соответствующем теоретическом и практическом обосновании [1, 3, 4].

Тесты

1. Отклонение выборочных характеристик от соответствующих характеристик генеральной совокупности, возникающее вследствие нарушения принципа случайности отбора, называется:

а) систематической ошибкой репрезентативности;

б) случайной ошибкой репрезентативности.

2. Чтобы уменьшить ошибку выборки, рассчитанную в условиях механического отбора, можно:

а) уменьшить численность выборочной совокупности;

б) увеличить численность выборочной совокупности;

в) применить серийный отбор;

г) применить типический отбор.

3. Проведено собственно-случайное бесповторное обследование заработной платы сотрудников аппарата управления двух финансовых корпораций. Обследовано одинаковое число сотрудников. Дисперсия заработной платы для финансовых корпораций одинакова, а численность аппарата управления больше в первой корпорации. Средняя ошибка выборки:

а) больше в первой корпорации;

б) больше во второй корпорации;

в) в обеих корпорациях одинакова;

г) данные не позволяют сделать вывод.

4. По данным 10 %-ного выборочного обследования дисперсия средней заработной платы сотрудников первого туристического агентства 225, а второго – 100. Численность сотрудников первого туристического агентства в четыре раза больше, чем второго. Ошибка выборки больше:

а) в первом туристическом агентстве;

б) во втором туристическом агентстве;

в) ошибки одинаковы;

г) предсказать результат невозможно.

5. По выборочным данным (2 %-ный отбор), удельный вес неуспевающих студентов на IV курсе составил 10 %, на III курсе – 15 %. При одинаковой численности выборочной совокупности ошибка выборки больше:

а) на IV курсе;

б) на III курсе;

в) ошибки равны;

г) данные не позволяют сделать вывод.

6. При осмотре партии деталей среди них оказалось 10 бракованных изделий. Если в полученной партии было 200 изделий, то дисперсия равна

7. Численность выборки, которая позволила бы оценить долю брака в партии хлебобулочных изделий из 10000 единиц с точностью до 2 % при 5 %-ном уровне значимости, составляет:

а) 2500;

б) 826;

в) не хватает данных;

г) 2000.

 

Глава 8. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ВЗАИМОСВЯЗИ
СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ЯВЛЕНИЙ


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-08-24; Просмотров: 2343; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.105 с.)
Главная | Случайная страница | Обратная связь