Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Возникновение статистики как науки



Часть 1. Темы 1-5

1. СТАТИСТИКА КАК НАУКА И ЕЁ ИНФОРМАЦИОННАЯ БАЗА……………………...................................................................5

1.1. Возникновение статистики как науки..............................5

1.2. Предмет и метод статистики. Единая система учета и статистики. Организация статистики в России..............................6

2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ.....................................10

2.1. Этапы статистического исследования. Характеристика статистического наблюдения.........................................................10

2.2. Виды и способы статистического наблюдения.............11

2.3. Организация статистического наблюдения …..............14

2.4. Требования, предъявляемые к информации……..........16

3. СВОДКА И ГРУППИРОВКА ДАННЫХ............................... 18

3.1.Понятие сводки, группировки, классификации.............18

3.2. Ряды распределения, виды и основные

характеристики……………………………………………....20

3.3. Статистические таблицы: элементы и принципы их построения…………………………………………………………...22

3.4. Графическое изображение рядов распределения........23

4. СТАТИСТИЧЕСКИЕ ВЕЛИЧИНЫ..........................................25

4.1. Виды статистических величин.......................................25

4.2. Относительные величины……………………………...25

4.3. Средние величины. Средняя арифметическая: свойства и методы расчета……………………………………………….....27

4.4. Другие виды степенных средних………………............31

4.5. Структурные средние…………………………………..33

5. ПОКАЗАТЕЛИ ВАРИАЦИИ. ИЗМЕНЧИВОСТЬ...................37

5.1. Виды показателей вариации...........................................37

5.2. Свойства и методы расчета дисперсии………………..39

5.3. Дисперсия альтернативного признака………………...41

5.4. Правило сложения дисперсий…………………………41

5.5. Нормальное распределение и его характеристики.......45

5.6. Моменты распределения. Показатели формы распределения………………………………………………………………46

Часть 2 Темы 6-9

6. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ВЗАИМОСВЯЗИ

СОЦИАЛЬНО – ЭКОНОМИЧЕСКИХ ЯВЛЕНИЙ.....................48

6.1. Виды и формы взаимосвязей. Понятие корреля-ционного и регрессионного анализа……………………………..48

6.2. Парная регрессия………………………………….……50

6.3. Множественная (многофакторная) регрессия………...52

6.4. Параметрические методы изучения связи…………….53

6.5. Принятие решений на основе уравнения регрессии.....55

7. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ……………………………..57

7.1. Характеристика выборочного наблюдения………….. 57

7.2. Ошибки выборки………………………………………. 58

7.3. Определение необходимой численности выборки….. 61

7.4. Малая выборка………………………………………….62

8. РЯДЫ ДИНАМИКИ…………………………………………...64

8.1. Виды рядов динамики и их характеристика………….64

8.2. Условия сопоставимости рядов динамики……………65

8.3. Расчет среднего уровня ряда динамики..…………….. 65

8.4. Показатели рядов динамики…………………………...67

8.5. Смыкание рядов динамики……………………….........69

9. ЭКОНОМИЧЕСКИЕ ИНДЕКСЫ..............................................72

9.1. Понятие и виды экономических индексов....................72

9.2. Агрегатные индексы……………………………………73

9.3. Средневзвешенные или средние из индивидуальных индексов…………………………………………………………...75

9.4. Средние индексы………………………………………. 77

9.5. Индексные методы анализа……………………............79

РЕКОМЕНДАТЕЛЬНЫЙ БИБЛИОГРАФИЧЕСКИЙ СПИСОК…81

Введение

 

Любой экономист, менеджер, занимающийся планированием, анализом, регулированием, мотивацией, в том или ином виде экономической деятельности в любом секторе национальной экономики, обязательно будет работать с цифровым материалом. Следовательно, чтобы цифры «заговорили», чтобы их можно было правильно интерпретировать, на основе имеющихся данных получить недостающие показатели, необходимо владеть определенным инструментарием. Поэтому методам сбора, обработки и анализа информации посвящена первая часть курса «Общая теория статистики».

Освоение данного материала, позволит студентам проводить статистические наблюдения, группировать данные, исследовать взаимосвязи между признаками, определять надежность полученных характеристик, рассчитывать динамику показателей и влияние отдельных факторов на общий результат, то есть понимать и разговаривать на языке цифр.

 

СТАТИСТИКА КАК НАУКА

И ЕЁ ИНФОРМАЦИОННАЯ БАЗА


• Возникновение статистики как науки • Предмет и метод

статистики. Единая система учета и статистики.

Организация статистики в России

 

Возникновение статистики как науки

 

Статистику можно рассматривать как:

1. совокупность сведений о состоянии какой-либо социально-экономической сферы, например, статистика уровня жизни, смертности, брака;

2. сферу деятельности людей (проведение переписи, работа комитетов по статистике, заполнение форм статистической отчетности в организациях);

3. науку, поскольку статистика имеет свой предмет и методы исследования.

Первые статистические данные имеют тысячелетнюю историю. Цензы на имущество в древнем Китае, Египте, учет родившихся, земельные кадастры в античном мире – все эти документы свидетельствуют о необходимости сбора и обработки информации на всех этапах развития государства.

Возникновение статистики как науки относят к середине 17 века, когда с развитием капитализма в Европе, наблюдается быстрый рост и процветание страховых компаний. В указанный период страховыми компаниями собирается большой массив информации, для обработки которого требуется специальный инструментарий.

В это же время в Германии в крупных университетах начинают читать курс государствоведения, который нуждается в системе показателей для оценки состояния и развития государства. Как ответ на эти два запроса и возникает наука статистика. Предполагается, что термин «статистика» произошел от латинских слов stato (государство) и status (политическое состояние, положение вещей). Отсюда следует, что статист - это человек, который описывает состояние государства.

Статистика сформировалась как наука на основе двух направлений:

1. политической арифметики в Англии (основатель Уильям Петти (1623-1687));

2. описательной школы в Германии (основатели Герман Конринг (1606-1681) и Готфрид Ахенваль (1719-1772)).[1]

 

СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ


• Этапы статистического исследования. Характеристика статистического наблюдения • Виды и способы статистического наблюдения • Организация статистического наблюдения • Требования,

предъявляемые к информации

 

Требования, предъявляемые к информации

В ходе статистического наблюдения могут возникнуть ошибки. Их можно разделить по характеру возникновения на случайные и систематические; по стадии возникновения на ошибки регистрации и ошибки компьютерной обработки ; по причинам возникновения на ошибки измерения, ошибки выборки, преднамеренные и случайные ошибки.

Случайные ошибки при большом массиве информации, не имеют направленности, взаимопогашаются и не искажают результаты анализа.

Систематические ошибки имеют определенную направленность, приводят к искажению результатов и, как правило, являются преднамеренными. Они могут быть связаны с округлением возраста, занижением доходов, завышением затрат и другими причинами.

Ошибки репрезентативности – ошибки выборочного наблюдения: чем больше объем выборки, тем меньше ошибка. Это связано с тем, что структура выборки может не совпадать со структурой генеральной совокупности, откуда производилась выборка. При сплошном наблюдении ошибка отсутствует.

Величину ошибки можно определить и скорректировать результат на её величину.

Требования, предъявляемые к информации:

1. Достоверность: информация должна правдиво отражать явления и точно рассчитываться.

2. Своевременность.

3. Сопоставимость.

Для получения сопоставимой информации необходима сопоставимость по времени, по единицам наблюдения, по структуре, по границам, по методике и др. факторам.

Для исключения ошибок при сборе и обработке информации используют методы логического и математического контроля. Логический контроль предполагает проверку с помощью взаимосвязанных вопросов, а математический контроль осуществляется сопоставлением суммы по строкам и столбцам.

Контрольные вопросы к теме 2

1. Приведите определение статистического наблюдения.

2. Какие виды не сплошного наблюдения Вы знаете?

3. Что характерно для сплошного наблюдения?

4. Приведите основные принципы проведения выборочного наблюдения.

5. Как организовать механический отбор?

6. Приведите примеры собственно-случайного повторного и бесповторного отбора.

7. Чем субъективное время отличается от объективного времени проведения статистического наблюдения?

8. Какие требования предъявляются к информации?

9. Какие методы контроля информации Вы знаете?

СВОДКА И ГРУППИРОВКА ДАННЫХ


• Понятие сводки, группировки, классификации • Ряды распределения: виды и основные характеристики • Статистические таблицы: элементы и принципы их построения • Графическое изображение рядов распределения

 

Пример 3.1

Рассчитать основные характеристики ряда распределения кредитных организаций РФ по величине уставного капитала (табл. 1). Результаты расчетов представить в табличной форме.

Таблица 1

Группировка действующих кредитных организаций
по величине зарегистрированного уставного капитала

в 2008 году в РФ

Группировка кредитных организаций по уставному капиталу, млн.руб. Число кредит-ных организаций Доля кредитных организаций, % Среднее значение уставного капитала по группе Куму-лята по частоте Куму-лята по час-тости Плотность распределе- ния
до 3 3, 3 1, 5 3, 3 37/(3-0) =12, 33
3 - 10 5, 4 6, 5 8, 6 8, 71
10-30 10, 6 19, 2 6, 00
30-60 14, 2 33, 4 5, 37
60-150 18, 2 51, 6 2, 30
150-300 21, 8 73, 4 1, 65
300-450 26, 6 100, 0 2, 01
    100, 0        

Плотность распределения ( ) используется в группировках с неравными интервалами для обеспечения сопоставимости данных. Определяется как отношение частоты или частости к величине интервала .

 

Их построения

Впервые в истории таблицы были использованы в 1727–1728 гг. русским статистиком И.Кирилловым при описании царствования Петра Первого.

Для табличного способа характерны компактность, наглядность, доступность.

В любой таблице можно выделить подлежащее (о чем говорится в таблице) и сказуемое (что говорится о подлежащем) (табл.2). Если подлежащее включает одну единицу совокупности или перечень единиц, то такая таблица называется простой, если группировку по одному признаку, то – сложной. Если подлежащее или сказуемое содержат группировку по нескольким признакам, то говорят о комбинационной таблице.

Таблица 2

Макет статистической таблицы

Сказуемое   Подлежащее Наименование граф
Наименование строк Итоговый столбец
      Σ
Итоговая строка Σ Σ Σ Σ Σ

Принципы построения таблицы:

1. Таблицы должны быть компактны, т.е. содержать те сведения, которые нужны.

2. Материал должен располагаться таким образом, чтобы при анализе таблицы сущность явления раскрывалась чтением информации слева направо и сверху вниз.

3. Заголовок таблицы должен быть лаконичен, содержать название места, времени, объекта и единицу измерения, если она общая для всей таблицы.

4. Графы и строки номеруются цифрами и буквами соответственно.

5. Информация в пределах строки (столбца) должна приводится с одинаковой степенью точности. Если значение имеет разряд меньший, чем принятая степень точности, то в графе записываются нули заданной степени точности.

6. Если отсутствуют сведения, то в ячейке проставляется многоточие или пишется нет сведения. А если отсутствует само явление, то проставляется прочерк.

7. Если ячейка не заполняется, то ставится крестик – «Х».

8. При переносе таблицы с одной страницы на другую необходимо дублировать «шапку» таблицы и писать «продолжение таблицы».

 

СТАТИСТИЧЕСКИЕ ВЕЛИЧИНЫ


• Виды статистических величин • Относительные величины • Средние величины. Средняя арифметическая: свойства и методы расчета

• Другие виды степенных средних • Структурные средние

Виды статистических величин

 

Все величины в статистике можно разделить на три группы:

- абсолютные;

- относительные;

- средние.

Абсолютные величины – меры веса, пространства, времени, это исходные величины. Их можно разбить на три группы:

- натуральные (м, м2, м3, л, ящики, штуки, ч, т);

- условно – натуральные (тысячи условных банок, человеко-день, пассажиро-километр, тонно-километр);

- денежные (все виды валют).

 

Относительные величины

Относительные величины – расчетные, производные от натуральных. Различают семь видов: структуры, динамики, планового задания, выполнения плана, интенсивности, сравнения, координации.

Относительная величина структуры (ОВС) определяется отношением части и целого. Процентный пункт – разница в процентах разного содержания.

Относительная величина динамики (ОВД) - отношение показателя более позднего периода к одноименному показателю более раннего периода, рассчитанного в сопоставимых условиях.

Относительная величина планового задания (ОВПЗ) - отношение планового показателя более позднего периода к одноименному фактическому показателю более раннего периода.

Относительная величина выполнения плана (ОВВП) - отношение фактического показателя к одноименному плановому показателю одного и того же периода. Выполняется равенство:

Пример 4.1

Рассчитать структуру работников в 2007-2008 гг. (табл. 3).

Таблица 3

Категория работников 2007 г 2008 г
Числен-ность, чел. ОВС Числен-ность, чел. ОВС
Рабочие 70/100·100%=70% 80/120·100%=33%
Служащие 30/100·100%=30% 40/120·100%=67%
Итого: 100% 100%

Пример 4.2

По данным табл. 4 рассчитать относительные величины динамики, выполнения плана и планового задания.

Таблица 4

Показатель 2007г., тыс. руб. 2008 г., тыс. руб. ОВПЗ ОВД ОВВП
план 600/400=1, 5 600/500=1, 2   800/400=2, 0 400/500=0, 8   800/600=1, 3
факт

Относительная величина интенсивности (ОВИ) характеризует плотность распределения признака, например, число людей на единицу площади, производство важнейших видов продукции на душу населения.

Относительная величина сравнения (ОВСр) рассчитывается в виде соотношения двух одноименных показателей, определенных за один и тот же период или на момент времени, но по разным территориям, предприятиям, государствам, например, соотношение Ивановской и Владимирской областей по площади.

Относительная величина координации показывает соотношение двух частей одного целого (соотношение женщин и мужчин, рабочих и служащих).

При построении относительных величин необходимо соблюдать условия сопоставимости этих величин.

Пример 4.4

Рассчитать среднедушевой доход по приведенным данным (табл. 5).

Таблица 5

Группировка работников по доходам Количество человек, Средний доход по группам , руб.
до 5000
5000 - 10000
10000 - 15000
15000 -20000
20000 и выше
Итого:  

Решение: .

 

Пример 4.5

По данным таблицы 6 рассчитать среднедушевой доход методом моментов.

Решение: Для нашего примера h=5000; А=17500

.

Таблица 6

Среднедушевой доход Количество человек, f
до 5000 – 3 – 30
5000 - 10000 – 2 – 40
10000 - 15000 – 25
15000 - 20000
20000 и выше
Итого - -

 

Пример 4.6

Определить среднюю цену реализации товара по данным трех торговых точек (табл.7):

Таблица 7

Торговая точка Цена, руб. Выручка, тыс. руб.

Решение: , где В – выручка, Ц – цена единицы продукции.

 

При рассчитывается средняя геометрическая

- используется в рядах динамики при расчете среднего темпа роста.

При рассчитывается средняя квадратическая

.

При рассчитывается средняя кубическая:

.

Средняя квадратическая и средняя кубическая используются для расчета моментов 2–ого и 3–его порядка.

Свойство мажорантности (ранжирование степенных средних): чем больше степень, тем больше средняя.

 

 

 

Структурные средние

К структурным средним относят моду, медиану, квартиль, дециль, перцентиль.

Мода – наиболее часто встречающееся значение признака, которое используют для оценки спроса на продукцию, то есть

мода это варианта, соответствующая максимальной частоте.

Если для определения моды для дискретного признака не требуется никаких расчетов, то для определения моды в интервальном ряду необходимо:

1.Определить модальный интервал по максимальной частоте.

2. Рассчитать значение моды по формуле:

,

где – модальный интервал;

– нижняя граница модального интервала;

– величина модального интервала;

– частоты модального интервала, предшествующего модальному и следующего за модальным соответственно.

Пример 4.7

Рассчитать значение моды по приведенной группировке (табл.8):

Таблица 8

Среднедушевой доход Количество человек Кумулята
до 5000
5000 – 10000
10000 – 15000
15000 – 20000
20000 и более

Для данного примера значение моды .

Графически определить моду можно в соответствии с рис. 3.

Рис. 3. Гистограмма и полигон.

Графическое определение моды на основании гистограммы

Медиана – значение признака, соответствующее середине ранжированного ряда. Используется для характеристики ряда распределения при сильной дифференциации признака.

Номер медианного представителя дискретного ряда определяется по формуле: , если число членов ряда распределения нечетное. Если ряд включает четное число членов, то в середине находятся две единицы наблюдения, и значение медианы рассчитывается как средняя арифметическая их значений.

Пример 4.8

Определить медианный размер обуви по данным табл.9.

Таблица 9

Размер обуви
Количество пар
Кумулята

Решение: пара соответствует 38 размеру обуви, так как 22 > 17.

Медиана интервального ряда определяется в два этапа:

1.Находится медианный интервал по полусумме частот и кумуляте. Кумулята медианного интервала впервые превышает полусумму частот.

2. Рассчитывается значение медианы по формуле

, где – нижняя граница медианного интервала; – величина медианного интервала; – кумулята интервала, предшествующего медианному; – частота медианного интервала.

Медиана показывает, до какого предела значения признака имеет 50% представителей.

Квартили, децили, перцентили рассчитываются по аналогии с медианой и характеризуют, соответственно, до какого предела значения признака имеет 25%, 10%, 1% представителей.

Для примера 4.7: .

Графически определить медиану можно в соответствии с рис. 4.

Рис. 4. Кумулята. Графическое определение медианы

на основании кумуляты

 

В примере 4.7 значения , и говорят о том, что среднедушевой доход работников составляет 13500 рублей, у 50% работников доход не превышает 14000 рублей, чаще всего встречаются работники с уровнем дохода 16250 рублей.

Контрольные вопросы к теме 4

1. Приведите пример условно-натуральной величины.

2. Перечислите все относительные величины.

3. Перечислите степенные средние в порядке возрастания их значения.

4. Какие Вы знаете структурные средние?

5. Приведите определение медианы.

6. Какое значение признака называется модальным?

 

 

Виды показателей вариации

Показатели вариации характеризуют величину отклонений всех значений признака от среднего уровня, т.е. характеризуют однородность совокупностей. Если совокупность признака однородна, то средняя, рассчитанная по данной совокупности будет надежна, типична. Если отклонения значительные, то совокупность неоднородна, а рассчитанная средняя - случайна.

Пример 5.1

Один и тот же уровень потребления мяса и мясопродуктов можно получить с помощью распределения уровня потребления указанных продуктов населением или (табл. 10). Но, если в первом распределении 70% населения потребляют от 40 до 60 кг мясопродуктов, то во втором распределении – лишь 11%. Поэтому доверие к средней в первом распределении будет выше, чем во втором

Таблица 10

 
20 – 40 кг
40 – 60 кг
60 – 80 кг
80 – 100 кг
Итого: 100% 100%

Оценить степень доверия к средней, ее надежность позволяют показатели вариации, к которым относят: размах вариации (R), среднее линейное отклонение (d), дисперсию (σ 2), среднее квадратическое отклонение (σ ), коэффициент вариации (v).

R размах вариации, показывает амплитуду колебаний признака от минимума до минимума, но не дает распределения признака между ними.

.

d среднее линейное отклонение характеризует среднее отклонение по модулю индивидуальных значений признака от среднего уровня.

.

σ 2 дисперсия, не имеет экономического смысла и, соответственно, единиц измерения. Используется для определения среднего квадратического отклонения

σ среднее квадратическое отклонение, имеет ту же размерность, что и средняя величина.

.

Поскольку, в соответствии со свойством средней, сумма отклонений всех вариант от средней всегда равна нулю, для расчета средней используют либо среднее линейное отклонение (d), либо среднее квадратическое отклонение σ. В силу различий способов расчета σ > d.

Относительной мерой вариации служит коэффициент вариации

Для экономических расчетов средняя считается надежной, типичной, а исследуемая совокупность однородной, если коэффициент вариации не превышает 33, 3%. В случае превышения данной величины можно говорить о случайности средней характеристики и неоднородности исходных данных. Для повышения надежности рекомендуется исключить экстремальные значения, если они носят случайный характер и увеличить объем выборки.

 

Пример 5.2

Оценить надежность средней кг длягруппировки населения по мясопотреблению (табл.11).

Таблица 11

Объем потребления мяса
20–40 кг –1 –10
40–60 кг
60–80 кг
80–100 кг
Итого:      

Решение: ,

, ,

Вывод: средняя надежна и типична для данной группировки.

Правило сложения дисперсий

Если совокупность разбить на группы, то средние величины и дисперсию можно рассчитать как для всей совокупности, так и для каждой группы.

Различают среднюю из групповых, межгрупповую и общую дисперсии. Общая дисперсия отражает влияние всех возможных факторов. Внутригрупповая дисперсия отражает влияние всех факторов, кроме группировочного признака. Средняя из групповых аналогична внутригрупповым дисперсиям. Межгрупповая дисперсия характеризует влияние только группировочного признака.

В соответствии с правилом сложения дисперсии: общая дисперсия равна сумме средней из групповых и межгрупповой дисперсии.

,

где – средняя из групповых дисперсий,

– межгрупповая дисперсия

Средняя из групповых дисперсий определяется по формуле:

.

Межгрупповая дисперсия определяется по формуле:

.

Пример 5.3

Проверим правило сложения дисперсий на примере группировки рабочих по уровню квалификации (табл.12).

Решение

Рассчитаем групповые средние:

,

 

Таблица 12

Рабочие 5–ого разряда Рабочие 6–ого разряда
№ п\п Количество деталей № п\п Количество деталей
- - -
- - -

Определим групповые дисперсии методом разности:

Рассчитаем межгрупповую дисперсию:

Общая дисперсия равна

, что подтверждает правило сложения дисперсий.

Для оценки влияния группировочного признака (уровень квалификации) используют показатели, построенные на соотношении межгрупповой и общей дисперсии: эмпирический коэффициент детерминации ( ) и эмпирическое корреляционное отношение ( ).

Эмпирический коэффициент детерминации ( ) рассчитывается по формуле и показывает, какой процент общей вариации изучаемого признака определяется вариацией группировочного признака.

Для рассматриваемого примера , т.е. вариация выработки рабочих на 21, 7% определяется вариацией уровня их квалификации.

Эмпирическое корреляционное отношение ( ) характеризует тесноту связи между признаками и рассчитывается по формуле . Связь отсутствует, если , связь функциональная, если

Сила связи определяется в соответствии со шкалой Чеддока, которая представлена в таблице 12.

Таблица 12

Шкала Чеддока для определения силы связи

η   Сила связи  
0, 1-0, 3 слабая
0, 3-0, 5 умеренная
0, 5-0, 7 заметная
0, 7-0, 9 высокая
0, 9-0, 99 очень высокая

В рассматриваемом примере связь выработки рабочих с уровнем квалификации умеренная, так как .

 

Моменты распределения.

Виды и формы взаимосвязей.

Парная регрессия

Парная регрессия отражает связь между двумя признаками – результативным и факторным. Аналитически эту связь можно представить уравнениями

- прямая,

- гипербола,

- парабола.


Поделиться:



Последнее изменение этой страницы: 2017-03-15; Просмотров: 42; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.157 с.)
Главная | Случайная страница | Обратная связь