Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Характеристика статистических исследований



CТАТИСТИКА

 

Термин статистика имеет несколько различных смыслов:

  1. Под статистикой понимают планомерный систематический учет массовых общественных явлений, который осуществляется статистическими организациями.
  2. Статистика - статистические данные, которые публикуются в статистических сборниках, а также в периодической печати.
  3. Наука.

Статистика - общественная наука, но имеющая мощный математический аппарат. Включает массовые общественные явления и складывающиеся в них количественные закономерности. Все явления общественной жизни имеют количественные определения, следовательно, в каждый момент времени эти явления имеют определенные количественные характеристики, и между ними существуют определенные соотношения. Характеристики непрерывно меняются, меняются и соотношения.

Пример: в нашей стране меняется численность населения, его структура. Изменяется производство различных товаров, соотношение между ними, изменяется численность работающих. Эта количественная сторона массовых общественных явлений является предметом изучения статистической науки. Она исследует количество не само по себе, а в связи с его качественным содержанием.

Учитывая сказанное выше можно заключить, что статистика – наука, изучающая количественную сторону массовых общественных явлений, неразрывные связи с их качественной стороной, то есть количественное выражение закономерностей общественного развития.

Статистические исследования – выявление закономерностей в отдельных массовых явлениях. Оно состоит из нескольких основных этапов:

- статистическое наблюдение – сбор статистических данных, во время которых накапливается статистическая информация – планомерная регистрация существенных признаков статистической совокупности;

- сводка статистических данных. Собранные данные подвергаются систематизации и группировке. Важным методом, который используется на этой стадии является метод статистической группировки, с его помощью выделяют однородные совокупности, разделяют на группы и подгруппы и тем самым дают обобщающую характеристику изучаемого объекта.

- анализ и обобщение статистических данных. Цель – обнаружение закономерностей в изучаемом явлении. На этой стадии используются все статистические элементы. В результате анализа делаются выводы по состоянию изучаемого явления и о закономерностях его равития. Выводы и сам анализ излагаются текстами и сопровождаются графиками и таблицами.

История статистики

Статистика родилась одновременно в нескольких цивилизациях: Китай, Египет. Толчком для ее развития послужила необходимость учета материальных и людских ресурсов при ведении войн, а также для упорядочения налогообложения. Статистика получила развитие для составления земельных ходатайств.

В древнем Риме статистика использовалась по всем направлениям. Были опыты по переписи населения. Статистика носила в основном описательный характер, в таком виде существовала до 17 века. В 17 веке в Германии, Англии ученым, которые занимались статистикой, пришла мысль об ее использовании для экономических явлений – для составления макроэкономического баланса.

С помощью статистики была предпринята попытка ведения стоимостных оценок, с помощью средних затрат на производство товаров и изделий.(теория национальных счетов). Автор теории национальных счетов Кемси разработал, которая с небольшими изменениями используется в настоящее время для измерения макроэкономического баланса.

В конце 19 века в России тоже развивалась статистическая наука. С этого времени в России для анализа экономики используется теория расширенного математического баланса. В макроэкономический баланс включена только сфера материального производства. Все это существовало до 94 года. А затем наша статистика перешла на теорию национальных счетов.

Статистика в нашей стране получила мощное развитие с начала прошлого века и особый толчок после революции. Статистические исследования вели с помощью статистических органов.

Во главе стояло ЦСУ. С помощью ЦСУ и его деления на местах ведется слежение за состоянием общественно-экономических явлений.

В настоящее время ЦСУ преобразовалось в Государственный Комитет Статистики.

 

Язык статистики

При изучении массовых явлений статистика использует специфические понятия:

1) признак;

2) вариация;

3) статистическая совокупность;

4) показатель;

5) система показателей.

Признаком статистики называется свойство, характеризующее черту, или иную особенность, которые могут быть наблюдаемы извне (возраст, вес, рост).

Признаки условно делятся на количественные и качественные. Под количественными понимают такие признаки, отдельные значения которых отличны друг от друга по величине, количественные признаки выражаются числом.

Качественные – это такие, которые отличаются существенным моментом (пример: специальность отличается характером труда). Качественные признаки называются так же атрибутированными. Если качественные признаки могут принимать только одно из двух противоположных значений их называют альтернативные (хороший, плохой).

Признаки могут быть разделены на основные (существенные) и второстепенные. Основные определяются главным содержанием явления. Второстепенные не связаны с внутренним содержанием явления, они дают добавочные. Признаки можно разделить на первичные, полученные при сборе статистических данных и вторичные, которые получают при обработке.

Признаки можно разделить на постоянные и варьирующие. Постоянные признаки имеют неизменные значения у всех единиц в совокупности. Варьирующие могут принимать различные значения у отдельных единиц.

В статистике изучению подвергаются только варьирующие признаки.

Вариация – колебленность многообразий, изменяемость величины признака у отдельных единиц.

Вариация альтернативного признака у отдельных явлений имеет лишь одно значение. Пределы, в которых возможны различные величины количественных варьирований признаков совокупности, называются границами вариации. Граница имеет нижнее и верхнее значение. Отдельные значения признаков называются вариантами, они могут принимать любые значения внутри границы вариации.

Статистическая совокупность – множество объектов или явлений, которые имеют один или несколько общих признаков и различаются между собой. Отдельные объекты называются единицами статистической совокупности. Статистическая совокупность называется однородной, если самые существенные признаки для каждой ее единицы являются в основном одинаковыми и разнородной, если она объединяет разные типы явлений.

Состав статистической совокупности может быть неизменен в течении времени, а может меняться. В первом случае такая совокупность называется стабильной, во втором – динамичной.

Показатель – одно из основных понятий статистики – обобщающая количественная характеристика изучаемого явления в его качественном определении в условиях конкретного времени и места.

Совокупность показателей всесторонне отображает развитие общества, образуя систему показателей. Сводные экономические показатели, относящиеся к сложным комплексным экономическим явлениям, называются синтетическими показателями (ВВП).

Для описания свойств структуры из динамики недостаточно пользоваться одним показателем, необходимо пользоваться системой взаимосвязанных показателей. Система показателей должна быть построена с учетом следующих особенностей.

  1. Система показателей должна соответствовать системе показателей плана экономического и социального развития.
  2. Плановые и статистические показатели должны выражать одни и те же стороны и явления, иметь одинаковый смысл и одинаково вычисляться.
  3. Система статистических показателей должна быть шире плановой, так как с ее помощью выявляются причины отклонения от хода выполнения плана и изучаются явления непосредственно непланируемые.
  4. Система статистических показателей должна характеризовать ресурсы общества и их использование, скрывать взаимосвязь и соотношение между отдельными частями.

Главным обобщением статистических исследований любых массовых явлений является закон больших чисел: единичное явление рассматривается как одно из явлений данного ряда, содержащего элемент случайного, однако при объединении отдельных явлений в общие в характеристиках всей массы случайные исчезают в тем большей мере, чем в большей мере объединяются единичные.

Статистическая закономерность – закономерность, которая выделяется в большой массе явлений через преодоление случайных свойств единичного явления.

 

Статистические таблицы

Результаты сводки могут излагаться в таблице, так как это наиболее рационально. В таблице наглядно проявляется связь между признаками изучаемых явлений.

Впервые табличную форму изложил предложил в 1727 году статист Кириллов.

Характеризуемые в таблице показатели объединены общим заголовком. Если в статистической таблице изъять все слова и цифры, то останется скелет:

вертикальный столбец – графы;

горизонтальный – столбцы.

Если записать заголовки графами и строками, то это макет таблицы. Макет соответствует плану группировки.

Статистическая таблица имеет подлежащее и сказуемое. Подлежащее показывает о чем идет речь в таблице. Обычно располагается в крайнем левом столбце.

Средние величины

Статистическое среднее в абстрактной форме выражения качественно определяет свойство явлений. В средних наиболее важной особенностью является то, что в ней взаимопогашаются и уничтожаются индивидуальные отклонения.

Средние величины связаны с двумя законами:

  1. Закон внутреннего развития явления;
  2. Закон больших чисел.

1. В среднем отражаются внутренние закономерности развития явления и способствующие выявлению установки этого закона.

2.Связь состоит в том, что по мере увеличения совокупности в средних расчеты для данной совокупности все в большей мере осуществляют гашение случайных отклонений.

 

Ряды динамики

Общественные явления, изучаемые статистикой, изменяются во времени, меняется их объём, уровень и структура.

Исходной базой решения этой задачи служат ряды динамики, количественные характеристики изменения общественных явлений по времени. Их иногда называют хронологическими или временными.

Главным условием построения рядов динамики является использование сопоставления данных, должны использоваться одинаковые способы.

Ряды динамики могут состоять, как из абсолютных суммарных величин, так из относительных и средних величин.

 

Пример: рост ВВП по времени.

100% 45% 40% 35% 65% 70% 72% 73% 74%

 

Ряды динамики могут быть интервальными и моментными.

Интервальные выражают моментный, если составляющие его числа выражают размеры какого-либо признака на определенные даты.

Ряд динамики средних величин называют рядом цифровых данных, характеризующих изменение средних размеров признака явления по времени.

 

Основные показатели рядов динамики.

 

Основные показатели ряда

Для конечной оценки динамики явления используют следующие статические показатели:

- абсолютный прирост;

- темп роста;

- темп прироста;

- темп наращивания.

В основе расчета данных показателей лежит сравнение уровня рядов динамики.

Уровень ряда
Временной показатель

Под уровнем мы понимаем числовой показатель.

В зависимости от способа сопоставления показатели динамики могут вычисляться на постоянной и переменной базе сравнения. При расчете на постоянный базе сравниваемый уровень сопоставляется с одним и тем же базисным уровнем. Вычисленный при этом показатель называется базисным. Для расчета показателя на переменной базе каждый последующий уровень сравнивается с предыдущим. Вычисленный при этом показатель называется цепным.

Главнейшим статистическим показателем является абсолютный прирост. Он рассчитывается, как разность двух уровней ряда.

– абсолютный прирост базисный,

,

– цепной абсолютный прирост.

Знак y численного значения может быть любой. Между базисными и цепными абсолютными приростами существует связь: сумма цепных абсолютных приростов равна абсолютному приросту последнего периода ряда динамики (базисному).

Темп роста сравнивает два уровня ряда, величина безразмерная.

Для цепного темпа роста:

Если Т> 1, то это свидетельствует об увеличении явления, наоборот о снижении.

Темп прироста – отношение абсолютного прироста к уровню.

Между Тр и Тn существует взаимосвязь:

Темп наращивания. Он измеряет наращивания по времени экономического потенциала. Вычисляется с помощью деления цепных абсолютных приростов на базу сравнения:

Существует средний показатель.

 

Индексы

Индексы используют при решении задач, в которых рассчитываются относительные изменения в однородных или сложных совокупностях. Индекс – латинское слово. Означает указатель или показатель.

В чем специфика индексов?

1. Индексы позволяют измерить изменения сложных явлений ( изменение затрат на транспорт в целом по городу за год).

2. Индексы позволяют проанализировать изменения, выявить роль отдельных факторов (можно выяснить, как изменилась выручка городского транспорта за счет изменения численности пассажиров, за счет изменения тарифов, за счет изменения соотношения в объеме перевозок различными видами транспорта).

3. Индексы являются показателем сравнения не только с прошлым периодом (по времени), но и с другой территорией (сравнение в пространстве), а также с нормативами.

Индекс – показатель сравнения двух состояний одного и того же явления.

Явления могут быть простыми, сложными или состоять из соизмеряемых и несоизмеряемых явлений.

Несоизмеряемые - молоко, яйца, масло.

Различают индексы индивидуальные и общие, агрегатные.

Индивидуальные используются для однородных совокупностей (масло), агрегатные – для разнородных (молоко, яйца, масло).

Индекс – это есть отношение индексируемой величины к базе сравнения.

,

где – отчетный период;

– базисный период;

– индивидуальный базис цен.

Количественный индекс:

.

Поскольку при анализе изменения однородных совокупностей отдельные элементы имеют разные единичные измерения, то для объединения их в совокупности необходимо иметь общие свойства (признаки элементов). В качестве таких общих свойств, например, при анализе товарооборота могут выступать стоимостные оценки данных элементов в денежном выражении. Поэтому при построении общих индексов, использующихся для анализа изменения разнородных совокупностей в качестве индексируемой величины и базы сравнения используются величина товарооборота в денежном выражении (выручка).

 

Товар Цена за Кол-во
Молоко (л) P1 (за л) q1, (л)
Яйца (шт) P2 (за шт) q2, (шт)
Масло (л) P3 (за кг) q3, (кг)

 

*) при индексации цен и количеств используется два индекса. Первый назначает период отчетный или базисный, второй означает номер того или иного товара.

Агрегатный индекс Ip показывает, во сколько раз изменилась цена в отчетном периоде по сравнению с базисным в среднем по данной совокупности товара.

В агрегатном индексе цен индексируемой величины выступает цена, так как данный индекс выявляет изменение именно фактора цен. Объем товара выступает в этом индексе в качестве соизмерителя (веса). Поэтому в числителе мы получим величину денежного товарооборота в отчетном периоде в количествах базиса. В знаменателе величину товарооборота в базисно периоде. В качестве весоизмерителя используют физические объемы базисного периода (Ласпейресс, 1864 г.).

Агрегатный индекс цен можно образовать по-другому: использовать в качестве весоизмерителя физический объем отчетного периода.

- Пааше.

По аналогии с агрегатным индексом цен можно оценить изменение фактора объема в целом по совокупности.

В качестве индексируемой величины выступает объем, в качестве соизмерителя выступает цена в отчетный период.

Индекс физического объема показывает, во сколько раз в среднем по данной совокупности изменился физический объем проданного товара в отчетный период по сравнению с базисным.

Агрегатный индекс товарооборота: .

В числителе выручка за отчетный период, в знаменателе – за базисный.

Индекс показывает изменение товарооборота за отчетный период по сравнению с базисным.

Между индексами цен физического объема и товарооборота существует взаимосвязь.

Для того, чтобы эта взаимосвязь выполнялась, необходимо в индексе цен и товарообороте соизмерители поддерживать на разных уровнях. Если в индексе цен физический объем поддерживать на базисном уровне, то для выполнения равенства в индексе физического объема цены необходимо поддерживать на отчетном уровне.

С помощью агрегатного индекса можно кроме очевидных решать еще несколько задач. Например, если в индексе цен от числителя отнять знаменатель, то можно получить экономию за счет фактора цены:

.

Если в индексе физического объема от числителя отнять знаменатель, то можно подсчитать экономию за счет фактора в отчетном периоде по сравнению с базисным.

Если в мн-ся товарооборота от числителя отнять знаменатель, то можно подсчитать экономию в отчетном периоде по сравнению с базисным.

, , .

 

Средние индексы

В розничной сети при реализации товаров учет ведется в стоимостном (денежном) выражении. Достаточно часто нет достоверных сведений по конкретному объему продаваемых товаров. Поэтому при анализе товарооборота агрегатную формулу общих индексов использовать затруднительно, т.к. нет сведений об объеме. Поэтому для расчета сводных обобщающих показателей изменения розничных цен используется средняя гармоническая форма общего индекса цен.

,

- выручка отчетного периода;

– индивидуальный индекс цен.

Данная форма индекса используется в том случае, если нет сведений о количестве продаваемых товаров, по известным индексам индексы цен по каждому товару, а также выручка.

В качестве соизмерителя в данном индексе выступает товарооборот в отчетном периоде, в результате формула напоминает формулу для расчета средней гармонической.

 

Выборочные наблюдения

Сплошное наблюдение единиц совокупности не всегда бывает целесообразным, так как дорого, возможные ошибки искажают общую картину, чем больше единиц совокупности, тем больше вероятность ошибки. Более целесообразным является выборочное наблюдение. При выборке наблюдению подвергаются только отдельные единицы совокупности. Выборка делается т.о., чтобы выбранная единица отражала структуру совокупности. При этом результаты выборки, если она осуществлена по всем правилам, могут дать точную картину всей совокупности. Генеральная совокупность может быть реальной, а может быть гипотетической (возможны экспериментальные наблюдения). В соответствии с каждым из этих совок. Оценив различ. Параметрами:

Генеральная совокупность Выборочная совокупность
N n
µ
σ S
π p

 

 

Ошибки выборки

Отклонение выборочной средней от генеральной средней:

Нормированное отклонение t устанавливает по таблице значение интеграла вероятности. Обычно задается определенный уровень вероятности суждения о точности данной выборки. Вероятность, которая принимается при расчете ошибки, называется доверительной. Чаще всего принимаются следующие стандарты доверительной вероятности: 0, 95; 0, 954; 0, 997; 0, 999.

Доверительный уровень вероятности 0, 95 означает, что только в 5 случаях из 100 ошибка может выйти за установленные границы.

Чтобы вычислить ошибку в выборке при принятой доверительной вероятности, нужно рассчитать величину средней ошибки . Однако реально может быть определена только выборочная дисперсия, о генеральной мы, как правило, ничего не знаем. В математике доказано, что генеральная и выборочная дисперсии связаны между собой соотношением:

Если n велико, тогда , поэтому выборочную дисперсию S можно взять в качестве оценки генеральной дисперсии и подставить её в формулу средней ошибки:

 

Малая выборка

Таблица интеграла вероятности используется для выборок , если n< 100, то возникает несоответствие интегрируемых табличных значений. При n≤ 30 погрешность становится значительной. Несоответствие вызывается главным образом характером распределения границ генеральной совокупности. При большом объеме выборки особенности распределения генеральной совокупности не имеют значения, т.к. распределение отклонения выборочных показателей от генеральной характеристики при большой выборке всегда остается нормальным.

В малых выборках характер распределения генеральной совокупности сказывается на распределении ошибок выборки. Поэтому для расчета ошибок выборки при небольшом объеме наблюдений отбор должен проводиться из совокупности имеющихся нормальных распределений.

Госсет (Стьюдент) 1908г.-теорема малых выборок, построено специальное распределение, которое позволило при малых выборках соотносить t и f(t) (нормировать разность и плотность вероятности). Если n> 100, то таблица распределения Стьюдента совпадает с распределением Лапласа. Но когда 30< n< 100 различия между ними незначительны. Поэтому их используют при малых выборках и тогда различия очень значительны.

Плотность вероятности распределения Стьюдента расписывается следующим образом:

,

t-нормированная разность;

n-объем выборки;

Вm-величина, зависящая от n.

Распределение Стьюдента публикуется в двух вариантах:

  1. Аналогично таблице интегрирования вероятности. Значение t и f(t) в зависимости от числа степеней свободы (df).

Значение t приводится для наиболее употребляемых доверительных вероятностей 0, 9; 0, 95; 0, 99 или для соответствующих им уровням значимости d=1-f(t) при разном числе степеней свободы.

При малых выборках расчет средней возможной ошибки основан на выборочных дисперсиях:

Эта формула используется для определения возможности ошибки выборочных показателей.

Группировки

Группировкой называется распределение единиц по группам в соответствии со следующим принципом: различия между единицами, отнесенными к одной группе, должны быть меньше чем между единицами, отнесенными к разным группам.

Группировка является обязательным этапом при обработке статистической информации. На основе группировки рассчитывается сводные показания по группам. В результате появляется возможность для их сравнения, таким образом, значение группировки состоит в том, что этот метод обеспечивает обобщение данных, то есть представляет их в компактном виде. Для решения задач группировки существует правило отнесения единиц к той или иной группе.

1. –определяют те характеристики (признаки), по которым проводится группировка.

2. –устанавливают значение группировочных признаков, по которым одна группировка будет отделяться от другой, тем самым определяют группировочный интервал.

Группировка называется монотетической (простой), если для ее построения используется один группировочный признак.

Если группировка осуществляется по нескольким признакам, то она называется сложной или политетической.

Обычно политетическая группировка проводится как комбинационная, т.е. группа выделенная по одному признаку подразделяется на подгруппы по другому признаку (таблица по трудоспособному населению Самарской области)

Недостаток политетической комбинационной группировки состоит в том, что комбинация признаков приводит к сильному дроблению совокупностей (большое число подгрупп). В этом случае если общее число единиц в совокупности невелико, то в какой-то из подгрупп может вообще не оказаться никакой.

Поэтому комбинационная группировка используется при большом числе единиц статистической совокупности.

Интервалы группировочных признаков делятся на открытые и закрытые. В закрытых интервалах указывается верхняя и нижняя граница, в случае если указывается либо верхняя, либо нижняя граница, то интервал называется открытый.

Закрытые интервалы делятся на равные и неравные.

 

, если интервалы равны

Неравные интервалы могут определяться как равнорасположенные. В этом случае вся совокупность делится на группы равного объема ( с одинаковым количеством единиц).

Данные ранжируются в порядке возрастание, отыскивается число единиц, составляющее первую группу, вторую и т.д. Таким образом, граница интервала будет соответствовать фактическим значениям признаков в каждой группе.

Бывает так, что число групп заранее не известно. В этом случае его определяют опытным путем на основе перебора вариантов группировки.

В результате перебора выбирается такой вариант, при котором наилучшим образом выделяется различие между группами. Если группировочный признак не количественный или имеет не много значений, то группировка данных осуществляется путем подсчета единиц с данными значениями признака.

Например.

Группировка заводов по числу производства видов станков.

Число типов станков 5 и более
Число заводов

 

Виды группировок.

Группировка осуществляется с целью установления статистической связи и закономерности, описания объекта, а также выявления структурного изучения совокупности. Различия в целевом назначении группировки выражаются в существующей классификации.

В отечественной статистике различают следующие типы группировок:

- типологические;

- структурные;

- аналитические.

Типологическая группировка служит для выделения социально-экономических типов. Обычно эксперты определяют, какие типы могут встретиться в изучении совокупности. Поэтому типологическая группировка включает в себя следующие действия:

1. называются те типы явлений, которые должны быть выделены из данной совокупности

2. выбираются группировочные признаки, формирующие описание типов

3. устанавливаются границы интервалов

4. группировка оформляется в виде таблицы, т.е. выделяются группы на основе комбинирования группировочных признаков, объединенные в количественные типы, и определяется численность каждого из них.

 

Этот метод специализации интервалов позволяет избавляться от чрезмерного дробления совокупностей. Главный его недостаток – он слишком субъективен: эксперт определяет, какие типы должны быть выделены, но какими должны быть границы интервалов.

Второй недостаток – число группировочных признаков ограничивается двумя или тремя, однако если имеется хорошая теория, то этот метод дает хорошо интерпретированный результат.

Правильность проведенной типологической группировки требует контроля. С этой целью рассчитывают сводные показатели по группам: средние или относительные показатели с целью выявления статистических значений разницы между группами либо по критерию Стьюдента либо по критерию Фишера.

 

Структурная группировка

Она характеризует структуру совокупности по какому – либо одному признаку. Как правило, она используется для описания однородной совокупности, поэтому для нее характерны закрытые, равные интервалы.

Структурная группировка позволяет изучить интенсивные вариации группировочного типа. На основе структурной группировки можно изучить динамику структуры совокупности, если взять структуру в базисном периоде и в отчетном, путем сопоставления этих структур можно численно оценить структуру сдвигов, т.е. сравнивая численности единиц в каждой группе в базисном и отчетном периодах, можно оценить в целом изменение структуры.

Вариационный ряд является типичным примером структурной группировки.

Показываем структуру данной совокупности.

 

Распределение ВВП

 

Аналитическая группировка

Характеризует взаимосвязь между двумя и более признаками, один из которых рассматривается как результат, а другие как факты. Факторов, влияющих на результат, может быть от одного до нескольких.

Наиболее мощным способом проведения аналитической группировки является корреляционно – регрессионный анализ (КРА). С его помощью можно выразить связь между результативным и факторными признаками, в виде аналитической зависимости.

 

Тесноту связи между результативными и факторными признаками можно оценить либо с помощью эмпирической корреляционной относительности, либо с помощью коэффициента детерминации.

Далее по лабораторной работе.

 

Недостатком КРА является сильное дробление всех данных на мелкие совокупности. Если общее число данных не велико, то может получиться так, что в каждой группе может оказаться малое число наблюдаемых единиц. В результате снижается надежность наших суждений. Сохранить сложность описания групп и вместе с тем преодолеть недостатки, вызванные дроблением групп на отдельные совокупности, можно с помощью многомерной группировки.

Цель: классификация данных, т.е. осуществление группировки на основе множества признаков.

Это может встретиться в следующих реальных задачах:

выделение и изучение типов людей по степени их принадлежности к определенным специальностям;

диагностика болезни на основании множества объективных симптомов.

Наиболее простым вариантом многомерной классификации является группировка на основе многомерных средних.

Многомерной средней называется средняя величина нескольких признаков для одной единицы совокупности. Т.к. признаки могут быть разнокачественными, т.е. изменяться в разных физических единицах, то поэтому нельзя рассчитать среднюю величину по абсолютному значению разных признаков.

С этой целью многомерная средняя величина вычисляется из относительных величин, чаще всего из отношений абсолютных значений признаков для единицы совокупности к среднему значению этих признаков.

 

многомерное среднее для j единицы.

 

- значение признака j для i-ой единицы

- среднее значение для признака

K – число признаков

j – номер признака, о котором идет речь

i – номер единицы совокупности

 

Более обоснованным методом многомерных классификаций является кластерный анализ.

Claster – множество

Как и всякое множество в отличие от математического множества в кластере всегда есть хотя бы один элемент. Каждая в единицу совокупности рассматривается как точка в заданном признаковом пространстве. Каждый признак это ось координат, это будет k-мерное пространство по количеству признаков k.

Признаковое пространство - область варьирования всех признаков совокупности.

Если уподобить признаковое пространство обычному эвклидову (трехмерному), то мы получим возможность измерять “расстояния” между функциями признаков пространств. Эти расстояния называются эвклидовыми, их вычисляют по тем же правилам, что и в обычной геометрии.

В многомерных пространствах расстояние между точками p и q с k – координатами

 

 

Совершенно очевидно, что нельзя суммировать квадраты отклонений относительно точек.

Поэтому необходимо сначала выразить различия между единицами совокупности по каждому признаку в каком-то безразмерном показателе. В качестве такого показателя чаще всего используется нормированная разность.

 

 

- абсолютная разность значений j-го признака

- СКО для признака

 


Поделиться:



Популярное:

  1. I. 46. Маркетинг в АПК, организация марк. исследований.
  2. Анализ результатов статистических компьютерных расчетов
  3. Аппараты для электрофизиологических исследований.
  4. Барьеры на пути исследований.
  5. Виды маркетинговых исследований
  6. Виды статистических группировок
  7. Виды статистических группировок, их познавательная роль и аналитические возможности.
  8. Виды статистических показателей.
  9. Виды статистического наблюдения. Способы собирание статистических сведений.
  10. Виды статистического наблюдения. Способы собирания статистических сведений
  11. ВОПРОС 2. Структура и состав современного культурологического знания. Теоретическая и прикладная культурология. Методы культурологических исследований.
  12. Вопрос 40. Использование индексов в экономико-статистических расчетах. Индекс потребительских цен. Индекс цен производителей промышленной продукции.


Последнее изменение этой страницы: 2016-08-24; Просмотров: 868; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.157 с.)
Главная | Случайная страница | Обратная связь