Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Распределение финансовых ресурсов в экономике России



 

 

Структурная группировка устанавливает соотношение между совокупностями как целого и отдельно ее частей.

 

Распределение ВВП

 

Аналитическая группировка

Характеризует взаимосвязь между двумя и более признаками, один из которых рассматривается как результат, а другие как факты. Факторов, влияющих на результат, может быть от одного до нескольких.

Наиболее мощным способом проведения аналитической группировки является корреляционно – регрессионный анализ (КРА). С его помощью можно выразить связь между результативным и факторными признаками, в виде аналитической зависимости.

 

Тесноту связи между результативными и факторными признаками можно оценить либо с помощью эмпирической корреляционной относительности, либо с помощью коэффициента детерминации.

Далее по лабораторной работе.

 

Недостатком КРА является сильное дробление всех данных на мелкие совокупности. Если общее число данных не велико, то может получиться так, что в каждой группе может оказаться малое число наблюдаемых единиц. В результате снижается надежность наших суждений. Сохранить сложность описания групп и вместе с тем преодолеть недостатки, вызванные дроблением групп на отдельные совокупности, можно с помощью многомерной группировки.

Цель: классификация данных, т.е. осуществление группировки на основе множества признаков.

Это может встретиться в следующих реальных задачах:

выделение и изучение типов людей по степени их принадлежности к определенным специальностям;

диагностика болезни на основании множества объективных симптомов.

Наиболее простым вариантом многомерной классификации является группировка на основе многомерных средних.

Многомерной средней называется средняя величина нескольких признаков для одной единицы совокупности. Т.к. признаки могут быть разнокачественными, т.е. изменяться в разных физических единицах, то поэтому нельзя рассчитать среднюю величину по абсолютному значению разных признаков.

С этой целью многомерная средняя величина вычисляется из относительных величин, чаще всего из отношений абсолютных значений признаков для единицы совокупности к среднему значению этих признаков.

 

многомерное среднее для j единицы.

 

- значение признака j для i-ой единицы

- среднее значение для признака

K – число признаков

j – номер признака, о котором идет речь

i – номер единицы совокупности

 

Более обоснованным методом многомерных классификаций является кластерный анализ.

Claster – множество

Как и всякое множество в отличие от математического множества в кластере всегда есть хотя бы один элемент. Каждая в единицу совокупности рассматривается как точка в заданном признаковом пространстве. Каждый признак это ось координат, это будет k-мерное пространство по количеству признаков k.

Признаковое пространство - область варьирования всех признаков совокупности.

Если уподобить признаковое пространство обычному эвклидову (трехмерному), то мы получим возможность измерять “расстояния” между функциями признаков пространств. Эти расстояния называются эвклидовыми, их вычисляют по тем же правилам, что и в обычной геометрии.

В многомерных пространствах расстояние между точками p и q с k – координатами

 

 

Совершенно очевидно, что нельзя суммировать квадраты отклонений относительно точек.

Поэтому необходимо сначала выразить различия между единицами совокупности по каждому признаку в каком-то безразмерном показателе. В качестве такого показателя чаще всего используется нормированная разность.

 

 

- абсолютная разность значений j-го признака

- СКО для признака

 

Знаки нормированных разностей не имеют значения, т.к. расстояния в признаковом пространстве есть величина скалярная, а не векторная. В нормально распределенной совокупности совпадает со средним отклонением от их средней величины, т.е. нормированная разность в …………

С учетом нормировки разности признаков расстояний между двумя любыми единицами совокупности точками признаков пространства.

 

 

С учетом сказанного алгоритм кластерного анализа выглядит следующим образом:

1) вычисляются средние величины каждого из классифицированных признаков в целом по совокупности;

2) вычисляются СКО каждого из признаков по совокупности ;

3) высчитываются матрицы нормированных разностей по каждому из группировочных признаков ;

4) вычисляются эвклидовы расстояния между каждой парой сочетаний единиц совокупности ;

5) вычисляются наименьшие эвклидовы расстояния ;

6) объединяются единицы совокупности с наименьшими эвклидовыми расстояниями между ними в один кластер;

7) вычисляется среднее значение всех признаков для единиц, объединенных в один кластер;

8) вычисляются новые нормированные разности между объединенным кластером как целым и остальными единичными или кластерными;

9) вычисляются новые эвклидовы расстояния между объединенным кластером и остальными единицами;

10) выбирается наименьшее из эвклидовых расстояний;

11) повтор с 6 по 10 пункты.

Объединение в кластеры заканчивается, когда все остальные эвклидовы расстояния будут больше заданной критической величины ( ).


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-08-24; Просмотров: 646; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.012 с.)
Главная | Случайная страница | Обратная связь