Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Оценка надежности коэффициента корреляции.



коэффициент корреляции должен находится в пределах r±3σ.


8.4. Измерение связи неколичественных признаков (К-нт ассоциации, к-нт контингенции, к-нт сопряженности Пирсона, к-нт сопряженности Чупрова, к-нт корреляции рангов Спирмена, к-нт корреляции Фехнера)

 

 
 


Условно:

 

Ограничение: a, b, c, d ≠ 0

Коэффициент контингенции

       
   
 

 

 


Пирсона:

       
   
 

 

 


Чупрова:

n1 – число вариантов значений первого признака,

n2 – число вариантов значений второго признака.

 
 


Коэффициент Спирмена:

, где di – разность рангов по обоим признакам для каждого объекта.

 
 

 


Коэффициент Фехнера

• C – количество совпадающих знаков отклонений от средних

• H – количество несовпадающих знаков отклонений от средних

• C + H = n

Регрессионный анализ.

Цели, виды.

Регрессионный анализ - предсказание значения одного фактора на основе значения другого.

В ходе регрессионного анализа решаются две основные задачи:

l Построение уравнения регрессии, т.е. нахождение вида зависимости между результатным показателем и независимыми факторами x1, x2, ..., xn.

l Оценка значимости полученного уравнения, т.е. определение того, насколько выбранные факторные признаки объясняют вариацию признака у.

Виды:

1. Линейная регрессия

Yi = Сдвиг + Наклон * Xi + Сл.ошибкаi

Y = a + b*X+ε i

2. Множественная регрессия

Y = a + b1*X1 + b2*X2 +... + bp*Xp

 

Регрессионные коэффициенты

(или B-коэффициенты) представляют независимые вклады каждой независимой переменной в предсказание зависимой переменной.

Ошибка выбранной модели.

y – эмпирическое значение

y* - теоретическое значение

p – число параметров уравнения

Кластерный анализ.

Цели. Евклидово расстояние. Стандартизация.

Разделение выборки объектов на непересекающиеся подмножества (кластеры) так, чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров существенно отличались.

Позволяет уменьшить количество объектов. Критерием для определения схожести и различия кластеров является расстояние между точками на диаграмме рассеивания.

l Понимание данных (Каждому кластеру – свой метод анализа)

l Сжатие данных (Один типичный представитель от каждого кластера)

l NoveltyDetection (Выделение нетипичных объектов)

Евклидово расстояние - мера расстояния между кластерами

Расстояние между 2 точками в 2-мерном пространстве:

 
 

 

 


В 3-х мерном:

 
 

 

 


Стандартизация – выбор масштаба

Z-шкалы (Z-Scores) - из значений переменных вычитается их среднее, и эти значения делятся на стандартное отклонение

Методы объединения объектов.

Метод ближнего соседа

Расстояние между двумя кластерами определяется расстоянием между двумя наиболее близкими объектами (ближайшими соседями) в различных кластерах.

Метод дальнего соседа

-Применяется когда, расстояние между двумя кластерами, определяется расстоянием между двумя наиболее дальними объектами в кластерах.

-Необходим, для выделения кластеров путем соединения дальних объектов этих кластеров друг с другом.

3.Метод Варда :

-Применяется для выборок малых размеров

-Необходим для создания кластеров малых размеров и объединения близко расположенных кластеров в один большой.

Невзвешенного попарного среднего

Взвешенного попарного среднего

Центроидный

Дендрограмма. Основные характеристики кластеров.

Суть иерархической кластеризации состоит в последовательном объединении меньших кластеров в большие или разделении больших кластеров на меньшие.

Dendron — греч.дерево

Графическое изображение процесса объединения кластеров

l Вертикальная

l Горизонтальная

Характеристики кластера.

l Центр кластера - среднее геометрическое место точек в пространстве переменных.

l Радиус кластера - максимальное расстояние точек от центра кластера.

Спорный объект - объект, который может быть отнесен к нескольким кластерам

l Размер кластера может быть определен либо по радиусу кластера, либо по среднеквадратичному отклонению объектов для этого кластера.

l Объект относится к кластеру, если расстояние от объекта до центра кластера не больше радиуса кластера. Если это условие выполняется для двух и более кластеров, объект является спорным.


Поделиться:



Популярное:

  1. III. 39 Классификация и оценка предпринимательского риска
  2. III/3. Экономическая оценка земли и направления ее практического использования.
  3. VI. Оценка финансовых обязательств
  4. X. Оценка инвестиций в ассоциированные (зависимые) компании
  5. Алгоритм построения ФСР для ЛОДУ n-го порядка с постоянными коэффициентами.
  6. АЛЬТЕРНАТИВНАЯ ОЦЕНКА РЕНТАБЕЛЬНОСТИ
  7. Арт. 28: Оценка выступлений.
  8. Ассортимента металлической посуды. Оценка качества
  9. Безалкогольные напитки. Значение в питании. Классификация. Характеристика отдельных видов. Оценка качества. Хранение
  10. Библиографическая проверка надежности Нового Завета
  11. Биохимические, физико-химические и микробиологические изменения, протекающие в охлажденной рыбе при хранении. Их влияние на качество. Оценка качества охлажденной рыбы
  12. Бонитировка почв. Принципы, критерии и методы бонитировки. Метод Фатьянова. Показатели, используемые для бонитировки почв. Экономическая оценка земель.


Последнее изменение этой страницы: 2016-08-24; Просмотров: 1012; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.015 с.)
Главная | Случайная страница | Обратная связь