Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Достоинства и недостатки методов, основанных на близости описании.
+: Простота реализации -: Необх хранения всей обуч послед-и. Отсутствие гарантии привильного распознавания, невозможность оценки качества РП IV.Обучение без учителя 19. Меры сходства изображений, используемые для выявления классов (кластеров). В качестве меры между образами x и z можно использовать: 1. Евклидово расстояние: . 2. косинус угла между векторами, 3. Мера Танимото - отношение количества совпадающих к количеству различных признаков двух образов. 20. Подходы к построению процедуры классификации (кластеризации). Эвристический подход предусматривает задание набора правил, основывающихся на использовании выбранной меры сходства для отнесения образов к одному из кластеров. Образ относится к такому кластеру, с центром которого он схож в большей степени. Подход к кластеризации, предусматривающий использование показателя качества, связан с разработкой процедур, которые обеспечат минимизацию или максимизацию выбранного показателя качества. Одним из наиболее популярных показателей качества является сумма квадратов ошибки где — число кластеров, — множество образов, относящихся к j-му кластеру, а —вектор выборочных средних значений для множества Sj; Ni характеризует количество образов, входящих во множество Sj. 21. Простой эвристический алгоритм определения кластеров. Шаг 0. Пусть задано множество N образов X1, …, XN. Пусть центр первого кластера z1 совпадает с любым из заданных образов и определена произвольная неотрицательная пороговая величина t. Шаг 1. Вычисляется расстояние D21 между образом X2 и центром кластера z1 по формуле евклидового расстояния. Если D21> t, то учреждается новый центр кластера z2=X2. В противном случае образ X2 включается в кластер c центром z1. Шаг 3. Вычисляются расстояния D31 и D32 от образа X3 до центров кластеров z1 и z2. Если D31> t и D32> t, то учреждается новый центр кластера z3=X3. В противном случае образ X3 зачисляется в тот кластер, чей центр к нему ближе. Шаг m. Подобным же образом расстояния от каждого нового образа до каждого известного центра кластера вычисляются и сравниваются с пороговой величиной—если все эти расстояния превосходят значение порога t, учреждается новый центр кластера. В противном случае образ зачисляется в кластер с самым близким к нему центром. Эвристический алгоритм максиминного расстояния. Шаг 0. Пусть задано множество N образов X1, …, XN. Шаг 1. Один из заданных образов назначается центром первого кластера z1. Возьмем z1=X1. Шаг 2. Затем отыскивается образ, отстоящий от образа X1 на наибольшее расстояние. Он назначается центром кластера z2. Шаг 3. Вычисляются расстояния между всеми остальными образами выборки и центрами кластеров z1 и z2. В каждой паре этих расстояний выделяется минимальное. После этого выделяется максимальное из этих минимальных расстояний. Если последнее составляет значительную часть расстояния между центрами кластеров z1 и z2 соответствующий образ назначается центром кластера z3. В противном случае выполнение алгоритма прекращается. Шаг m. В общем случае подобная процедура повторяется до тех пор, пока на каком-либо шаге не будет получено максимальное расстояние, для которого условие, определяющее выделение нового кластера, не выполняется.
Алгоритм К внутригрупповых средних. 1 шаг. Выбираются К исходных центров кластеров z1(1), z2(1), z3(1), …, zk(1) Обычно берутся первые К точек 2 шаг. На К-ом шаге итерации заданное мн-во Х распределяется по К кластерам след. образом xÎ Sj(k) если ||x-zj(k)||< =||x-zi(k)|| i=1…k i< > j 3 шаг. На основании результата 2шага выбираются новые центры кластеров z(k+1) исходя из того, что расстояние между всеми образами в Sj(k) и новым центром будет минимально. 4 шаг. Если zj(k+1)=z(k), то алгоритм останавливается Иначе происходит новое разбиение и алгоритм продолжается до тех пор пока не будет найден оптимальное решение.
Алгоритм ISODATA. Общая структура алгоритма такова: 1. Формирование подмножеств выборочных множеств . 2. Слияние кластеров (если требуется с переходом на 1). 3. Расщепление кластеров (если требуется с переходом на 1). При этом используются следующие эвристики: 1. Ликвидация кластеров с числом элементов меньше заданного значения. 2. Объединение кластеров, находящихся близко друг к другу. При объединении кластеров с центрами и образуется один кластер с центром Расщепление кластера может происходить по одному из следующих критериев: 1. При достаточно сильной разбросанности образов расщепляемого кластера в масштабе общего множества образов. 2. Если требуется получить достаточно большое число кластеров.
Популярное:
|
Последнее изменение этой страницы: 2016-07-14; Просмотров: 530; Нарушение авторского права страницы