Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Применение классификаций в географии
Основные вопросы, рассматриваемые на лекции: 1. Сферы приложения классификаций в географии 2. Многомерные математические модели, применяемые для типологии 3. Многомерные математические модели, применяемые, применяемые для оценочных классификаций 1. Сферы приложения классификаций в географии. Классификация изучаемых явлений в той или иной мере присуща всем наукам, а ее использование в географии имеет давнюю историю. Географический подход к изучению явлений природы и общественной жизни предполагает территориальную изменчивость этих явлений и ее изучение с помощью методов классификаций. Районирование территории, типология и оценка комплексов зачастую с представлением на карте полученных результатов являются не только методами, но и целями исследований. При классификации географических комплексов приходится сталкиваться с разными трудностями, некоторые из них имеют место в различных науках, другие характерны именно для географии: 1. Существующие алгоритмы классификации обычно работают со статистическими характеристиками, лишь косвенно или вовсе не отражающими пространственное расположение явлений. 2. При многих классификациях встает проблема оптимального выбора системы исходных показателей, которая должна всесторонне описывать изучаемые явления. Данные не должны быть избыточными, дублировать друг друга, быть производными один от другого, и т. д. В противном случае они могут затушевать наиболее значимые признаки и привести к искажению конечного результата. Самую существенную помощь здесь может оказать глубокое познание сущности комплекса, что позволяет установить круг показателей, его отображающих. Другой путь - экспериментальная проверка степени их влияния на конечный результат. 3. Еще одна трудность - различная степень значимости, важности используемых показателей. Некоторые из них столь важны, что их исключение не позволяет моделировать явления, другие же лишь дополняют, уточняют основную систему. Это требует " взвешивания" показателей, ведущего к дифференциации степени их влияния на конечный результат. 4. Большинству классификационных задач в географии свойственны показатели различной природы: имеющие количественное выражение; оценивающие значения какого-либо признака без его количественного выражения; а также носящие чисто качественный характер (например, пришедшие из какой-нибудь другой классификации). 5. Другая трудность - несопоставимость показателей, используемых для описания какого-либо признака на различных территориях. Это связано как с несовершенством имеющихся данных (например, из-за различий в подходах к оценке показателя в разных странах), так и с отсутствием объективных методов их определения. 6. Существенны трудности при выборе наиболее подходящей модели. В настоящее время существует огромное количество различных алгоритмов, пригодных для решения классификационных задач, но не отвечающих в полной мере специфике отображаемых комплексов. Модификации математических алгоритмов с целью приближения их содержательной сути начинается уже с нормировки исходных показателей. Например, при оценках географических комплексов необходимо. привести систему исходных данных к логически сопоставимому виду, когда используемые показатели должны описывать отклонения характеристик комплекса от оптимальных оценок. Это позволяет правильно задать ориентацию показателей между логическими полюсами наихудших и наилучших условий для каждого из них и тем самым правильно соизмерить их между собой. По степени привязка объектов к земной поверхности можно выделить три разновидности классификаций в географии: 1) результаты реализации моделей не подлежат пространственному анализу и не наносятся на карту, 2) результаты поддаются картографированию, но пространственный аспект не учитывается на этапе реализации математических алгоритмов, 3) без учета пространственного положения явлений невозможно реализовать математические расчеты. Важным понятием является также районирование. Районирование определяется как процедура вычленения целостных территориальных систем, когда внимание исследователей концентрируется на различиях между ними, а при типологии и оценке основной критерий - однородность выделяемых таксонов. В отличие от районирования, типология и оценка могут приводить к образованию территориально расчлененных таксонов, свойства которых определяются содержательной сущностью решаемых задач. В физико-географических дисциплинах районирование чаще осуществляется с учетом критерия подобия комплексов (хотя и не исключительно на его основе). При этом сами комплексы обычно состоят из разнородных элементов, объединяемых на основе признаков целостности. Поэтому, хотя классификации по связям занимают важное место в этих исследованиях, относительно велико в них значение однородного районирования. В социально-экономической части науки роль узлового районирования выше, чем в физической. Это объясняется тем, что жизнедеятельность общества требует более высокого уровня пространственных взаимодействий. В экономико-географических исследованиях и однородное, и узловое районирование играют важную роль. Одной из сложных задач является согласование и выявление связей между ними. Проблемы общегеографического, природно-хозяйственного, ресурсно-хозяйственного районирования - проявления этой задачи. Классификации по связям редко встречаются в других науках, поэтому большинство алгоритмов автоматической классификации не рассчитаны на непосредственное применение к ним. При изучении географических комплексов часто ставится задача предварительной классификации показателей и факторов, описывающих эти комплексы. Обычно она выступает как метод исследования, в то время как классификации комплексов могут выступать и в роли методов, и в роли целей. Содержательная интерпретируемость классификаций показателей и факторов, необходимая для их эффективного использования в исследованиях, требует получения таких результатов, когда показатели и факторы, отнесенные к одной группе, имеют близкий содержательный смысл или описывают близкие стороны явлений. Различные алгоритмы корреляционного или факторного анализа, которые используются или могут быть использованы для решения подобных задач, не всегда отвечают поставленным условиям. Их применение иногда требует проведения большого объема работы по корректировке полученных результатов и приведению к схеме, элементы которой имеются у исследователя a priori. Наличие у исследователя априорной схемы (построенной часто по аналогии с ранее проведенными классификациями) играет важную, а часто и определяющую роль. Именно с ее позиций обычно оценивается качество полученных результатов. Методы многомерной автоматической классификации бывают полезны тем, что они подтверждают существующую схему и позволяют уточнять отдельные ее элементы. Наконец, помимо классификаций комплексов возникает задача классификации их взаимодействий (в том числе и территориальных). Она оказывается гораздо труднее из-за неясностей с описаниями процессов взаимодействий. Особенно это проявляется при классификациях территориальных систем как целостных совокупностей явлений вместе с их процессами взаимодействий. Во многих частных географических науках широко применяются математические методы классификации. В настоящее время математические методы классификации используются или могут быть использованы в решении следующих основных задач: Земной коры - классификация геоморфологических процессов; - классификация воздействий на рельеф; - классификация почв для различных целей и др. Гидросферы - районирование территории по условиям формирования стока рек; - типология внутригодового распределения стока при водохозяйственном и гидротехническом проектировании; Атмосферы - классификация метеорологических ситуаций на типовые для целей долгосрочного или краткосрочного прогноза по " методу аналогов"; - типология климата или отдельных его составляющих; - выявление факторов, определяющих физические процессы, протекающие в атмосфере. Биосферы - классификация биоценозов, типология биомов, дифференциация экологических ниш, построение бонитетных шкал, экологических рядов и др. Общества - оценка территорий по социально-экономическим условиям жизни и пространственному поведению населения; - типология видов использования земель, оценка земель, типология сельскохозяйственного производства; - классификация систем промышленного производства; Комплексные классификации - типология природных ландшафтов; - экономическое районирование; - классификация территориально-производственных комплексов и др.
2. Многомерные математические модели, применяемые для типологии. Модели группировки территориальных единиц по комплексу показателей, используемые в географии, на основе целей их применения можно подразделить на две большие группы, ориентированные на моделирование оценочных и типологических характеристик. В первом случае модели строятся при условий гомогенности территориальных единиц внутри таксонов, которые должны быть иерархически упорядочены между собой. Условие создания моделей второго типа - лишь гомогенность объединяемых в одну группу территориальных единиц. В пределах данного вида моделей может ставиться дополнительное условие максимальной гетерогенности между однородными таксонами и др. Примером моделирования типологических характеристик может служить классификация сельскохозяйственных предприятий по специализации производства. В то же время можно указать на примеры оценки природных и экономических условий для различных целей, свидетельствующие о распространенности задач, когда требуется получение сравнительных оценочных характеристик. Картографические компоненты данных видов моделей явля-ются соответственно типологическими и оценочными картами. Типологические и оценочные характеристики могут совмещаться: например, на карте типов хозяйственных структур стран мира может быть дополнительно показана оценка этих стран по уровню их экономического развития. Обратимся к типологическому методу, разработанному Тикуновым В.С. Условие построения данной модели - гомогенность территориальных единиц, объединяемых в группы (таксоны). Предложенный метод предполагает нормировку исходных показателей, например, по дисперсиям: (1) При наличии обоснованных " весов" каждого показателя их также можно ввести в формулу нормировки. Нормированные показатели ( ) образуют матрицу, на основе которой рассчитываются различные меры близости территориальных единиц по комплексу показателей и, в частности, евклидовы расстояния. Все территориальные единицы представляются в виде точек в n-мерном пространстве, координатами которых служат нормированные исходные показатели. Евклидовы расстояния (dik), соединяющие каждую пару точек, отражают различие свойств территориальных единиц, на чем основывается дифференциация территории. Их вычисление осуществляется по известной формуле: (2) Все рассчитанные расстояния образуют симметричную матрицу с нулевыми элементами на главной диагонали:
(3) Заметим, что формула (2) будет правильно отражать различия между территориальными единицами только для статистически независимых показателей. Когда в расчете используются зависимые признаки-индикаторы, евклидовы расстояния искажаются. Поэтому для их устранения исходные нормированные показатели необходимо предварительно взвесить, например, по компонентным нагрузкам, выделенным с помощью метода главных компонент. Это позволяет привести исходные нормированные показатели к ортогональному виду, то есть перейти к независимым величинам. Попутно, исключив компоненты, охватывающие небольшой процент дисперсии, можно генерализовать данные, исключая второстепенные или даже случайные вариации в системе исходных показателей-индикаторов. В случае сильно криволинейных связей рядов исходных показателей бывает целесообразно перед расчетом корреляционной матрицы использовать объективный численный метод выравнивания и нормализации нелинейных попарно-монотонных корреляционных связей (Алексеев, 1971). Этот блок позволяет представить нормированные исходные показатели не только в линеаризованном виде, но и приводит их к нормальному распределению. Следует заметить, что вместо евклидовых расстояний можно использовать коэффициенты корреляции (или величины равные 1-r, где r - разнообразные коэффициенты корреляции), иные меры расстояний (расстояния Махаланобиса и др.) и др. Весь набор мер различия не эквивалентен между собой, то есть их использование может привести к различающимся результатам. Поэтому в конкретных экспериментах полезно опробовать ряд мер. Итак, выбрав одну из мер сходства территориальных единиц, например, евклидовы расстояния, обратимся к анализу матрицы D. Из данной матрицы выбирается наибольшее расстояние, а две территориальные единицы, которые оно связывает, становятся ядрами, вокруг которых будут образовываться однородные группы - таксоны. Эти группы формируются распределением оставшихся (n-2) территориальных единиц между двумя ядрами по минимальности евклидовых расстояний. В этом случае обе группы будут сформированы при условии минимальности внутригрупповых различий, выражаемых суммой евклидовых расстояний между всеми входящими в группы парами единиц. Формула для подсчета суммы различий такова (4) где K - число сформированных групп; Р - количество ортогонализированных координат для расчета расстояний; n - число территориальный единиц; tmax - максимальное количество групп; Iik -индикатор (бинарный), указывающий наличие (1) или отсутствие (0) территориальной единицы i в группе k. Выражение в квадратных скобках соответствует выбранной евклидовой матрице. На втором этапе (при формировании трех групп) алгоритм работает следующим образом. Два первых ядра остаются, а третье находится так. Каждая из (n-2) оставшихся территориальных единиц опробуется как третье ядро, а (n-3) остающиеся - распределяются между тремя ядрами по минимальности евклидовых расстояний. Для каждого варианта группировки подсчитывается сумма внутригрупповых различий (см. формулу 4), и тот вариант, который дает наименьшую сумму, принимается в качестве окончательного для трехгруппового деления, а территориальная единица, служившая ядром, фиксируется как окончательное третье ядро. Процедура продолжается аналогично для формирования четырех, пяти, шести и т. д. однородных групп. Причем на каждом шаге определяется новое ядро и формируется новая группировка. Полученные результаты удобно анализировать по среднеарифметическим значениям каждого показателя, относительно всех территориальных единиц, входящих в тот или иной таксон. В ряде случаев целесообразно нахождение экстремальных значений в каждом таксоне по всем исходным показателям. Эти характеристики можно применять для смысловой характеристики таксонов. Описанный алгоритм типологии производит классификацию при условии гомогенности территориальных единиц, объединяемых в таксоны. Однако, в некоторых случаях необходимо условие не только гомогенности, но и максимальной гетерогенности ядер, служащих как бы эталонами для формирования таксонов.
3. Многомерные математические модели, применяемые для оценочных классификаций. Построение моделей, ориентированных на моделирование оценочных синтетических карт, как уже было отмечено раньше, осуществляется при условии гомогенности территориальных единиц, формирующих таксоны, которые должны быть иерархически упорядочены между собой. Рассмотрим алгоритм (Тикунов, 1985, а) с учетом поставленного условия. Кроме того, алгоритм позволяет получать синтетические характеристики оценочного положения территориальных единиц по единой шкале и ранжировать данные территориальные единицы на основе этих оценок. Суть алгоритма такова. Bce территориальные единицы характеризуются наборами показателей, которые прежде всего следует нормировать, для чего, в случае создания оценочных карт, удобно использовать формулу: (5) где n - количество территориальных единиц; m - количество показателей (xij); - наилучшие (или наихудшие) для каждого показателя оценочные значения (например, наиболее благоприятные для целей строительства, сельского хозяйства и др); -экстремальные значения показателей, наиболее отличающиеся от величин : (6) Данная нормировка дает возможность выразить отклонения всей системы показателей от наилучших или наихудших оценочных значений и тем самым правильнее с содержательных позиций их соизмерить между собой. Нормировка, кроме того, позволяет установить количественные соотношения между значениями оценочных характеристик для исходных территориальных единиц или для выделяемых в последующем таксонов. В этом случае, если рассматривать нормированные показатели как приведенные к своеобразной соизмеримой форме, возможно находить их суммарные значения (7) Такие величины приближенно характеризуют оценочное положение территориальных единиц за счет того, что чем сильнее их показатели отличаются от наилучших значений ( ), тем величина Si будет больше. Величина Si может быть равна нулю, если весь комплекс показателей территориальной единицы совпадает с наилучшими значениями и Si будет равна m, если этот комплекс по всем показателям будет максимально отличаться от j. Чем больше величина Si, когда j задана наилучшими значениями, тем хуже синтетическая оценочная характеристика у соответствующей территориальной единицы (и наоборот для наихудших значений). Средние для таксонов величины Si позволяют дать им качественные характеристики оценки, например, как очень плохие, плохие, хорошие и т. д., а также количественно, хотя и в грубой форме, их сопоставлять между собой. При наличии обоснованных " весов" каждого показателя их также можно ввести в формулу нормировки. Следующий этап, аналогично с типологическим алгоритмом, связан с выбором мер различия между территориальными единицами. Напомним, что если рассчитать меры различия в многомерном признаковом пространстве между всеми точками, символизирующими территориальные единицы, то получим матрицу. Однако, с целью ранжирования территориальных единиц по шкале их интегрального оценочного положения, вместо расчета всей матрицы D(n x n) достаточно вычислить лишь один вектор размерности D°(n). Этот вектор различий D°(n) показывает степень удаленности (близости) всех реальных территориальных единиц от условной, имеющей наилучшие или наихудшие оценочные условия (см. формулу 2). Таким образом, уже получение вектора D° позволяет установить количественные соотношения в оценочном положении территориальных единиц, что иногда ставится в географии как самостоятельная задача. Для выделения таксонов достаточно лишь разделить на однородные группы предварительно ранжированные по возрастанию значения вектора и тем самым распределить по таксонам исходные территориальные единицы. Прежде всего вычисляются приращения последующих ранжированных значений вектора оценочных характеристик D° над предыдущими. Из набора (n-1) приращений находится минимальное, и связываемые им территориальные единицы объединяются в один таксон. Данное приращение из дальнейшего анализа исключается и отыскивается новое минимальное приращение, которое позволяет сгруппировать еще две территориальные единицы и т. д. до тех пор, пока все территориальные единицы не сольются в одну группу. Вполне естественно, что если минимальным оказывается приращение, связывающее две территориальные единицы уже ранее объединенные с их соседями в ранжированном ряду, то они все вместе группируются в один таксон. При такой процедуре классификации все территориальные единицы не теряют своих индивидуальных черт в процессе поэтапного образования таксонов, которые оказываются иерархически упорядоченными между собой, что и требуется для создания оценочных карт.
Вопросы для самопроверки: 1. Перечислите основные проблемы, затрудняющие проведение классификаций в географии. 2. Для чего обычно выполняется нормировка исходных показателей при классификации? 3. Какие виды классификаций применяются в географии? 4. Поясните соотношение терминов классификация и районирование. 5. Поясните соотношение терминов типологическое и оценочное районирование. 6. Приведите примеры задач классификаций в геоэкологии. 7. С какой целью применяется метод главных компонент в алгоритме классификации? 8. Вы провели ряд объективных способов классификаций, приведших различным результатам. Как оценить качество полученных результатов? 9. Перечислите основные этапы типологической классификации. 10. Перечислите основные этапы оценочной классификации.
Лекция № 9 Популярное:
|
Последнее изменение этой страницы: 2016-03-25; Просмотров: 2215; Нарушение авторского права страницы