Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
ОСНОВЫ КОРРЕЛЯЦИОННОГО МЕТОДА
1. СУЩНОСТЬ ТЕОРИИ КОРРЕЛЯЦИИ Диалектический подход к изучению закономерностей природы и общества требует рассмотрения процессов и явлений в их сложных взаимосвязях. Явления географической среды зависят от многих, часто неизвестных и меняющихся факторов. Выявить и изучить такие связи помогает теория корреляции - один из центральных разделов математической статистики, исключительно важный для исследователей. Рис. 1. Функциональная зависимость
Главные задачи корреляционного анализа - изучение формы, знака (плюс или минус) и тесноты связей. Опишем кратко сущность теории корреляции. Все связи делятся на функциональные, рассматриваемые в курсах математического анализа, и корреляционные. Функциональная зависимость предполагает однозначное соответствие между величинами, когда численному значению одной величины, называемой аргументом, соответствует строго определенное значение другой величины - функции. При графическом изображении функциональной связи в прямоугольной системе координат (х, у), если по оси абсцисс отложить значение одного признака, а по оси ординат - другого, все точки расположатся на одной линии (прямой или кривой). Функциональные (идеальные) связи встречаются в абстрактных математических обобщениях. Например, зависимость площади круга от радиуса (R) выразится на графике определенной кривой (рис. 1), построенной по формуле В любой опытной науке экспериментатор имеет дело не с функциональными связями, а с корреляционными, для которых характерен известный разброс результатов эксперимента. Причина колеблемости заключается в том, что функция (изучаемое явление ) зависит не только от одного или нескольких рассматриваемых факторов, но и от множества других. Так, урожайность зерновых культур будет зависеть от ряда климатических, почвенных, экономических и других условий. Если связь урожайности с каким-либо из указанных факторов изобразить графически в системе координат (х, у), то получим разброс точек. Закономерности корреляционных связей и изучает теория корреляции. В основе теории корреляции лежит представление о тесноте связи между изучаемыми явлениями (большая или малая связь). Для лучшего уяснения редко встречаемого в географической литературе понятия «теснота связи» представим его в графической форме путем построения так называемого поля корреляции. Для этого результаты каждого наблюдения за элементами статистической совокупности по двум признакам отмечаем точкой в системе прямоугольных координат х и у. Таким путем, например, можно изобразить зависимость урожайности зерновых по районам от гидротермического коэффициента. Чем больше разброс точек на поле корреляции, тем меньше теснота связи между изучаемыми явлениями. Рассмотрим два корреляционных поля (а и б, рис. 2). На поле а показана зависимость скорости роста оврагов (у) от площади водосбора (xi), на поле б - от угла наклона (хз). Меньший разброс точек первого корреляционного поля указывает на то, что скорость роста оврагов более тесно связана с площадями водосборов, чем с углами наклона. Иначе можно сказать: изучаемое явление зависит от первого картометрического показателя в большей степени. По общему направлению роя точек - слева вверх направо - можно заключить, что в обоих случаях связь положительная (со знаком плюс).
При отрицательной (минусовой) зависимости рой точек направлен слева вниз направо (рис. 3). По характеру размещения точек в рое, их близости к оси можно визуально определить не только тесноту и знак связи, но и ее форму, которая подразделяется на прямолинейную и криволинейную. Первая форма связи воспроизведена на рис. 2 а и б. Она условна и является частным случаем связи криволинейной. Однако именно прямолинейная связь (при всей ее условности) рассматривается в географических и других исследованиях наиболее часто из-за простоты математико-статистического аппарата ее оценки и возможности применения при изучении многофакторных связей и зависимостей.
Рис. 4. Криволинейная форма связи Степень кривизны географических корреляционных связей во многом зависит от меридиональной протяженности изучаемых территорий. На рисунке 4 показана в схематизированном виде криволинейная зависимость среднегодовой температуры (t) от географической широты t(j) в глобальном масштабе - от южного полюса (ЮП) через экватор (Э) до северного полюса (СП). Чем меньше протяженность изучаемой территории с юга на север, тем больше оснований назвать ее прямолинейной. Так, на восходящем отрезке АВ (южное полушарие) связь прямолинейная положительная, а на нисходящем отрезке CD (северное полушарие) - прямолинейная отрицательная. На приэкваториальном отрезке ВС связь сохраняется криволинейной. Визуально-графический способ изучения тесноты и формы связи прост, нагляден, но недостаточно точен. Математико-статистическая обработка результатов наблюдений позволяет определить числовые значения, характеризующие как форму, так и тесноту связей.
2. ВЫЧИСЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ Наиболее распространенным показателем тесноты прямолинейной связи двух количественных признаков считается коэффициент корреляции (r). Его абсолютное численное значение находится в пределах от 0 до 1. Чем теснее связь, тем больше абсолютное значение r. Если r = 0, то связи нет, если он равен ±1, то связь функциональная (точки расположатся строго по линии). Знак «плюс» (+) указывает на прямую (положительную) зависимость, «минус» - на обратную (отрицательную). Предельные значения коэффициента корреляции (r = + 1, 0 и - 1) в практике географических исследований не встречаются; обычно их числовые значения находятся между нулем и положительной или отрицательной единицей. Рассмотрим наиболее распространенную схему вычисления, опирающуюся на предварительные расчеты средних арифметически, центральных отклонений и средних квадратических отклонений да каждого количественного признака. Предположим, необходимо найти тесноту связи между количеством осадков в июле (х) и урожайностью пшеницы (у). Эти данные вносятся в первые два столбца таблицы 1. Схема вычисления коэффициента корреляции
- сумма по столбцу 5; n - число наблюдений; dx и dу - средние квадратические отклонения признаков х и у, вычисленные по формуле, приведенной в лекции 2. В нашем примере связь хорошая. Таблица I
Затем вычисляем разности между конкретными значениями исходных величин и их средними арифметическими. Результаты этих расчетов записываем в столбцы 3 и 4. Вычисление чисел в столбцах 5, б и 7 вполне понятно из надписей над соответствующими столбцами. Под каждым столбцом подсчитываем суммы. Коэффициент корреляции (г) вычисляем по формуле Особо ценен 5-й столбец схемы, представляющий собой совокупность произведений центральных отклонений и названный ковариационным столбцом. Он позволяет проверить правильность определения знака и численного значения коэффициента корреляции по соотношению сумм плюсовых и минусовых показателей членов ковариационного ряда. Чем больше разнятся суммы плюсов и минусов, тем теснее связь исходных показателей. Примерное равенство их свидетельствует о низкой связи. Знак коэффициента корреляции будет соответствовать знаку превышения одной суммы над другой.
Популярное:
|
Последнее изменение этой страницы: 2016-04-11; Просмотров: 496; Нарушение авторского права страницы