Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Получение количественной информации и группировка данных
Основные вопросы, рассматриваемые на лекции: 3. Статистические совокупности и количественные признаки. 4. Способы отбора объектов в выборку. 5. Способы получения количественной информации в географических исследованиях. 6. Сущность и виды группировок. 7. Графическая форма распределения величин.
1. Статистические совокупности и количественные признаки. Прежде чем приступить к математико-статистическим расчетам, географ должен иметь в своем распоряжении достаточный объем количественной информации, характеризующей объекты, процессы и явления на определенной территории или в определенном пункте. Математическая статистика рассматривает множества единиц одного и того же вида, называемыестатистическими совокупностями.В географических исследованиях ими могут быть ландшафты, географические зоны, единицы административно-территориального деления, населенные пункты, промышленные предприятия и др. Отдельные единицы, входящие в состав статистической совокупности, называются ее элементами. Число всех элементов называют объемом совокупности. Явления географической среды изучаются не только в пространстве, но и во времени, отсюда элементами статистической совокупности могут быть как территориальные единицы (ландшафты, административные районы, хозяйства), так и временные (года, сезоны, месяцы, дни и т.д.). Элементы статистической совокупности отличаются друг от друга (варьируют) по количественным признакам, выраженным в числах. Одни и те же элементы статистической совокупности могут иметь не один, а множество количественных признаков, отражающих в цифровой форме те или иные свойства рассматриваемых явлений и показывающих различия между отдельными элементами статистической совокупности. Так, внутренняя разнородность географических ландшафтов может выражаться через различия в глубинах залегания кристаллического фундамента, абсолютной высоты земной поверхности, через вариацию климатических показателей (температуры, давления, влажности и т.д.). Административные районы различаются не только по природным условиям, но и по ряду экономических показателей - урожайности зерновых, плотности скота, посевным площадям, затратам средств на ту или иную отрасль хозяйства и т.п. Города изучаемой территории могут отличаться по количеству населения, валовой продукции промышленности, по географическому положению (широте и долготе, удаленности от моря, абсолютной высоте) и другим показателям. К наиболее типичным для географии количественным признакам правомерно отнести показатели местоположения и размеров географических объектов - их географической широты, долготы, высоты, протяженности, площади. При изучении динамики явлений в качестве количественных показателей временных единиц часто используют данные об урожайности по годам, климатические характеристики (например, суммы температур за вегетационный период, гидротермический коэффициент, количество осадков), скорости роста оврагов и др. Последовательное перечисление количественных признаков элементов, отличающихся местоположением, называют пространственными рядами. Количественные признаки по годам, месяцам, дням, часам образуют ряды временные. Таким образом, элементами статистической совокупности являются объекты, подлежащие изучению. Характерной чертой математической статистики является то, что она изучает статистические совокупности объектов, но не их отдельные элементы. Процесс получения количественных показателей объектов и явлений часто называют статистическими наблюдениями. Статистические совокупности подразделяются на генеральную и выборочную. Генеральнаясовокупность (М) – это вся имеющаяся статистическая совокупность, объединенная какой-либо качественной общностью. В географических исследованиях наиболее распространена территориальная общность объектов и явлений, заключающаяся в их принадлежности к какому-то географическом) району. Так, например, все населенные пункты России (или только города), все регионы страны (области, края, районы) являются генеральными совокупностями. Объем генеральной совокупности в географических исследованиях может быть различным – от нескольких единиц до бесконечности. Если изучаемая территория невелика, то количество элементов часто оказывается небольшим. Например, число хозяйств в административном районе значительно меньше, чем в республике, или, тем более, в России. При изучении пространственных закономерностей климатических, морфометрических и ряда других явлений наблюдается изменение количественных показателей от места к месту, т.е. любая точка местности имеет определенное числовое значение (среднегодовую или среднемесячную температуру, абсолютную высоту над уровнем моря и другие характеристики). Каждая точка в этом случае представляет собой элемент статистической совокупности, а так как таких точек неограниченное количество, то генеральная совокупность будет бесконечной. Довольно часто вся генеральная совокупность не изучается из-за недоступности многих объектов для наблюдений или же ввиду трудоемкости обработки слишком большого количества данных. Например, вряд ли можно найти количественные характеристики всех оврагов какой-либо зоны; обработать же данные о всех городах России (их около 2 тысяч) хотя и можно, но довольно трудно. При большом объеме статистического материала обычно используютвыборочную совокупность (m), когда по определенной правильно выбранной генеральной совокупности, взятой на основе отбора, судят об этой совокупности в целом. По-видимому, о всех городах России можно судить достаточно правильно, если для исследований будет взята только часть их. Достаточно большой объем выборки и надлежащая организация наблюдений приводят к тому, что результаты выборочного изучения будут близки к результатам, получаемым при изучении генеральной совокупности. Основное качество выборочной совокупности, заключающееся в способности заменить всю генеральную совокупность, называетсярепрезентативностью выборки. 2. Способы отбора объектов в выборку. Отбор объектов в выборку должен удовлетворять следующему обязательному правилу - каждая единица генеральной совокупности имеет одинаковую возможность быть отобранной. Такое требование исключает субъективизм, предвзятость в исследованиях. Например, для правильной объективной оценки урожайности зерновых в области не следует использовать данные только лучших хозяйств. Изучение лишь крупных оврагов может создать неправильное представление об овражной эрозии на исследуемой территории. Наиболее часто встречаются следующие виды отбора: 2.1. Случайный повторный отбор, при котором объекты отбираются из генеральной совокупности и после изучения возвращаются в нее, так что любой объект может попасть в выборку повторно. Предположим, на изучаемой территории имеется 2000 хозяйств (М = 2000). Исследователь решил изучать эти хозяйства, выбрав из имеющейся генеральной совокупности лишь 30 (n = 30). Каждому хозяйству присваивается номер, который записывается в отдельную карточку. Все 2000 карточек тщательно перетасовывают. Выбирают наугад одну карточку и записывают номер хозяйства. Затем эту карточку возвращают в колоду, производят повторное перемешивание, после чего берут еще карточку. Таким образом, выбирают все 30 хозяйств, количественные признаки которых надлежит изучать. 2.2. Случайный бесповторный отбор, при котором элементы статистической совокупности отбираются как и в предыдущем случае, с той лишь разницей, что выбранная карточка в колоду не возвращается, так что каждый отобранный объект не может попасть в выборку повторно. Это более распространенный способ выборки по сравнению с первым. 2.3. Механический отбор заключается в том, что единицы, подлежащие изучению, берутся через определенный, заранее установленный интервал. Например, из всех оврагов изучаемой территории может быть выбран каждый пятый или десятый. 2.4. Серийный отбор (или гнездовой) производится путем деления генеральной совокупности на части (серии), после чего внутри отобранных серий (гнезд) производится сплошное наблюдение. Так, чтобы не изучать всю территорию, ее разбивают на равные площадки и по одному из вышеописанных способов выбирают для последующего сплошного обследования несколько площадок. Участки, типичные для изучаемого географического района, часто называют «ключами». На практике различные способы отбора могут применяться в сочетании друг с другом. Географ-исследователь должен уметь выбрать наиболее подходящий способ в зависимости от конкретных условий. Следует учесть, что часть никогда не может абсолютно точно охарактеризовать целое, поэтому характеристики генеральной совокупности будут отличаться от характеристик, полученных по выборочным данным. Точность во многом зависит от объема выборки (n), однако большое количество наблюдений соответственно увеличивает объем измерительных и вычислительных работ.
3. Способы получения количественной информации. Географы могут получать количественные характеристики предметов и явлений самыми различными способами. По месту рабочего цикла эти способы подразделяются на полевой, камеральный и лабораторный. 3.1. Полевой способ обеспечивает исследователя конкретными и свежими данными. Он подразделяется на экспедиционный, стационарный и дистанционный. Объектом экспедиционных исследований являются главным образом те явления, которые заметно изменяются в пространстве и медленно во времени. К ним можно отнести рельеф земной поверхности, геологию, строение почвы, растительность и животный мир. Гидротермические явления сильно изменяются во времени (по дням, месяцам, годам) и поэтому требуют стационарных наблюдений на метеостанциях, гидропостах и т.д. Физико-географические стационары очень нужны для изучения взаимодействия природных явлений друг с другом и влияния на них антропогенных воздействий. Современные экспедиции и стационары используют различную измерительную технику: геодезические приборы, анероиды, горные компасы, буры, калориметры, лоты, вертушки, термометры, барометры и т.д. Все они дают в руки исследователя весьма ценный по разнообразию и объему количественный материал. Прогресс человечества немыслим без получения новой информации, которая в большинстве своем заключается в измерениях. Недаром великий русский ученый Д.И. Менделеев назвал измерения воздухом науки. Возникли проблемы повышения остроты восприятия измерительных приборов, быстроты и дешевизны измерений. К полевому способу следует отнестидистанционные измерения -измерения «на расстоянии», без непосредственного контакта с самим объектом. Для этого используют различные воспринимающие устройства, способные представить данные о форме, размере, температуре и других физических и химических свойствах изучаемых объектов. Чаще применяют следующие приборы: гравиметры, магнитометры, аудиометры; приборы, использующие электромагнитные волны. Электромагнитные приборы подразделяются на два класса: 1) пассивные, измеряющие падающую и отраженную энергию источника (радиометры и др.); 2) активные, требующие искусственного облучения объектов исследования волнами особых длин (действующих по принципу радаров). Объекты исследуются облучением электромагнитных волн различных спектров. Инфракрасную тепловую радиацию можно воспринимать в двух окнах спектра днем и ночью, через дымку и туман. В пределах длинноволнового электромагнитного спектра имеется несколько окон, свободных от атмосферных помех, где возбуждаемая радиация может быть обнаружена высокочувствительными приборами, применяемыми в радиоастрономии (изучаются процессы, происходящие в ледовом, снежном или почвенном покрове, получают данные о влажности почв, плотности посевов, температуре поверхностных вод, толщине льда). Радарные установки воспринимают размеры и очертания объектов, их плотность, влажность и другие данные (днем, ночью, в непогоду). Сфера приложения приборов дистанционного восприятия - изучение энергетических и водньк ресурсов, их морфологии, климата, растительности, почвенного покрова, расселения людей, транспорта, процессов урбанизации и т.д. Важно уметь интерпретировать громадную информацию, получаемую с помощью этих приборов. 3.2. Камеральный способ получения данных предусматривает использование в кабинетных условиях картографических, аэро- и космических снимков, литературных, фондовых и архивных материалов, Следует особо остановиться на роли географических карт в получении количественной информации. Ценность карты заключается в ее способности дать количественную характеристику предметов и явлений, распространенных на больших территориях. Изучением и разработкой методов измерений по картам занимаетсякартометрия - один из важнейших разделов картографической науки. По топографическим картам можно получить достаточно точные данные о расстояниях, длинах, площадях, объемах форм земной поверхности, абсолютных и относительных высотах, крутизне склонов. В последнее время в круг своих интересов картометрия стала включать получение количественных характеристик и не топографического свойства. Поток ценной и разнообразной количественной информации значительно возрастает с использованием тематических карт, где объекты и явления изображаются значками, точечным способом, линиями движения, изолиниями, картограммами, картодиаграммами и другими способами. Например, по размеру значков можно определить количество жителей в населенных пунктах, объем капитальных вложений в строительство, по картам изолиний - климатические показатели в любом месте, картограмма дает возможность найти количественные показатели валового сбора зерна, картодиаграмма - численность врачей и число коек по отдельным административным единицам. Замечательными источниками разнообразных сведений о Земле являются аэро- и космические снимки. По аэросъемочным материалам с помощью современной фотограмметрической техники географ-исследователь может получить объективные количественные данные о рельефе, растительности, почве. Сопоставление аэроснимков разных лет позволяет определить динамику явлений (например, изменение площадей, занятых лесами; рост оврагов). В экономико-географических исследованиях незаменимым источником получения количественной информации является система государственной отчетности предприятий, акционерных обществ, районов, областей, республик. Эта система охватывает все области хозяйственной и культурной жизни государства. 3.3. Лабораторный способ получения количественных показателей весьма перспективен в географии. Воспроизведение природных процессов (например, инфильтрации, смыва и т.д.) в лабораторных условиях позволяет изолировать изучаемые показатели от второстепенных и случайных процессов, благодаря чему они познаются несравненно глубже. Например, на скорость роста оврагов влияют морфометрические характеристики водосборов, грунт, растительность и ряд других известных и неизвестных факторов, которые в природе сложно взаимосвязаны. Чтобы изучить зависимость овражной эрозии только от угла наклона площади водосбора, в лабораторных условиях на макете (лотке) можно искусственно повышать угол наклона с сохранением остальных факторов на одном количественном уровне. В полевых условиях было бы весьма трудно, а, вернее, невозможно найти овраги с равными условиями роста, кроме углов наклона площадей водосбора. 4. Сущность и вид группировок. Математико-статистическая обработка данных часто начинается с группировки, под которой понимают расчленение статистической совокупности на группы, однородные по какому-либо признаку. Для этого среди всей массы элементов статистической совокупности нужно выделить однородные группы, типы и только затем давать им обобщенные характеристики. Так, например, изучая динамику овражной эрозии, можно подразделить овраги по расположению в рельефе на донные, вершинные, склоновые. Затем уже ведется исследование по этим группам. Населенные пункты можно рассматривать не все сразу, а в отдельности - городские и сельские. 4.1. Разновидности группировок. В географии важную роль играет группировка по территориальному признаку. Например, те же овраги подразделяются (группируются) по принадлежности к физико-географи-ческим районам, природным зонам и т.д. Экономические итоговые сведения обычно даются по сетке административного деления. Группировка по временному признаку предполагает расчленение временных рядов на интервалы: часы, дни, недели, месяцы, года, десятилетия. Перед математико-статистическими расчетами часто используется группировка по количественному признаку. Разберем пример такой группировки. В таблице 1 даны длины (L) 25 оврагов в метрах. Таблица 1 – Длины оврагов
Находим по таблице 1 наибольшее и наименьшее значения изучаемого признака (Хmах и Хmin). Оказалось, что самая большая длина оврага – 59 м, самая малая – 17м. Этими двумя числами определяется промежуток вариации признака. Делим промежуток на равные интервалы, например, на 5. Подсчитываем число оврагов в каждом интервале. Эти числа называются частотами (см. табл. 2).
Таблица 2 – Интервальный ряд распределения
Таблица, в которой перечислены интервалы признака и указаны частоты, называется интервальным рядом распределения. Число интервалов группировки зависит от объема совокупности. Их не должно быть чрезмерно много, так как в каждом интервале тогда окажется слишком мало наблюдений для того, чтобы закономерность проявлялась отчетливо; с другой стороны, и слишком малое число интервалов нежелательно, так как теряются существенные особенности распределения. При числе наблюдений от 100 до 500 рекомендуют делить промежуток на 8-16 интервалов. Можно рекомендовать вычисления длин интервалов (d) по Формуле Стерджесса,
На практике лучше руководствоваться таблицей 3. Таблица 3 – Зависимость числа интервалов группировки (m) от объема совокупности (n)
Промежуток вариации признака иногда может делиться не на равные интервалы, особенно тогда, когда в некоторых промежутках малое количество наблюдений. Группировка количественной информации облегчает дальнейший процесс математико-статистической обработки данных. 5. Графическая форма распределения величин. Наряду с табличной формой отображения распределения величин по группам в математической статистике используется более наглядная графическая форма (гистограмма, полигон распределения и кривая распределения). Рассмотрим технику построения гистограммы. Строятся оси координат, По оси абсцисс откладываются границы интервалов, по оси ординат - соответствующие частоты. Высоты столбиков, опирающихся на масштаб интервалов, ограничиваются значениями частот. Полученная фигура называется гистограммой распределения. На рисунке 5.1 с помощью гистограммы показано распределение длин оврагов по данным таблицы 3. Если из середины каждого интервала восстановим ординату до пересечения с частотой и вершины перпендикуляров соединим прямыми линиями, то получим полигон распределения (см. ломаную линию на рисунке 5.2). Рис. 5.1 – Гистограмма распределения оврагов
Более точное представление о закономерности распределения статистического материала дает третий способ изображения интервальных рядов в виде плавной кривой, называемой кривой распределения. Построение кривых требует сложных математических расчетов. В географических исследованиях они часто проводятся на глаз плавной кривой по точкам вершин перпендикуляров.
Рис. 5.2 – Полигон и кривая распределения
Таким образом, кривая распределения является сглаженным полигоном (см. пунктирную кривую линию на рисунке 5.2), а полигон — сглаженной гистограммой. Анализ графиков распределения (изучение их максимумов и минимумов, пологих и крутых участков) представляет большой интерес для исследователя. Из рассмотрения гистограммы, полигона распределения и кривой распределения (рис. 5.1 и 5.2) можно заключить, что в изучаемом районе преобладают овраги длиной от 30 до 40 м. Коротких (до 20 м) и длинных (свыше 50 м) оврагов значительно меньше. В экспериментальных исследованиях широко распространен сравнительный анализ кривых распределения. Географ часто сравнивает кривые, характеризующие одни и те же явления на разных территориях. Например, сопоставляя кривые распределения длин оврагов в нескольких физико-географических районах, можно обнаружить, в каком районе овраги длиннее, в каком короче, сравнить максимальные и минимальные значения длин, найти различия в частоте оврагов одной и той же протяженности. Если кривые окажутся сходными, можно предполагать наличие примерно одинаковых условий овражной эрозии. Выделим следующие виды распределений в конечном промежутке (а, б). 5.1. Нормальное («колоколообразное») (рис. 5.3).
Рис. 5.3 – Нормальное распределение
Средние значения количественных признаков встречаются чаще, чем малые и большие. Такие распределения характерны для количественных показателей климата (температуры, осадков) по временным интервалам и для биологических особей (размеры зерен, рост человека, длина его ступни). Кроме симметричных кривых распределения, существуют и асимметричные. В географических исследованиях более типичны показательное и равномерное распределения. 2. Показательное (рис. 5.4). Наибольшая частота соответствует наименьшему значению признака. С ростом х частота убывает. Примеры: распределение длин оврагов, людности населенных пунктов и др. 3. Равномерное (рис. 5.5). Частота во всех интервалах примерно одинаковая. Следовательно, кривая здесь становится близкой к прямой. ВОПРОСЫ И ЗАДАНИЯ
Дайте определение следующих терминов и понятий: 1. Статистическая совокупность; 2. Элементы и объем статистической совокупности; 3. Количественные признаки; 4. Пространственные и временные ряды; 5. Статистические наблюдения; 6. Генеральная и выборочная совокупности; 7. Репрезентативность выборки; 8. Случайный повторный отбор; 9. Случайный бесповторный отбор; 10. Механический отбор; 11. Серийный отбор; 12. Полевой способ получения количественной информации; 13. Дистанционные измерения; 14. Камеральный способ получения количественной информации; 15. Лабораторный способ получения количественной информации; 16. Группировка данных по территориальному признаку; 17. Группировка данных по временному признаку; 18. Группировка данных по количественному признаку; 19. Интервальный ряд распределения; 20. Гистограмма; 21. Полигон распределения: 22. Кривая распределения; 23. Нормальное распределение; 24. Показательное распределение; 25. Равномерное распределение;
Лекция № 5 Популярное:
|
Последнее изменение этой страницы: 2016-03-25; Просмотров: 926; Нарушение авторского права страницы