Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Этапы психологического исследования.



1. Подготовительный (изучение состояния проблемы, определение задач, вопроса и рабочей гипотезы исследования, подбор или разработка методик).

2. Собственно исследование (сбор фактических данных, обеспечивающих достоверность выводов, для этого применяются различные методы. Может разделяться на ряд этапов – серий).

3. Обработка данных (количественная обработка данных исследования, определение средних величин, меры рассеивания данных, коэффициентов корреляции и др., построение графиков).

4. Интерпретация данных и формулирование выводов.

 

 

Измерения и статистические способы обработки их результатов в психологическом исследовании.

 

Результаты и их обсуждение. Обсуждение полученных данных начинается с их описания. Описание должно быть предельно строгим, т.е. содержать в себе только факты с их качественными (есть – нет) или количественными характеристиками (сколько, как часто и пр.). Наиболее удобный вид их представления – таблицы, каждая из которых должна иметь свой номер и название. Кроме табличной формы представления количественных данных можно использовать также: а) диаграммы; б) графики для представления характера функциональной зависимости между величинами (переменными); в) корреляционные плеяды для отображения корреляционных связей между выделенными параметрами и т.д.

В словесном описании результатов наблюдения и эксперимента трудно избежать элементов субъективизма, которые проявляются чаще всего в преждевременных выводах и необоснованных обобщениях. Известно, что качественное описание является недостаточно точным, поскольку с помощью языковых средств сложно передать дифференцированность изучаемых явлении и особенно своеобразие их динамики. Одно только качественное описание не позволяет определить также и степень ошибки наблюдения или эксперимента. Но это вовсе не означает, что в психологии необходимо отказаться от качественного анализа в пользу оперирования исключительно количественными показателями. Мы хотим подчеркнуть лишь то обстоятельство, что количественный анализ результатов исследования должен не только предшествовать, но и обязательно следовать за качественным анализом.

Это особенно важно для интерпретации результатов экспериментального исследования. Именно таким образом может быть преодолен субъективизм, так как формулируемые суждения и выводы становятся более независимыми от личности исследователя и обеспечивается возможность их проверки. Знание различных приемов обработки и анализа результатов наблюдений и эксперимента с помощью статистических показателей является обязательным для психолога. Однако следует иметь в виду, что знакомство с материалом данного раздела не может заменить студенту систематического изучения математической статистики. Нами будут рассмотрены лишь элементарные статистические методики, без которых нельзя обойтись на практических занятиях по общей и экспериментальной психологии.

Процесс измерения лежит в основе любой эмпирической науки. Беглый взгляд на историю науки показывает, что совершенствование принципов и техники измерения было основным фактором, обеспечивающим ее движение вперед. Самого высокого уровня развития на сегодняшний день достигли те ее области, которым быстрее удалось преодолеть трудности, связанные с разработкой методологических и методических проблем измерения. Это заставляет предполагать, что и будущее психологии как науки в большей мере зависит от успешного решения ее собственных, специфических вопросов измерения. Именно поэтому «математизация» современной психологии распространяется на все ее разделы и дисциплины без какого-либо исключения. В этом смысле психология в ближайшем будущем может стать математической в такой же мере, в какой она уже является экспериментальной наукой.

Приступая к выбору методики, экспериментатор должен иметь четкое представление о том, что именно он хочет измерить и удовлетворят ли результаты измерения требованиям адекватного решения исследовательской или практической задачи. В первую очередь ему надлежит доказать валидность, надежность и объективность избранной методики. Под валидностью методики понимается адекватность ее предмету исследования. Количественно валидность определяется путем установления взаимосвязи между результатами, полученными с помощью данной методики, и каким-либо из внешних критериев. Поясним сказанное примером. Очевидно, что успешность обучения в какой-то степени обусловлена уровнем интеллектуального развития обучаемого, и поэтому в качестве внешнего критерия правомерно рассматривать оценку его успеваемости. Допустим, что было проведено тестовое исследование умственного развития группы лиц, например студентов, с помощью избранной методики. Так вот, применяемая методика может считаться валидной лишь в том случае, если между результатами тестирования и оценкой успеваемости в обучении будет обнаружена положительная взаимосвязь. Не менее важным аспектом оценки качества методики является ее надежность. Под надежностью психологической методики понимается точность производимых с ее помощью измерений. Иначе говоря, через надежность определяется пригодность данной методики в качестве измерительного инструмента. Наконец, объективность методики характеризует степень независимости результатов измерения от пользователя данной методики. Объективными результаты будут лишь в том случае, если, во-первых, они независимы от личностных особенностей пользователя и, во-вторых, исключен произвол в их обработке и интерпретации.

Для проверки валидности и надежности методик чаще всего привлекаются количественные (статистические) критерии оценки. Объективность методики можно обосновать исходя из положений общей теории измерений и специфики их в отношении психологического исследования. Конечно, это вовсе не означает, что психологическое исследование исчерпывается измерением. Однако знание разнообразных измерительных процедур вооружает психолога исследовательским инструментом, с помощью которого он способен решать психологические задачи.

Типы измерительных шкал. С точки зрения теории измерения, все множество различных измерительных процедур, применяемых в психологии, является процедурами построения шкалы психологической переменной, иначе говоря, процедурами психологического шкалирования. В понимании большинства психологов шкалирование - это совокупность экспериментальных и математических приемов для измерения особенностей психических процессов и состояний. В настоящее время понятие «шкалирование» рассматривают в качестве синонима понятия «измерение». Под шкалированием психологических процессов, свойств, объектов или событий понимается процесс приравнивания к этим процессам, свойствам, объектам или событиям чисел по определенным правилам, а именно таким образом, чтобы в отношениях чисел отображались отношения явлении, подлежащих измерению. Если постулируется, что в свойствах чисел отображаются количественные значения объектов реального предметного мира, то общую проблематику шкалирования правомерно рассматривать как частный случай проблемы отражения диалектико-материалистической теории познания.

Итак, измерение состоит в отображении эмпирических систем с помощью математических систем, а целью такого рода отображения является частичная замена действий, производимых с реальными предметами, формальными действиями с числами. Область чисел выполняет функцию модели определенных свойств предметов и в качестве средства познания дает возможность более глубоко проникать в объективно существующие свойства и взаимосвязи. В этом смысле шкалирование (измерение) служит главной силой, преобразующей психологию из науки описательной, следующей за фактами, в науку, умеющую предсказывать новые факты.

Понятно, что относительно разных эмпирических систем мы должны использовать разные методики измерения, т. е. применять измерительные шкалы разных типов. Понимание исследователем формальных аспектов измерения является необходимым условием для адекватного выбора им измерительных инструментов и процедур, а также для применения адекватных методов анализа полученных в наблюдении и эксперименте данных. Основываясь на правилах измерения, принято различать несколько типов шкал, с каждым из которых могут быть соотнесены конкретные процедуры шкалирования. При этом каждый тип шкалы может быть охарактеризован соответствующими числовыми свойствами. Рассмотрим более подробно основные свойства разных типов шкал, эмпирические операции, допустимые на уровне этих шкал, а также статистические приемы обработки и анализа исходных или, как их чаще называют, первичных результатов исследования.

Существует четыре типа изме­рительных шкал (или способов измерения):

1) номинативная или шкала наименований;

2) порядковая, ординарная или ранговая шкала;

3) интервальная или шкала равных интервалов;

4) шкала равных отношений, или шкала отношений.

Процесс присвоения количественных (числовых) значений, имеющейся у исследователя информации, называется кодирова­нием. Иными словами – кодирование это такая операция, с по­мощью которой экспериментальным данным придается форма числового сообщения (кода).

Применение процедуры измерения возможно только четырь­мя вышеперечисленными способами. Причем каждая измери­тельная шкала имеет собственную, отличную от других форму числового представления, или кода. Поэтому закодированные признаки изучаемого явления, измеренные по одной из назван­ных шкал, фиксируются в строго определенной числовой систе­ме, определяемой особенностями используемой шкалы. Измере­ния, осуществляемые с помощью двух первых шкал, считаются качественными, а осуществляемые с помощью двух последних шкал – количественными .

Специфические особенности измерительных шкал обязатель­но должны учитываться при получении экспериментального ма­териала в прикладных исследованиях.

Измерение в номинативной шкале (номинальной, или шка­ле наименований) состоит в присваивании какому-либо свой­ству или признаку определенного обозначения или символа (численного, буквенного и т.п.). По сути дела, процедура изме­рения сводится к классификации свойств, группировке объек­тов, к объединению их в классы, группы при условии, что объекты, принадлежащие к одному классу, идентичны (или ана­логичны) друг другу в отношении какого-либо признака или свойства, тогда как объекты, различающиеся по этому призна­ку, попадают в разные классы.

Иными словами, при измерениях по этой шкале осуществля­ется классификация или распределение объектов (например, осо­бенностей личности) на непересекающиеся классы, группы. Таких непересекающихся классов может быть несколько. Классичес­кий пример измерения по номинативной шкале в психологии – разбиение людей по четырем темпераментам: сангвиник, холе­рик, флегматик и меланхолик.

Номинальная шкала определяет, что разные свойства или признаки качественно отличаются друг от друга, но не подразу­мевает каких-либо количественных операций с ними.

Единица измерения, которой мы оперируем в случае номи­нативной шкалы, – это количество наблюдений (испытуемых, свойств, реакций и т.п.). Общее число наблюдений (респонден­тов и т.п.) принимается за 100%, и тогда мы можем вычислить процентное соотношение, например, мальчиков и девочек в классе. Если же количество групп разбиения больше чем две, то также можно подсчитать процентный состав испытуемых (рес­пондентов) в каждой группе. Кроме того, мы можем найти группу, в которой число рес­пондентов наибольшее, т.е. группу с наибольшей частотой изме­ренного признака. Эта группа носит название моды.

Измерение по порядковой (ранговой, ординарной) шкале расчленяет всю совокупность из­меренных признаков на такие множества, которые связаны меж­ду собой отношениями типа «больше – меньше», «выше – ниже», «сильнее – слабее» и т.п. Если в предыдущей шкале было несущественно, в каком порядке располагаются измеренные признаки, то в порядковой (ранговой) шкале все признаки распо­лагаются по рангу – от самого большего (высокого, сильного, умного и т.п.) до самого маленького (низкого, слабого, глупого и т.п.) или наоборот.

Типичный и очень хорошо известный всем пример порядко­вой шкалы – это школьные оценки: от 5 до 1 балла; судейство в некоторых видах спорта или зрелищных про­граммах (КВН, ДОГ-ШОУ и др.), которые также представляют собой вариант ранжирования. Числа в ранговых шкалах обо­значают лишь порядок следования признаков, а операции с чис­лами в этой шкале – это операции с рангами.

В шкале интервалов, или интервальной шкале, каждое из воз­можных значений измеренных величин отстоит от ближайшего на равном расстоянии. Главное понятие этой шкалы – интервал, который можно определить как долю или часть измеряемого свойства между двумя соседними позициями на шкале. Размер интервала – величина фиксированная и постоянная на всех уча­стках шкалы. Для измерения посредством шкалы интервалов ус­танавливаются специальные единицы измерения; в психологии это стены и стенайны. При работе с этой шкалой измеряемому свойству или предмету присваивается число, равное количеству единиц измерения эквивалентное количеству имеющегося свойства. Важной особенностью шкалы интервалов является то, что у нее нет естественной точки отсчета (нуль условен и не ука­зывает на отсутствие измеряемого свойства).

Только измерение по строго стандартизированной тестовой методике, при условии того, что распределение значений в реп­резентативной (см. ниже) выборке достаточно близко к нормаль­ному (см. ниже), может считаться измерением в интервальной шкале. Примером последнего могут служить стандартизованные тесты интеллекта, где условная единица измерения IQ эквивален­тна как при низких, так и при высоких значениях интеллекта.

Особенностью шкалы отношений (шкалы равных отноше­ний) является наличие твердо фикси­рованного нуля, который означает полное отсутствие какого-либо свойства или признака. Шакала отношений является наибо­лее информативной шкалой, допускающей любые математичес­кие операции и использование разнообразных статистических методов. Шкала отношений по сути очень близка интервальной, по­скольку если строго фиксировать начало отсчета, то любая ин­тервальная шкала превращается в шкалу отношений. Именно в шкале отношений производятся точные и сверх­точные измерения в таких науках, как физика, химия, микро­биология и др. Измерение по шкале отношений производятся и в близких к психологии науках, таких, как психофизика, психо­физиология, психогенетика.

Формы учета результатов измерений. Для наглядного представления экспериментальных данных используются различные приемы, облегчающие прежде всего визуальный анализ полученной в эксперименте информации. К таким приемам относят таблицы, ряды распределений, графи­ки, гистограммы. Их применяют с той целью, чтобы полученные экспериментальные данные представить наглядным образом и можно было бы в явной форме увидеть характерные особеннос­ти и результаты эксперимента.

Первичный экспериментальный материал, полученный пси­хологом, нуждается в соответствующей обработке. Обработка на­чинается с упорядочения и систематизации собранных данных. Процесс систематизации результатов эксперимента, объедине­ние их в относительно однородные группы по некоторому при­знаку называется группировкой.

Группировка – это не просто технический прием, позволя­ющий представить первичные данные в ином виде, но, прежде всего, такая операция, которая позволяет глубже выявить связи между изучаемыми явлениями. От того, как группируется исход­ный материал, во многих случаях зависят выводы о природе изу­чаемого явления. Поэтому группировка должна быть обдуман­ной, отвечать требованию поставленной задачи и соответство­вать содержанию изучаемого явления.

Таблицы. Наиболее распространенной формой группировки экспери­ментальных данных являются статистические таблицы. Таблицы бывают простыми и сложными. К простым относятся таблицы, применяемые при альтернативной группировке, когда одна группа испытуемых противопоставляется другой; например, здо­ровые – больным, высокие люди – низким и т.п.

Таблица 1. Распределение праворуких и леворуких детей по классам.

Классы Праворукие Леворукие Сумма
Суммы

Из таблицы хорошо видно, что леворуких учащихся боль­ше в пятых классах школы, и меньше – в третьих.

Простые таблицы рекомендуется использовать, когда изме­рение изучаемых признаков производится в номинативной или ранговой шкале. Усложнение таблиц происходит за счет возрастания объема и степени дифференцированности представленной в них информа­ции. К сложным таблицам относят так называемые многопольные таблицы, которые могут использоваться при выяснении при­чинно-следственных отношений между варьирующими признака­ми. Такие таблицы, как правило, имеют сложное строение, по­зволяющее одновременно осуществлять разные варианты группи­ровки данных. Примером сложной таблицы служит, в которой представлены классические данные Ф. Гальтона, иллюст­рирующие наличие положительной зависимости между ростом родителей и их детей. Таблица организована таким образом, что позволяет оценить частоту встречаемости в популяции однознач­но фиксируемых соотношений роста родителей и роста ребенка. Например, при низком росте родителей в 66 дюймов (1 дюйм ра­вен 2, 54 см) только один из 144 обследованных детей имел рост в 60, 7 дюймов, а 56 детей имели рост 66, 7 дюйма. В то же время вы­сокий рост детей (74, 7 дюйма) был зафиксирован только в тех се­мьях, где родители имели рост не ниже 70 дюймов.

Таблица 2. Рост родителей и детей (в дюймах).

Рост роди­телей Рост детей в дюймах Всего
60, 7 62, 7 64, 7 66, 7 68, 7 70, 7 72, 7 74, 7
             
   
 
 
     
Всего

Эта таблица позволяет выявить тенденцию, заключающуюся в том, что у высоких родителей, как правило, дети имеют высокий рост, а у низкорослых родителей чаще бывают дети невысокого роста. Данный пример показывает, что таблицы имеют не только иллюстративное, но и аналитическое значение, позволяя обнару­живать разные аспекты связей между варьирующими признаками.

Следует запомнить, что правильно составленные таблицы – это большое подспорье в экспериментальной работе, позволяю­щее одновременно осуществлять разные варианты группировки полученных данных.

Статистические ряды. Особую форму группировки данных представляют так назы­ваемые статистические ряды, или числовые значения признака, расположенного в определенном порядке. В зависимости от того, какие признаки изучаются, статисти­ческие ряды делят на атрибутивные, вариационные, ряды дина­мики, регрессии, ряды ранжированных значений признаков и ряды накопленных частот. Наиболее часто в психологии исполь­зуются вариационные ряды, ряды регрессии и ряды ранжированных значений признаков.

Вариационным рядом распределения называют двойной ряд чисел, показывающий, каким образом числовые значения при­знака связаны с их повторяемостью в данной выборке. Напри­мер, психолог провел тестирование интеллекта по тесту Д.Векслера у 25 школьников, и сырые баллы по второму субтесту ока­зались следующими: 6, 9, 5, 7, 10, 8, 9, 10, 8, 11, 9, 12, 9, 8, 10, 11, 9, 10, 8, 10, 7, 9, 10, 9, 11. Как видим, некоторые циф­ры попадаются в данном ряду по несколько раз. Следовательно, учитывая число повторений, данные ряд можно представить в более удобной, компактной форме:

Варианты хi: 6 9 5 7 10 8 11 12

Частоты вариант fi: 1 7 1 2 6 4 3 1

Это и есть вариационный ряд. Числа, показывающие, сколь­ко раз отдельные варианты встречаются в данной совокупности, называются частотами, или весами, вариант. Они обозначаются строчной буквой латинского алфавита f и имеют индекс «i», со­ответствующий номеру переменной в вариационном ряду.

Общая сумма частот вариационного ряда равна объему вы­борки, т.е. n = 1+7+1+2+6+4+3+1 = 25

Частоты можно выражать и в процентах. При этом общая сумма частот или объем выборки принимается за 100%. Процент каждой отдельной частоты или веса подсчитывается по формуле:

n% = f ·100%: n

Процентное представление частот полезно в тех случаях, ког­да приходится сравнивать вариационные ряды, сильно различа­ющиеся по объемам. Например, при тестировании школьной го­товности детей города, поселка городского типа и села были об­следованы выборки детей численностью 1000, 300 и 100 челове­ка соответственно. Различие в объемах выборок очевидно. Поэто­му сравнение результатов тестирования лучше проводить, ис­пользуя проценты частот.

Приведенный выше ряд можно представить по другому. Если элементы ряда расположить в возрастающем порядке, то получится так называемый ранжированный вариационный ряд:

Варианты хi: 5 6 7 8 9 10 11 12

Частоты fi: 1 1 2 4 7 6 3 1

Подобная форма представления более предпочтитель­на, чем предыдущая, поскольку лучше иллюстрирует закономерность варьирования признака.

Понятие распределения и гистограммы. В статистике под рядом распределения понимают распределе­ние частот по вариантам. Измеренные величины признака в выборке варьируют в пределах от минимального до максимального значения. Этот предел разбивают на так называемые классовые интервалы, которые, в зависимости от конкретных данных, мо­гут быть как равными по величине, так и неравными.

Если по оси абсцисс (ОХ) откладывать величины классовых интервалов, а по оси ординат (OY) величины частот, попадаю­щих в данный классовый интервал, то получается так называе­мая гистограмма распределения частот. При этом над каждым классовым интервалом строится колонка или прямоугольник, площадь которого оказывается пропорциональной соответствую­щей частоте. Гистограмма представляет собой графическое изоб­ражение данного частотного распределения.

Числовые характеристики распределений. Для экспериментальных данных, полученных по выборке, можно вычислить ряд числовых характеристик (мер).

Разброс выборки. Разброс (иногда эту величину называют размахом ) выборки обозначается буквой R. Это самый простой показатель, который можно получить для выборки – разность между максимальной и минимальной величинами данного конкретного вариационного ряда, т.е. R = Хмах – Хмin. Понятно, что чем сильнее варьирует измеряемый признак, тем больше величина R, и наоборот. Однако может случиться так, что у двух выборочных рядов и средние, и размах совпадают, однако характер варьирования этих рядов будет различный. Например, даны две выборки:

X = 10; 15; 20; 25; 30; 35; 40; 45; 50; X = 30; R = 40

Y = 10; 28; 28; 30; 30; 30; 32; 32; 50; Y = 30; R = 40

При равенстве средних и разбросов для этих двух выборочных рядов характер их варьирования различен. Для того чтобы более четко представлять характер варьирования выборок, следует об­ратиться к их распределениям.

Мода. Числовой характеристикой выборки, как правило, не требу­ющей вычислений, является так называемая мода. Мода – это такое числовое значение, которое встречается в выборке наибо­лее часто. Так, например, в ряду значений (2, 6, 6, 8, 9, 9, 9, 10) мо­дой является 9, потому что 9 встречается чаще любого другого числа. Обратите внимание, что мода представляет собой наибо­лее часто встречающееся значение (в данном примере это 9), а не частоту встречаемости этого значения (в данном примере рав­ную 3).

Моду находят согласно следующим правилам:

1) В том случае, когда все значения в выборке встречаются одинаково часто, принято считать, что этот выборочный ряд не имеет моды. Например: 5, 5, 6, 6, 7, 7 – в этой выборке моды нет.

2) Когда два соседних (смежных) значения имеют одинако­вую частоту и их частота больше частот любых других зна­чений, мода вычисляется как среднее арифметическое этих двух значений.

Например, в выборке 1, 2, 2, 2, 5, 5, 5, 6 частоты рядом расположенных значений 2 и 5 совпадают и равняются 3. Эта частота больше, чем частота других значений 1 и 6 (у которых она равна 1). Модой этого ряда будет величина: (2+5): 2 = 3, 5

3) Если два несмежных (не соседних) значения в выборке имеют равные частоты, которые больше частот любого другого значения, то выделяют две моды. Например, в ряду 10, 11, 11, 11, 12, 13, 14, 14, 14, 17 модами явля­ются значения 11 и 14. В таком случае говорят, что выбор­ка является бимодальной.

Могут существовать и так называемые мультимодальные рас­пределения, имеющие более двух вершин (мод).

4) Если мода оценивается по множеству сгруппированных данных, то для нахождения моды необходимо определить группу с наибольшей частотой признака. Эта группа на­зывается модальной группой.

Медиана – обозначается Md и опреде­ляется как величина, по отношению к которой по крайней мере 50% выборочных значений меньше неё и по крайней мере 50% – больше. Можно дать второе определение, сказав, что медиана – это значение, которое делит упорядоченное множество данных пополам.

Задача 1. Найдем медиану выборки: 9, 3, 5, 8, 4, 11, 13.

Решение. Сначала упорядочим выборку по величинам вхо­дящих в нее значений. Получим: 3, 4, 5, 8, 9, 11, 13. Поскольку в выборке семь элементов, четвертый по порядку элемент будет иметь зна­чение большее, чем первые три, и меньшее, чем последние три. Таким образом, медианой будет четвертый элемент – 8.

Задача 2. Найдем медиану выборки: 20, 9, 13, 1, 4, 11.

Решение. Упорядочим выборку: 1, 4, 9, 11, 13, 20. Поскольку здесь имеется четное число элементов, то существует две «середины» – 9 и 11. В этом случае медиана определяется как среднее арифме­тическое этих значений.

Среднее арифметическое ряда из n числовых значений X1, X2, ...Хn обозначается X и подсчитывается как: Х = Σ (Хn): n,

Следует подчеркнуть, что средние величины характеризуют выборку одним (средним) числом. Преимущество, или иначе, информативная значимость, средних величин заключается в их способности аккумулировать или уравновешивать все индивиду­альные отклонения, в результате чего проявляется то наиболее устойчивое и типичное, что характеризует качественное своеоб­разие варьирующего объекта, позволяя отличить одну выборку от другой, а на этой основе, например, одно измеренное психо­логическое свойство от другого.

Однако среднее как статистический показатель не лишено недостатков. Так, например, при вычислении среднего количе­ства ошибок при выполнении корректурной пробы может быть получена величина равная 1, 3 ошибки или при определении среднего числа учеников, обучающихся в пятых классах данной школы, может быть получена величина равная 30, 07. Конечно, с точки зрения статистика эти величины обычны, но для психо­логических задач они могут быть неприемлемы.

Кроме того, среднее оказывается достаточно чувствительным к очень маленьким или очень большим величинам, отличаю­щимся от основных значений измеренных характеристик. Приве­дем пример из книги Дж. Б. Мангейма и Ричарда К. Рича: «Поли­тология. Методы исследования». - М., 1997 г. «Пусть 9 человек име­ют доход от 4500 до 5200 тыс. долларов в месяц. Величина их среднего дохода равняется 4900 долларов. Если же к этой группе добавить человека, имеющего доход в 20000 тыс. долларов в ме­сяц, то средняя всей группы сместится и окажется равной 6410 долларов, хотя никто из всей выборки (кроме одного человека) реально не получает такой суммы. Понятно, что аналогичное смещение, но в противоположную сторону можно получить и в том случае, если добавить в эту группу человека с очень малень­ким годовым доходом».

Важно подчеркнуть, что подобные крайние величины, т.е. те, которые существенно искажают величину средней, оказываются в то же время и наименее характерными для изучаемой генеральной совокупности. Именно поэтому в статистике, кроме средней величины, используются и другие характеристики «типичных значений» выборки, такие, как мода, медиана и ряд других ха­рактеристик.

Дисперсия. Рассмотрим еще одну очень важную числовую характеристи­ку выборки, называемую дисперсией. Дисперсия представляет со­бой наиболее часто использующуюся меру рассеяния случайной величины (переменной). Дисперсия это среднее арифметическое квадратов отклонений значений переменной от её среднего зна­чения.

Σ (Хi – Х)2

D = ------------------,

n - l

где n – объем выборки, i – индекс суммирования; X – среднее, вычисляемое по формуле.

Пример. Вычислим дисперсию ряда: 2, 4, 6, 8, 10

Прежде всего, найдем среднее ряда. Оно равно X = 6.

Рассмотрим величины: (Хi – X) для каждого элемента ряда. Иными словами, из каждого элемента ряда вычтем величину среднего этого ряда. Полученные величины характеризуют то, насколько каждый элемент отклоняется от средней величины в данном ряду. Обозначим полученную совокупность разностей как множество Т. Тогда Т есть:

Т = (2 - 6 = -4; 4 - 6 = -2; 6 - 6 = 0; 8 - 6 = 2; 10 - 6 = 4).

Так образуется новый ряд чисел. Его особенность в том, что при сложении этих чисел обязательно получится ноль. Прове­рим: (-4) + (-2) + 0 + 2 + 4 = 0.

Отметим, что сумма такого ряда Σ (Xi – X) всегда будет равна нулю. Для того чтобы избавиться от нуля, каждое значение разно­сти (Xi – X) возводят в квадрат, все их суммируют и затем делят на число элементов, т.е. применяют формулу 4.4. В нашем приме­ре получится следующее:

D = 16 + 4 + 0 + 4 + 16 = 40. Это и есть искомая дисперсия.

Общий алгоритм вычисления дисперсии для одной выборки следующий:

1. Вычисляется среднее по выборке.

2. Для каждого элемента выборки вычисляется его отклонение от средней, т.е. получается множество Т.

3. Каждый элемент множества Т возводят в квадрат.

4. Находится сумма этих квадратов.

5. Эта сумма, как и в случае вычисления среднего, делится на общее количество членов ряда – n. В ряде случаев, особенно когда величина выборки мала, деление осуществляется не на величину n, а на величину n – 1.

Величина, получающаяся после пятого шага, и есть искомая дисперсия. Расчет дисперсии для таблицы чисел осуществляется по фор­муле:

Σ Σ (Хij – Х)2

D = ------------------,

N - l

где Хij – значения всех переменных, полученных в эксперименте, или все элементы таблицы; индекс j меняется от 1 до р, где р число столбцов в таб­лице, а индекс i меняется от 1 до n, где n – число ис­пытуемых или число строк в таблице; X – общая средняя всех элементов таблицы; N – общее число всех элементов в таблице (анализируемой совокупности экспериментальных данных) и в общем случае N = р • n.

Дисперсию для генеральной совокупности принято обозна­чать как σ 2, а дисперсию выборки как Sх, причем индекс х обо­значает, что дисперсия характеризует варьирование числовых значений признака вокруг их средней арифметической.

Преимущество дисперсии перед размахом в том, что диспер­сию можно представить как сумму ряда чисел (согласно ее определению), т.е. разложить на составные компоненты, позволяя тем самым более подробно охарактеризовать исходную выборку. Важная характеристика дисперсии заключается также и в том, что с её помощью можно сравнивать выборки, различные по объему.

Однако сама дисперсия, как характеристика отклонения от среднего, часто, неудобна для интерпретации. Так, например, предположим, что в эксперименте измерялся рост в сантимет­рах, тогда размерность дисперсии будет являться характеристи­кой площади, а не линейного размера (поскольку при подсчете дисперсии сантиметр возводится в квадрат).

Для того чтобы приблизить размерность дисперсии к размер­ности измеряемого признака применяют операцию извлечения квадратного корня из дисперсии. Полученную величину называ­ют стандартным отклонением.

Степень свободы. Число степеней свободы это число свободно варьирующих единиц в составе выборки. Так, если вся выборка состоит из n элементов и характеризуется средней X, то любой элемент этой совокупности может быть получен как разность между величи­ной n • X и суммой всех остальных элементов, кроме самого это­го элемента.

Пример. Рассмотрим ряд: 2 4 6 8 10. Мы помним, что сред­няя этого ряда равна 6. В этом ряду 5 чисел, следовательно N = 5. Предположим, что мы хотим получить последний элемент ряда 4.5 – 10, зная все предыдущие элементы и среднее этого ряда. Тогда:

5 • 6 – 2 – 4 – 6 – 8 = 10

Предположим, что мы хотим получить первый элемент ряда - 2, зная все последующие элементы и среднее этого ряда. Тогда: 5 • 6 – 4 – 6 – 8 – 10 = 2 и т.д.

Следовательно, один элемент выборки не имеет свободы ва­риации и всегда может быть выражен через другие элементы и среднее. Это означает, что число степеней свободы у выборочно­го ряда обозначаемое в таких случаях символом k будет опреде­ляться как k = n - 1, где n – общее число элементов ряда (вы­борки).

При наличии не одного, а нескольких ограничений свободы вариации, число степеней свободы, обозначаемое как v (гречес­кая буква ню) будет равно v = n - k, где k соответствует числу ограничений свободы вариации. В общем случае для таблицы экспериментальных данных число степеней свободы будет определяться по следующей формуле: v = (с - 1) • (n - 1), где с – число столбцов, а n – число строк (число испытуемых).

Следует подчеркнуть, однако, что для ряда статистических методов расчет числа степеней свободы имеет свою специфику.

Понятие нормального распределения. Нормальное распределение играет большую роль в математи­ческой статистике, поскольку многие статистические методы предполагают, что, анализируемые с их помощью эксперимен­тальные данные распределены нормально. График нормального распределения имеет вид колоколообразной кривой (см. рис.).

Его важной особенностью является то, что форма и положение графика нормального распределения определяется только двумя параметрами: средней μ (мю) и стандартным отклонением σ (сиг­ма). Если стандартное отклонение σ постоянно, а величина сред­ней μ меняется, то собственно форма нормальной кривой оста­ется неизменной, а лишь ее график смещается вправо (при уве­личении μ ) или влево (при уменьшении μ ) по оси абсцисс – ОХ. При условии постоянства средней μ изменение сигмы влечет за собой изменение только ширины кривой: при уменьшении сигмы кривая делается более узкой, и поднимается при этом вверх, а при увеличении сигмы кривая расширяется, но опуска­ется вниз. Однако во всех случаях нормальная кривая оказывает­ся строго симметричной относительно средней, сохраняя пра­вильную колоколообразную форму.


Поделиться:



Последнее изменение этой страницы: 2017-03-14; Просмотров: 1032; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.076 с.)
Главная | Случайная страница | Обратная связь