Этапы психологического исследования.

⇐ ПредыдущаяСтр 2 из 23Следующая ⇒

1. Подготовительный (изучение состояния проблемы, определение задач, вопроса и рабочей гипотезы исследования, подбор или разработка методик).

2. Собственно исследование (сбор фактических данных, обеспечивающих достоверность выводов, для этого применяются различные методы. Может разделяться на ряд этапов – серий).

3. Обработка данных (количественная обработка данных исследования, определение средних величин, меры рассеивания данных, коэффициентов корреляции и др., построение графиков).

4. Интерпретация данных и формулирование выводов.

Измерения и статистические способы обработки их результатов в психологическом исследовании.

Результаты и их обсуждение. Обсуждение полученных данных начинается с их описания. Описание должно быть предельно строгим, т.е. содержать в себе только факты с их качественными (есть – нет) или количественными характеристиками (сколько, как часто и пр.). Наиболее удобный вид их представления – таблицы, каждая из которых должна иметь свой номер и название. Кроме табличной формы представления количественных данных можно использовать также: а) диаграммы; б) графики для представления характера функциональной зависимости между величинами (переменными); в) корреляционные плеяды для отображения корреляционных связей между выделенными параметрами и т.д.

В словесном описании результатов наблюдения и эксперимента трудно избежать элементов субъективизма, которые проявляются чаще всего в преждевременных выводах и необоснованных обобщениях. Известно, что качественное описание является недостаточно точным, поскольку с помощью языковых средств сложно передать дифференцированность изучаемых явлении и особенно своеобразие их динамики. Одно только качественное описание не позволяет определить также и степень ошибки наблюдения или эксперимента. Но это вовсе не означает, что в психологии необходимо отказаться от качественного анализа в пользу оперирования исключительно количественными показателями. Мы хотим подчеркнуть лишь то обстоятельство, что количественный анализ результатов исследования должен не только предшествовать, но и обязательно следовать за качественным анализом.

Это особенно важно для интерпретации результатов экспериментального исследования. Именно таким образом может быть преодолен субъективизм, так как формулируемые суждения и выводы становятся более независимыми от личности исследователя и обеспечивается возможность их проверки. Знание различных приемов обработки и анализа результатов наблюдений и эксперимента с помощью статистических показателей является обязательным для психолога. Однако следует иметь в виду, что знакомство с материалом данного раздела не может заменить студенту систематического изучения математической статистики. Нами будут рассмотрены лишь элементарные статистические методики, без которых нельзя обойтись на практических занятиях по общей и экспериментальной психологии.

Процесс измерения лежит в основе любой эмпирической науки. Беглый взгляд на историю науки показывает, что совершенствование принципов и техники измерения было основным фактором, обеспечивающим ее движение вперед. Самого высокого уровня развития на сегодняшний день достигли те ее области, которым быстрее удалось преодолеть трудности, связанные с разработкой методологических и методических проблем измерения. Это заставляет предполагать, что и будущее психологии как науки в большей мере зависит от успешного решения ее собственных, специфических вопросов измерения. Именно поэтому «математизация» современной психологии распространяется на все ее разделы и дисциплины без какого-либо исключения. В этом смысле психология в ближайшем будущем может стать математической в такой же мере, в какой она уже является экспериментальной наукой.

Приступая к выбору методики, экспериментатор должен иметь четкое представление о том, что именно он хочет измерить и удовлетворят ли результаты измерения требованиям адекватного решения исследовательской или практической задачи. В первую очередь ему надлежит доказать валидность, надежность и объективность избранной методики. Под валидностью методики понимается адекватность ее предмету исследования. Количественно валидность определяется путем установления взаимосвязи между результатами, полученными с помощью данной методики, и каким-либо из внешних критериев. Поясним сказанное примером. Очевидно, что успешность обучения в какой-то степени обусловлена уровнем интеллектуального развития обучаемого, и поэтому в качестве внешнего критерия правомерно рассматривать оценку его успеваемости. Допустим, что было проведено тестовое исследование умственного развития группы лиц, например студентов, с помощью избранной методики. Так вот, применяемая методика может считаться валидной лишь в том случае, если между результатами тестирования и оценкой успеваемости в обучении будет обнаружена положительная взаимосвязь. Не менее важным аспектом оценки качества методики является ее надежность. Под надежностью психологической методики понимается точность производимых с ее помощью измерений. Иначе говоря, через надежность определяется пригодность данной методики в качестве измерительного инструмента. Наконец, объективность методики характеризует степень независимости результатов измерения от пользователя данной методики. Объективными результаты будут лишь в том случае, если, во-первых, они независимы от личностных особенностей пользователя и, во-вторых, исключен произвол в их обработке и интерпретации.

Для проверки валидности и надежности методик чаще всего привлекаются количественные (статистические) критерии оценки. Объективность методики можно обосновать исходя из положений общей теории измерений и специфики их в отношении психологического исследования. Конечно, это вовсе не означает, что психологическое исследование исчерпывается измерением. Однако знание разнообразных измерительных процедур вооружает психолога исследовательским инструментом, с помощью которого он способен решать психологические задачи.

Типы измерительных шкал. С точки зрения теории измерения, все множество различных измерительных процедур, применяемых в психологии, является процедурами построения шкалы психологической переменной, иначе говоря, процедурами психологического шкалирования. В понимании большинства психологов шкалирование - это совокупность экспериментальных и математических приемов для измерения особенностей психических процессов и состояний. В настоящее время понятие «шкалирование» рассматривают в качестве синонима понятия «измерение». Под шкалированием психологических процессов, свойств, объектов или событий понимается процесс приравнивания к этим процессам, свойствам, объектам или событиям чисел по определенным правилам, а именно таким образом, чтобы в отношениях чисел отображались отношения явлении, подлежащих измерению. Если постулируется, что в свойствах чисел отображаются количественные значения объектов реального предметного мира, то общую проблематику шкалирования правомерно рассматривать как частный случай проблемы отражения диалектико-материалистической теории познания.

Итак, измерение состоит в отображении эмпирических систем с помощью математических систем, а целью такого рода отображения является частичная замена действий, производимых с реальными предметами, формальными действиями с числами. Область чисел выполняет функцию модели определенных свойств предметов и в качестве средства познания дает возможность более глубоко проникать в объективно существующие свойства и взаимосвязи. В этом смысле шкалирование (измерение) служит главной силой, преобразующей психологию из науки описательной, следующей за фактами, в науку, умеющую предсказывать новые факты.

Понятно, что относительно разных эмпирических систем мы должны использовать разные методики измерения, т. е. применять измерительные шкалы разных типов. Понимание исследователем формальных аспектов измерения является необходимым условием для адекватного выбора им измерительных инструментов и процедур, а также для применения адекватных методов анализа полученных в наблюдении и эксперименте данных. Основываясь на правилах измерения, принято различать несколько типов шкал, с каждым из которых могут быть соотнесены конкретные процедуры шкалирования. При этом каждый тип шкалы может быть охарактеризован соответствующими числовыми свойствами. Рассмотрим более подробно основные свойства разных типов шкал, эмпирические операции, допустимые на уровне этих шкал, а также статистические приемы обработки и анализа исходных или, как их чаще называют, первичных результатов исследования.

Существует четыре типа измерительных шкал (или способов измерения):

1) номинативная или шкала наименований;

2) порядковая, ординарная или ранговая шкала;

3) интервальная или шкала равных интервалов;

4) шкала равных отношений, или шкала отношений.

Процесс присвоения количественных (числовых) значений, имеющейся у исследователя информации, называется кодированием. Иными словами – кодирование это такая операция, с помощью которой экспериментальным данным придается форма числового сообщения (кода).

Применение процедуры измерения возможно только четырьмя вышеперечисленными способами. Причем каждая измерительная шкала имеет собственную, отличную от других форму числового представления, или кода. Поэтому закодированные признаки изучаемого явления, измеренные по одной из названных шкал, фиксируются в строго определенной числовой системе, определяемой особенностями используемой шкалы. Измерения, осуществляемые с помощью двух первых шкал, считаются качественными, а осуществляемые с помощью двух последних шкал – количественными .

Специфические особенности измерительных шкал обязательно должны учитываться при получении экспериментального материала в прикладных исследованиях.

Измерение в номинативной шкале (номинальной, или шкале наименований) состоит в присваивании какому-либо свойству или признаку определенного обозначения или символа (численного, буквенного и т.п.). По сути дела, процедура измерения сводится к классификации свойств, группировке объектов, к объединению их в классы, группы при условии, что объекты, принадлежащие к одному классу, идентичны (или аналогичны) друг другу в отношении какого-либо признака или свойства, тогда как объекты, различающиеся по этому признаку, попадают в разные классы.

Иными словами, при измерениях по этой шкале осуществляется классификация или распределение объектов (например, особенностей личности) на непересекающиеся классы, группы. Таких непересекающихся классов может быть несколько. Классический пример измерения по номинативной шкале в психологии – разбиение людей по четырем темпераментам: сангвиник, холерик, флегматик и меланхолик.

Номинальная шкала определяет, что разные свойства или признаки качественно отличаются друг от друга, но не подразумевает каких-либо количественных операций с ними.

Единица измерения, которой мы оперируем в случае номинативной шкалы, – это количество наблюдений (испытуемых, свойств, реакций и т.п.). Общее число наблюдений (респондентов и т.п.) принимается за 100%, и тогда мы можем вычислить процентное соотношение, например, мальчиков и девочек в классе. Если же количество групп разбиения больше чем две, то также можно подсчитать процентный состав испытуемых (респондентов) в каждой группе. Кроме того, мы можем найти группу, в которой число респондентов наибольшее, т.е. группу с наибольшей частотой измеренного признака. Эта группа носит название моды.

Измерение по порядковой (ранговой, ординарной) шкале расчленяет всю совокупность измеренных признаков на такие множества, которые связаны между собой отношениями типа «больше – меньше», «выше – ниже», «сильнее – слабее» и т.п. Если в предыдущей шкале было несущественно, в каком порядке располагаются измеренные признаки, то в порядковой (ранговой) шкале все признаки располагаются по рангу – от самого большего (высокого, сильного, умного и т.п.) до самого маленького (низкого, слабого, глупого и т.п.) или наоборот.

Типичный и очень хорошо известный всем пример порядковой шкалы – это школьные оценки: от 5 до 1 балла; судейство в некоторых видах спорта или зрелищных программах (КВН, ДОГ-ШОУ и др.), которые также представляют собой вариант ранжирования. Числа в ранговых шкалах обозначают лишь порядок следования признаков, а операции с числами в этой шкале – это операции с рангами.

В шкале интервалов, или интервальной шкале, каждое из возможных значений измеренных величин отстоит от ближайшего на равном расстоянии. Главное понятие этой шкалы – интервал, который можно определить как долю или часть измеряемого свойства между двумя соседними позициями на шкале. Размер интервала – величина фиксированная и постоянная на всех участках шкалы. Для измерения посредством шкалы интервалов устанавливаются специальные единицы измерения; в психологии это стены и стенайны. При работе с этой шкалой измеряемому свойству или предмету присваивается число, равное количеству единиц измерения эквивалентное количеству имеющегося свойства. Важной особенностью шкалы интервалов является то, что у нее нет естественной точки отсчета (нуль условен и не указывает на отсутствие измеряемого свойства).

Только измерение по строго стандартизированной тестовой методике, при условии того, что распределение значений в репрезентативной (см. ниже) выборке достаточно близко к нормальному (см. ниже), может считаться измерением в интервальной шкале. Примером последнего могут служить стандартизованные тесты интеллекта, где условная единица измерения IQ эквивалентна как при низких, так и при высоких значениях интеллекта.

Особенностью шкалы отношений (шкалы равных отношений) является наличие твердо фиксированного нуля, который означает полное отсутствие какого-либо свойства или признака. Шакала отношений является наиболее информативной шкалой, допускающей любые математические операции и использование разнообразных статистических методов. Шкала отношений по сути очень близка интервальной, поскольку если строго фиксировать начало отсчета, то любая интервальная шкала превращается в шкалу отношений. Именно в шкале отношений производятся точные и сверхточные измерения в таких науках, как физика, химия, микробиология и др. Измерение по шкале отношений производятся и в близких к психологии науках, таких, как психофизика, психофизиология, психогенетика.

Формы учета результатов измерений. Для наглядного представления экспериментальных данных используются различные приемы, облегчающие прежде всего визуальный анализ полученной в эксперименте информации. К таким приемам относят таблицы, ряды распределений, графики, гистограммы. Их применяют с той целью, чтобы полученные экспериментальные данные представить наглядным образом и можно было бы в явной форме увидеть характерные особенности и результаты эксперимента.

Первичный экспериментальный материал, полученный психологом, нуждается в соответствующей обработке. Обработка начинается с упорядочения и систематизации собранных данных. Процесс систематизации результатов эксперимента, объединение их в относительно однородные группы по некоторому признаку называется группировкой.

Группировка – это не просто технический прием, позволяющий представить первичные данные в ином виде, но, прежде всего, такая операция, которая позволяет глубже выявить связи между изучаемыми явлениями. От того, как группируется исходный материал, во многих случаях зависят выводы о природе изучаемого явления. Поэтому группировка должна быть обдуманной, отвечать требованию поставленной задачи и соответствовать содержанию изучаемого явления.

Таблицы. Наиболее распространенной формой группировки экспериментальных данных являются статистические таблицы. Таблицы бывают простыми и сложными. К простым относятся таблицы, применяемые при альтернативной группировке, когда одна группа испытуемых противопоставляется другой; например, здоровые – больным, высокие люди – низким и т.п.

Таблица 1. Распределение праворуких и леворуких детей по классам.

Классы	Праворукие	Леворукие	Сумма




Суммы

Из таблицы хорошо видно, что леворуких учащихся больше в пятых классах школы, и меньше – в третьих.

Простые таблицы рекомендуется использовать, когда измерение изучаемых признаков производится в номинативной или ранговой шкале. Усложнение таблиц происходит за счет возрастания объема и степени дифференцированности представленной в них информации. К сложным таблицам относят так называемые многопольные таблицы, которые могут использоваться при выяснении причинно-следственных отношений между варьирующими признаками. Такие таблицы, как правило, имеют сложное строение, позволяющее одновременно осуществлять разные варианты группировки данных. Примером сложной таблицы служит, в которой представлены классические данные Ф. Гальтона, иллюстрирующие наличие положительной зависимости между ростом родителей и их детей. Таблица организована таким образом, что позволяет оценить частоту встречаемости в популяции однозначно фиксируемых соотношений роста родителей и роста ребенка. Например, при низком росте родителей в 66 дюймов (1 дюйм равен 2, 54 см) только один из 144 обследованных детей имел рост в 60, 7 дюймов, а 56 детей имели рост 66, 7 дюйма. В то же время высокий рост детей (74, 7 дюйма) был зафиксирован только в тех семьях, где родители имели рост не ниже 70 дюймов.

Таблица 2. Рост родителей и детей (в дюймах).

Рост родителей	Рост детей в дюймах	Всего
60, 7	62, 7	64, 7	66, 7	68, 7	70, 7	72, 7	74, 7






Всего

Эта таблица позволяет выявить тенденцию, заключающуюся в том, что у высоких родителей, как правило, дети имеют высокий рост, а у низкорослых родителей чаще бывают дети невысокого роста. Данный пример показывает, что таблицы имеют не только иллюстративное, но и аналитическое значение, позволяя обнаруживать разные аспекты связей между варьирующими признаками.

Следует запомнить, что правильно составленные таблицы – это большое подспорье в экспериментальной работе, позволяющее одновременно осуществлять разные варианты группировки полученных данных.

Статистические ряды. Особую форму группировки данных представляют так называемые статистические ряды, или числовые значения признака, расположенного в определенном порядке. В зависимости от того, какие признаки изучаются, статистические ряды делят на атрибутивные, вариационные, ряды динамики, регрессии, ряды ранжированных значений признаков и ряды накопленных частот. Наиболее часто в психологии используются вариационные ряды, ряды регрессии и ряды ранжированных значений признаков.

Вариационным рядом распределения называют двойной ряд чисел, показывающий, каким образом числовые значения признака связаны с их повторяемостью в данной выборке. Например, психолог провел тестирование интеллекта по тесту Д.Векслера у 25 школьников, и сырые баллы по второму субтесту оказались следующими: 6, 9, 5, 7, 10, 8, 9, 10, 8, 11, 9, 12, 9, 8, 10, 11, 9, 10, 8, 10, 7, 9, 10, 9, 11. Как видим, некоторые цифры попадаются в данном ряду по несколько раз. Следовательно, учитывая число повторений, данные ряд можно представить в более удобной, компактной форме:

Варианты х_i: 6 9 5 7 10 8 11 12

Частоты вариант f_i: 1 7 1 2 6 4 3 1

Это и есть вариационный ряд. Числа, показывающие, сколько раз отдельные варианты встречаются в данной совокупности, называются частотами, или весами, вариант. Они обозначаются строчной буквой латинского алфавита f и имеют индекс «i», соответствующий номеру переменной в вариационном ряду.

Общая сумма частот вариационного ряда равна объему выборки, т.е. n = 1+7+1+2+6+4+3+1 = 25

Частоты можно выражать и в процентах. При этом общая сумма частот или объем выборки принимается за 100%. Процент каждой отдельной частоты или веса подсчитывается по формуле:

n% = f ·100%: n

Процентное представление частот полезно в тех случаях, когда приходится сравнивать вариационные ряды, сильно различающиеся по объемам. Например, при тестировании школьной готовности детей города, поселка городского типа и села были обследованы выборки детей численностью 1000, 300 и 100 человека соответственно. Различие в объемах выборок очевидно. Поэтому сравнение результатов тестирования лучше проводить, используя проценты частот.

Приведенный выше ряд можно представить по другому. Если элементы ряда расположить в возрастающем порядке, то получится так называемый ранжированный вариационный ряд:

Варианты х_i: 5 6 7 8 9 10 11 12

Частоты f_i: 1 1 2 4 7 6 3 1

Подобная форма представления более предпочтительна, чем предыдущая, поскольку лучше иллюстрирует закономерность варьирования признака.

Понятие распределения и гистограммы. В статистике под рядом распределения понимают распределение частот по вариантам. Измеренные величины признака в выборке варьируют в пределах от минимального до максимального значения. Этот предел разбивают на так называемые классовые интервалы, которые, в зависимости от конкретных данных, могут быть как равными по величине, так и неравными.

Если по оси абсцисс (ОХ) откладывать величины классовых интервалов, а по оси ординат (OY) величины частот, попадающих в данный классовый интервал, то получается так называемая гистограмма распределения частот. При этом над каждым классовым интервалом строится колонка или прямоугольник, площадь которого оказывается пропорциональной соответствующей частоте. Гистограмма представляет собой графическое изображение данного частотного распределения.

Числовые характеристики распределений. Для экспериментальных данных, полученных по выборке, можно вычислить ряд числовых характеристик (мер).

Разброс выборки. Разброс (иногда эту величину называют размахом ) выборки обозначается буквой R. Это самый простой показатель, который можно получить для выборки – разность между максимальной и минимальной величинами данного конкретного вариационного ряда, т.е. R = Х_мах – Х_м_in. Понятно, что чем сильнее варьирует измеряемый признак, тем больше величина R, и наоборот. Однако может случиться так, что у двух выборочных рядов и средние, и размах совпадают, однако характер варьирования этих рядов будет различный. Например, даны две выборки:

X = 10; 15; 20; 25; 30; 35; 40; 45; 50; X = 30; R = 40

Y = 10; 28; 28; 30; 30; 30; 32; 32; 50; Y = 30; R = 40

При равенстве средних и разбросов для этих двух выборочных рядов характер их варьирования различен. Для того чтобы более четко представлять характер варьирования выборок, следует обратиться к их распределениям.

Мода. Числовой характеристикой выборки, как правило, не требующей вычислений, является так называемая мода. Мода – это такое числовое значение, которое встречается в выборке наиболее часто. Так, например, в ряду значений (2, 6, 6, 8, 9, 9, 9, 10) модой является 9, потому что 9 встречается чаще любого другого числа. Обратите внимание, что мода представляет собой наиболее часто встречающееся значение (в данном примере это 9), а не частоту встречаемости этого значения (в данном примере равную 3).

Моду находят согласно следующим правилам:

1) В том случае, когда все значения в выборке встречаются одинаково часто, принято считать, что этот выборочный ряд не имеет моды. Например: 5, 5, 6, 6, 7, 7 – в этой выборке моды нет.

2) Когда два соседних (смежных) значения имеют одинаковую частоту и их частота больше частот любых других значений, мода вычисляется как среднее арифметическое этих двух значений.

Например, в выборке 1, 2, 2, 2, 5, 5, 5, 6 частоты рядом расположенных значений 2 и 5 совпадают и равняются 3. Эта частота больше, чем частота других значений 1 и 6 (у которых она равна 1). Модой этого ряда будет величина: (2+5): 2 = 3, 5

3) Если два несмежных (не соседних) значения в выборке имеют равные частоты, которые больше частот любого другого значения, то выделяют две моды. Например, в ряду 10, 11, 11, 11, 12, 13, 14, 14, 14, 17 модами являются значения 11 и 14. В таком случае говорят, что выборка является бимодальной.

Могут существовать и так называемые мультимодальные распределения, имеющие более двух вершин (мод).

4) Если мода оценивается по множеству сгруппированных данных, то для нахождения моды необходимо определить группу с наибольшей частотой признака. Эта группа называется модальной группой.

Медиана – обозначается Md и определяется как величина, по отношению к которой по крайней мере 50% выборочных значений меньше неё и по крайней мере 50% – больше. Можно дать второе определение, сказав, что медиана – это значение, которое делит упорядоченное множество данных пополам.

Задача 1. Найдем медиану выборки: 9, 3, 5, 8, 4, 11, 13.

Решение. Сначала упорядочим выборку по величинам входящих в нее значений. Получим: 3, 4, 5, 8, 9, 11, 13. Поскольку в выборке семь элементов, четвертый по порядку элемент будет иметь значение большее, чем первые три, и меньшее, чем последние три. Таким образом, медианой будет четвертый элемент – 8.

Задача 2. Найдем медиану выборки: 20, 9, 13, 1, 4, 11.

Решение. Упорядочим выборку: 1, 4, 9, 11, 13, 20. Поскольку здесь имеется четное число элементов, то существует две «середины» – 9 и 11. В этом случае медиана определяется как среднее арифметическое этих значений.

Среднее арифметическое ряда из n числовых значений X₁, X₂, ...Х_n обозначается X и подсчитывается как: Х = Σ (Х_n): n,

Следует подчеркнуть, что средние величины характеризуют выборку одним (средним) числом. Преимущество, или иначе, информативная значимость, средних величин заключается в их способности аккумулировать или уравновешивать все индивидуальные отклонения, в результате чего проявляется то наиболее устойчивое и типичное, что характеризует качественное своеобразие варьирующего объекта, позволяя отличить одну выборку от другой, а на этой основе, например, одно измеренное психологическое свойство от другого.

Однако среднее как статистический показатель не лишено недостатков. Так, например, при вычислении среднего количества ошибок при выполнении корректурной пробы может быть получена величина равная 1, 3 ошибки или при определении среднего числа учеников, обучающихся в пятых классах данной школы, может быть получена величина равная 30, 07. Конечно, с точки зрения статистика эти величины обычны, но для психологических задач они могут быть неприемлемы.

Кроме того, среднее оказывается достаточно чувствительным к очень маленьким или очень большим величинам, отличающимся от основных значений измеренных характеристик. Приведем пример из книги Дж. Б. Мангейма и Ричарда К. Рича: «Политология. Методы исследования». - М., 1997 г. «Пусть 9 человек имеют доход от 4500 до 5200 тыс. долларов в месяц. Величина их среднего дохода равняется 4900 долларов. Если же к этой группе добавить человека, имеющего доход в 20000 тыс. долларов в месяц, то средняя всей группы сместится и окажется равной 6410 долларов, хотя никто из всей выборки (кроме одного человека) реально не получает такой суммы. Понятно, что аналогичное смещение, но в противоположную сторону можно получить и в том случае, если добавить в эту группу человека с очень маленьким годовым доходом».

Важно подчеркнуть, что подобные крайние величины, т.е. те, которые существенно искажают величину средней, оказываются в то же время и наименее характерными для изучаемой генеральной совокупности. Именно поэтому в статистике, кроме средней величины, используются и другие характеристики «типичных значений» выборки, такие, как мода, медиана и ряд других характеристик.

Дисперсия. Рассмотрим еще одну очень важную числовую характеристику выборки, называемую дисперсией. Дисперсия представляет собой наиболее часто использующуюся меру рассеяния случайной величины (переменной). Дисперсия это среднее арифметическое квадратов отклонений значений переменной от её среднего значения.

Σ (Х_i – Х)²

D = ------------------,

n - l

где n – объем выборки, i – индекс суммирования; X – среднее, вычисляемое по формуле.

Пример. Вычислим дисперсию ряда: 2, 4, 6, 8, 10

Прежде всего, найдем среднее ряда. Оно равно X = 6.

Рассмотрим величины: (Х_i – X) для каждого элемента ряда. Иными словами, из каждого элемента ряда вычтем величину среднего этого ряда. Полученные величины характеризуют то, насколько каждый элемент отклоняется от средней величины в данном ряду. Обозначим полученную совокупность разностей как множество Т. Тогда Т есть:

Т = (2 - 6 = -4; 4 - 6 = -2; 6 - 6 = 0; 8 - 6 = 2; 10 - 6 = 4).

Так образуется новый ряд чисел. Его особенность в том, что при сложении этих чисел обязательно получится ноль. Проверим: (-4) + (-2) + 0 + 2 + 4 = 0.

Отметим, что сумма такого ряда Σ (X_i – X) всегда будет равна нулю. Для того чтобы избавиться от нуля, каждое значение разности (Xi – X) возводят в квадрат, все их суммируют и затем делят на число элементов, т.е. применяют формулу 4.4. В нашем примере получится следующее:

D = 16 + 4 + 0 + 4 + 16 = 40. Это и есть искомая дисперсия.

Общий алгоритм вычисления дисперсии для одной выборки следующий:

1. Вычисляется среднее по выборке.

2. Для каждого элемента выборки вычисляется его отклонение от средней, т.е. получается множество Т.

3. Каждый элемент множества Т возводят в квадрат.

4. Находится сумма этих квадратов.

5. Эта сумма, как и в случае вычисления среднего, делится на общее количество членов ряда – n. В ряде случаев, особенно когда величина выборки мала, деление осуществляется не на величину n, а на величину n – 1.

Величина, получающаяся после пятого шага, и есть искомая дисперсия. Расчет дисперсии для таблицы чисел осуществляется по формуле:

Σ Σ (Х_ij – Х)²

D = ------------------,

N - l

где Х_ij – значения всех переменных, полученных в эксперименте, или все элементы таблицы; индекс j меняется от 1 до р, где р число столбцов в таблице, а индекс i меняется от 1 до n, где n – число испытуемых или число строк в таблице; X – общая средняя всех элементов таблицы; N – общее число всех элементов в таблице (анализируемой совокупности экспериментальных данных) и в общем случае N = р • n.

Дисперсию для генеральной совокупности принято обозначать как σ ², а дисперсию выборки как S_х, причем индекс х обозначает, что дисперсия характеризует варьирование числовых значений признака вокруг их средней арифметической.

Преимущество дисперсии перед размахом в том, что дисперсию можно представить как сумму ряда чисел (согласно ее определению), т.е. разложить на составные компоненты, позволяя тем самым более подробно охарактеризовать исходную выборку. Важная характеристика дисперсии заключается также и в том, что с её помощью можно сравнивать выборки, различные по объему.

Однако сама дисперсия, как характеристика отклонения от среднего, часто, неудобна для интерпретации. Так, например, предположим, что в эксперименте измерялся рост в сантиметрах, тогда размерность дисперсии будет являться характеристикой площади, а не линейного размера (поскольку при подсчете дисперсии сантиметр возводится в квадрат).

Для того чтобы приблизить размерность дисперсии к размерности измеряемого признака применяют операцию извлечения квадратного корня из дисперсии. Полученную величину называют стандартным отклонением.

Степень свободы. Число степеней свободы это число свободно варьирующих единиц в составе выборки. Так, если вся выборка состоит из n элементов и характеризуется средней X, то любой элемент этой совокупности может быть получен как разность между величиной n • X и суммой всех остальных элементов, кроме самого этого элемента.

Пример. Рассмотрим ряд: 2 4 6 8 10. Мы помним, что средняя этого ряда равна 6. В этом ряду 5 чисел, следовательно N = 5. Предположим, что мы хотим получить последний элемент ряда 4.5 – 10, зная все предыдущие элементы и среднее этого ряда. Тогда:

5 • 6 – 2 – 4 – 6 – 8 = 10

Предположим, что мы хотим получить первый элемент ряда - 2, зная все последующие элементы и среднее этого ряда. Тогда: 5 • 6 – 4 – 6 – 8 – 10 = 2 и т.д.

Следовательно, один элемент выборки не имеет свободы вариации и всегда может быть выражен через другие элементы и среднее. Это означает, что число степеней свободы у выборочного ряда обозначаемое в таких случаях символом k будет определяться как k = n - 1, где n – общее число элементов ряда (выборки).

При наличии не одного, а нескольких ограничений свободы вариации, число степеней свободы, обозначаемое как v (греческая буква ню) будет равно v = n - k, где k соответствует числу ограничений свободы вариации. В общем случае для таблицы экспериментальных данных число степеней свободы будет определяться по следующей формуле: v = (с - 1) • (n - 1), где с – число столбцов, а n – число строк (число испытуемых).

Следует подчеркнуть, однако, что для ряда статистических методов расчет числа степеней свободы имеет свою специфику.

Понятие нормального распределения. Нормальное распределение играет большую роль в математической статистике, поскольку многие статистические методы предполагают, что, анализируемые с их помощью экспериментальные данные распределены нормально. График нормального распределения имеет вид колоколообразной кривой (см. рис.).

Его важной особенностью является то, что форма и положение графика нормального распределения определяется только двумя параметрами: средней μ (мю) и стандартным отклонением σ (сигма). Если стандартное отклонение σ постоянно, а величина средней μ меняется, то собственно форма нормальной кривой остается неизменной, а лишь ее график смещается вправо (при увеличении μ ) или влево (при уменьшении μ ) по оси абсцисс – ОХ. При условии постоянства средней μ изменение сигмы влечет за собой изменение только ширины кривой: при уменьшении сигмы кривая делается более узкой, и поднимается при этом вверх, а при увеличении сигмы кривая расширяется, но опускается вниз. Однако во всех случаях нормальная кривая оказывается строго симметричной относительно средней, сохраняя правильную колоколообразную форму.

⇐ Предыдущая 123 4 5 6 7 8 9 10 Следующая ⇒

Последнее изменение этой страницы: 2017-03-14; Просмотров: 1032; Нарушение авторского права страницы