Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Проверка гипотезы о значимости выборочного



Коэффициента корреляции

Рассмотрим выборку объема п, извлеченную из нормально распределенной двумерной генеральной совокупности (X, Y). Вычислим выборочный коэффициент корреляции rB. Пусть он оказался не равным нулю. Это еще не означает, что и коэффициент корреляции генеральной совокупности не равен нулю. Поэтому при заданном уровне значимости α возникает необходимость проверки нулевой гипотезы Н0: rг = 0 о равенстве нулю генерального коэффициента корреляции при конкурирующей гипотезе Н1: rг ≠ 0. Таким образом, при принятии нулевой гипотезы Х и Y некоррелированы, то есть не связаны линейной зависимостью, а при отклонении Н0 они коррелированы.

В качестве критерия примем случайную величину

, (12)

которая при справедливости нулевой гипотезы имеет распределение Стьюдента с k = n – 2 степенями свободы. Из вида конкурирующей гипотезы следует, что критическая область двусторонняя с границами ± tкр, где значение tкр(α, k) находится из таблиц для двусторонней критической области.

Вычислив наблюдаемое значение критерия

и сравнив его с tкр, делаем вывод:

- если |Tнабл| < tкр – нулевая гипотеза принимается (корреляции нет);

- если |Tнабл| > tкр – нулевая гипотеза отвергается (корреляция есть).

Пример. По выборке объема п = 150, извлеченной из нормально распреде-ленной двумерной генеральной совокупности, вычислен выборочный коэффициент корреляции rB = - 0, 37. Проверим при уровне значимости α = 0, 01 нулевую гипотезу Ho: rГ = 0 о равенстве нулю генерального коэффициента корреляции при конкурирующей гипотезе Н1: rГ ≠ 0.

Критическая точка tкр(0, 01; 150) = 2, 58. Вычислим наблюдаемое значение критерия: Поскольку |Tнабл | > tкр, нулевая гипотеза отвергается, то есть Х и Y коррелированны. ◄

 

Проверка гипотезы о равенстве нулю генерального

Коэффициента ранговой корреляции Спирмена и Кендала

Требуется при заданном уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции Спирмена ρ г при конкурирующей гипотезе Н1: ρ г 0. Для этого найдем критическую точку:

, (13)

где п – объем выборки, ρ В – выборочный коэффициент ранговой корреляции Спирмена, tкр (α, k) – критическая точка двусторонней критической области, найденная по таблице критических точек распределения Стьюдента, число степеней свободы k = n – 2. Тогда, если | ρ B | < Tкр, то нулевая гипотеза принимается, то есть ранговая корреляционная связь между признаками незначима. Если | ρ B | > Tкр, то нулевая гипотеза отвергается, и между признаками существует значимая ранговая корреляционная связь.

Для проверки нулевой гипотезы Н0: τ г = 0 (генеральный коэффициент ранговой корреляции Кендалла равен нулю) при альтернативной гипотезе Н1: τ г ≠ 0 необходимо найти критическую точку:

, (14)

где п – объем выборки, а zкр – критическая точка двусторонней критической области, определяемая из условия по таблицам для функции Лапласа. Если | τ B | < Tкр , то нулевая гипотеза принимается (ранговая корреляционная связь между признаками незначима). Если | τ B | > Tкр , то нулевая гипотеза отвергается (между признаками существует значимая ранговая корреляционная связь).

Вопросы для самопроверки

1. Что такое критерий согласия?

2. Какие критерии согласия Вы знаете?

3. Опишите схему применения критерия Пирсона.

4. Запишите плотность распределения закона с степенью свободы.

5. Могут ли опытные данные одновременно согласовываться с несколькими гипотезами о законе распределения?

 

ПРИМЕНЕНИЕ В МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ

ПРОГРАММЫ EXCEL

 

а). Структура данных, преобразование данных. Ячейки, диапазон ячеек. Ячейки нумеруются одновременным заданием имени столбца и номером элемента в этом столбце. Например, A3 –это третья сверху ячейка, находящаяся в первом столбце.

Нужные данные для обработки задаются указанием их верхней правой и нижней левой границ в массиве всех данных. Например, оператор (A1: C8) выделит первые восемь элементов в столбцах A, B, C.

Формулы, способы их задания.Для задания формул, по которых будут проводиться вычисления с элементами массивов, имеется специальная строка (в верхней половине окна, она начинается сразу после символа fx). В EXCEL существуют различные группы формул, для наших целей наиболее важны такие: МАТЕМАТИЧЕСКИЕ, МАТ. и ТРИГОНОМЕТРИЯ, ССЫЛКИ И МАССИВЫ, а также СТАТИСТИЧЕСКИЕ, о которых подробнее будет сказано ниже. Результат вычислений функции помещается в заранее выбранную ячейку.

Статистические формулы. Список реализованных в EXCEL статистических команд можно получить, нажав значок fxи выбрав там пункт СТАТИСТИЧЕСКИЕ ФУНКЦИИ. Выделив нужную статистическую функцию, можно получить по ней справку (для этого – имеется предложение в нижней левой части появившегося окна - СПРАВКА ПО ЭТОЙ ФУНКЦИИ).

 

б). Основные распределения.Команды НОРМРАСП и НОРМОБР вычисляют значения для нормального распределения и для обратной ему функции. Например, команда НОРМОБР(0.12, 2, 0.5) дает значение, соответствующее значению вероятности 0.12 для нормального закона распределения со средним значением (математическим ожиданием), равным 2 и среднеквадратичным отклонением, равным 0.5. Некоторые другие распределения – это ПУАССОН, СТЬЮРАСП, БИНОМРАСП.

 

в). Вычисление оценок. Перечислим некоторые нужные нам основные команды:

СРЗНАЧ– вычисление среднего арифметического заданного массива данных (строки, столбца, матрицы и др.). Дает оценку для математического ожидания.

ДИСП (несмещенная оценка дисперсии, ее допустимо применять только для больших наборов данных – не менее 30, в противном случае нужно применять команду ДИСПР).

Пример: ДИСП(А1: А30) – вычисление несмещенной оценки дисперсии для 30 чисел из столбца A.

СТАНДОТКЛ, СРОТКЛ (несмещенная оценка) – это фактически корни квадратные и из соответствующих оценок дисперсии.

 

г). Построение гистограммы.Гистограмма дает возможность приближенно определить вид графика плотности распределения изучаемой случайной величины. Например, если гистограмма напоминает собой гауссову кривую (хоть и состоит из горизонтальных отрезков), то можно предполагать, что изучаемая случайная величина распределена нормально (для более точного исследования на нормальность имеются специальные методы).

Для построения гистограммы можно использовать специальную кнопку в основном меню: «Мастер диаграмм» (гистограмма тут рассматривается как одна из многих диаграмм в EXCEL). Шаг за шагом, отвечая на задаваемые «Мастером диаграмм» вопросы, получим гистограмму.

 

д). Корреляция. Простая регрессия. Основные команды:

ПИРСОН– вычисляет коэффициент корреляции (здесь он фигурирует как коэффициент Пирсона). Например, команда ПИРСОН(A1: A10; B1: B10) дает коэффициент корреляции для двух столбцов A и B.

КВПИРСОН - дает квадрат коэффициента корреляции.

КОРРЕЛ – дает тот же коэффициент корреляции.

НАКЛОН, ОТРЕЗОК, ЛИНЕЙН– команды для построения прямой регрессии и анализа ее точности.

Для уравнения линейной регрессии y=ax+b команда НАКЛОН дает коэффициент a, ОТРЕЗОК дает коэффициент b. Формат этих команд одинаков, например, НАКЛОН(A1: A10; B1: B10) дает наклон прямой регрессии столбца A зависимых значений на столбец независимых значений B.

Команда ЛИНЕЙН позволяет не только находить линейную регрессию, но и вычислять различные дополнительные параметры для ее анализа, а также проводить и кратную регрессию.

е). Кратная регрессия – производится с помощью команды ЛИНЕЙН. Например, ЛИНЕЙН(Y, X) решает задачу для массивов Y - зависимых данных (столбец) и X - независимых данных (один или несколько столбцов), выделяемых стандартным для EXCEL методом. Дополнительно можно задавать некоторые специальные опции.

 


Поделиться:



Последнее изменение этой страницы: 2017-05-11; Просмотров: 714; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.018 с.)
Главная | Случайная страница | Обратная связь