Формальные процедуры проверки гипотез.

⇐ ПредыдущаяСтр 9 из 14Следующая ⇒

В 1912 году А.Пуанкаре написал “Каждый уверен в справедливости нормального закона, экспериментаторы – потому что они думают, что это математическая теорема, а математики – потому, что они думают, что это экспериментальный факт”. К этим словам можно добавить, что нормальный закон распределения всего лишь один из многих законов распределения случайной непрерывной величины, но он имеет очень большой удельный вес практической применимости. Перед нами стоит задача определить к какому типу может относиться наше экспериментальное распределение, так как это важно при оценке истинных параметров изучаемой совокупности, например истинного среднего содержания разведуемой залежи полезного компонента, ее истинной дисперсии и других параметров. Однако прежде чем решать эту задачу нужно установить формальные процедуры статистической проверки наших гипотез, в конкретном случае гипотезы о нормальном распределении наших выборочных данных, полученных в результате геологоразведочных работ. Первый шаг в статистической проверке гипотез – формулировка подходящей гипотезы об исследуемой переменной. Обычно первая гипотеза называется нулевой и является гипотезой, что наши экспериментальные данные подчиняются нормальному распределению, а среднеарифметическое значение выборки равно истинному среднему значению совокупности.

H₀: χ =μ

Здесь уместно отметить, что это общее название нулевой гипотезы, она может формулироваться, например, как гипотеза об отсутствии различий между выборками и совокупностями, как гипотеза о равномерности точек наблюдения и возможны другие варианты названий.

Сформулировав нулевую гипотезу нужно указать и альтернативную гипотезу. Альтернативная гипотеза соответственно будет гипотезой, о том, что наши экспериментальные данные не подчиняются нормальному распределению, и среднеарифметическое значение выборки не равно истинному среднему значению совокупности.

H₁: χ ≠ μ

Как только гипотеза сформулирована, можно на основании какого-либо статистического критерия, принять ее или отвергнуть, также гипотеза может быть истинной или ложной. Из этого следует, что мы имеем четыре комбинации возможных решений и оценок правильности наших решений, два решения из четырех правильные, а два решения - неправильные. Эти комбинации возможных решений и оценок правильности наших действий отражены в таблице.

Возможные решения	Гипотеза верна	Гипотеза неверна
Гипотеза принимается	Правильное решение	Ошибка второго рода (β )
Гипотеза отклоняется	Ошибка первого рода (L)	Правильное решение.

Из этой таблицы видно, что только отклонение неверной гипотезы и принятие верной гипотезы являются правильным выбором. Если нулевая гипотеза отклоняется, а на самом деле она верна, то возникает ошибка или вероятность ошибки первого рода (L), которая известна заранее и задается до принятия решения и наоборот, если нулевая гипотеза принимается, а она неверна, то возникает ошибка второго рода (β ) которая неизвестна заранее. Ошиблись мы или не ошиблись, мы узнаем только после принятия решения и выполнения какого-либо действия, следующего из нашего решения. Если мы отвергаем нулевую гипотезу – это не означает, что мы приняли правильное решение, просто мы отвергаем эту гипотезу на основании предшествующего негативного опыта. Например, из предыдущего опыта известно, что когда кто-то принимал нулевую гипотезу на основании конкретного критерия, то ошибался в 95 из 100 случаев, то есть в 5 случаях нулевая гипотеза была верна. Поэтому у нас есть основание отвергнуть эту гипотезу. Здесь мы определили степень или уровень риска, из-за чего мы принимаем отрицательное решение - в 95 % (L=95%). Но при принятии такого решения мы допускаем и уровень риска принятия отрицательного решения в 5% (L=5%). Каждый специалист может сам выбирать себе уровень значимости риска. Однако нужно согласиться, что, выбирая себе, маленький уровень риска при принятии отрицательного решения, мы редко будем принимать положительные решения, мы будем более осторожными, но когда будем принимать положительные решения (то есть когда статистические данные о предыдущем опыте будут показывать более высокий уровень значимости риска), то будем редко ошибаться. Такой стиль поведения приведет нас к тому, что мы будем пропускать много интересных для нас предложений. И напротив, когда мы выберем более высокий уровень значимости риска, мы будем более часто, принимать положительные решения, будем больше ошибаться, но меньше пропустим выгодных для нас предложений. В горнопромышленной практике эти стили поведений часто наблюдаются. Так, например многие крупные корпорации, нередко являющиеся мировыми лидерами производства какого-либо металла, при выборе объектов для инвестиционной деятельности выбирают, только крупные объекты, при эксплуатации которых специалисты корпорации почти на 100% (очень высокий уровень риска при принятии отрицательного решения) уверены, что получат прибыль. В этом случае много средних и мелких месторождений отвергается. Другие корпорации наоборот вовлекают в промышленный оборот много средних и мелких объектов, причем часто их надежды на получение прибыли не оправдываются, но часто и они, в конце концов, тоже претендуют на первые места в производстве металлов. В геологоразведочной практике первый стиль поведения заключается, что компания редко реализует буровые программы, редко ошибается, но не проверяет большое количество аномалий, в противоположном случае геологоразведочная компания много разбуривает аномалий, много ее прогнозов не подтверждается, но и не пропускается не один потенциально интересный объект.

Критерий Пирсона (χ ² критерий), распределение Пирсона.

Общеизвестная задача статистического анализа заключается в сравнении выборочного распределения с некоторым заранее заданным стандартным распределением и определение, к какому типу принадлежит наше экспериментальное распределение. Одно из таких решений было предложено Пирсоном. Он предложил рассмотреть некоторое теоретическое распределение тесно связанное с нормальным распределением. Если выборка объема n взята из известной совокупности, имеющей нормальное распределение, то ее среднее значение равно μ, а стандартное отклонение равно σ. Каждое наблюдение в выборке можно преобразовать по формуле –

Z=(x_i – μ )/ σ.

После стандартизации все величины Z_i будут иметь нормальное распределение с математическим ожиданием равным 0 и стандартным отклонением равным 1. Если все значения Z_i возвести в квадрат и сложить, то мы получим новую статистику –

∑ Z_i² = ∑ [(x_i – μ )/ σ ]².

Эта новая статистика - ∑ Z_i² строится по выборочным данным и соответственно изменяется от выборки к выборке. Если взять всевозможные выборки объема n из нормальной совокупности рассчитать статистику ∑ Z_i² и нанести соответствующие значения на график, то эти значения будут подчиняться некоторому распределению. Характер кривых этого распределения тесно связан с объемом выборки - n или точнее с числом степеней свободы и определяется только им.

Это распределение имеет очень большое значение на практике, так как оно используется для проверки гипотезы о нормальном распределении данных, измеренных в разных шкалах измерения.

Указанный статистический критерий χ ² вычисляется из сравнения распределения ∑ Z_i² с нормальным распределением по формуле -

χ ² = ∑ [(O –U)²/U]

где O – наблюдаемые частоты исследуемого распределения по интервалам, U – ожидаемые частоты теоретического нормального распределения по тем же интервалам.

Значения χ ² рассчитаны для различных степеней свободы и опубликованы. Практически статистический критерий вычисляется следующим образом. Область наблюдаемых значений разбивается на некоторое количество интервалов, таким образом, что бы им соответствовали равные площади под кривой распределения. Затем если наши данные стандартизированы, то подсчитывается число проб, попадающих в намеченные интервалы, находится по формуле разность между ними и теоретическими частотами, значения суммируются. Теоретические частоты берутся из таблицы нормального распределения, в тех же границах интервалов, на которые мы разбивали наше выборочное распределение. Если сумма превышает критическое значение, то нулевая гипотеза отклоняется и делается вывод, что наше распределение не согласуется с нормальным распределением. В процедуре сравнения число степеней свободы определяется как количество интервалов, на которые разбивалось изучаемое распределение минус 3. В данном случае мы теряем две степени свободы, потому что не знаем истинных параметров исследуемой совокупности μ и σ и третью степень свободы теряем потому что сумма частот по интервалам изучаемого распределения не равна 1.

Одной из самых распространенных задач в геологии является изучение равномерности распределения точек наблюдения на некоторой территории. Достоверность геологических карт находится в прямой зависимости от плотности и равномерности расположения точек наблюдения. Сеть точек наблюдения может быть регулярной, если точки наблюдения располагаются по какой-либо сети, и не регулярной. Для большинства случаев пункты отбора проб располагаются так, что трудно сказать к какому типу сети они относятся. Для решения этой задачи хорошо подходит критерий χ ². Всю карту можно разделить на определенное количество подобластей, так чтобы каждая подобласть содержала некоторое количество точек наблюдения. Если точки наблюдения на карте расположены равномерно, то следует ожидать, что каждая подобласть будет содержать равное количество этих точек. Использование критерия Пирсона будет наиболее эффективно, если число подобластей сделать большим (это приведет к увеличению числа степеней свободы), при условии, что все подобласти содержат не менее 5 точек наблюдения. В данном случае количество точек наблюдения ожидаемое для каждого квадрата равно –

E = (общее число точек наблюдения)/число квадратов.

Тогда критерий будет рассчитывать по той же формуле –

χ ² = ∑ [(O –U)²/U]

только O – наблюдаемое число точек в квадрате, Е – ожидаемое число точек (среднее). Сравниваемое число критерия находится для числа степеней свободы n -2 (n –количество квадратов).

⇐ Предыдущая 4 5 6 7 8910 11 12 13 Следующая ⇒