Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Исследование ряда измерений на степень однородности



 

Однородность результатов измерений в самом общем случае предполагает сравнение законов распределений между собой. Так как это достаточно трудоёмко и часто невозможно из-за весьма приближенных представлений о виде закона распределения, то процедуру сравнивания без большого ущерба для сути сводят к сравнению главных характеристик распределения: сдвига (центра распределения, оценки математического ожидания) масштаба (меры рассеивания, оценки дисперсии) и наличия грубых измерений. Достаточно часто (и в геодезии в том числе) для практических нужд процедура сравнения и таким образом проверка однородности результатов измерений может быть сведена к трем сторонам:

– проверить ряд на наличие грубых измерений;

– проверить на степень однородности дисперсии некоторых частей ряда измерений (проверка на гетероскедастичность);

– проверить на степень однородности математические ожидания некоторых частей ряда измерений (проверка на сдвиг центра).

Для проверки результатов на грубое измерение используют параметрические и непараметрические методы. Основой наиболее большой и наиболее часто встречаемой группы параметрических критериев является так называемая нормальная метка (z-метка) вида

 

.                                       (33)

 

Используя в качестве х экстремальные значения ряда измерений (максимальное и/или минимальное) и зная закон распределения z-метки можно вынести суждения о степени грубости экстремальных значений. Главный недостаток – закон распределения метки неустойчивость алгоритма, так как значение критерия проверки на грубость вычисляется по величинам, возможно имеющим эту грубость. Более гибкий подход, в котором обойдены эти две проблемы представляют непараметрические критерии, например критерий Хоглина-Иглевича, известный в нашей литературе как правило Хэмпэла.  В этом правиле также используется нормальная метка вида (33), только в качестве оценок математического ожидания (сдвига) используем не обычные среднее арифметическое, которое очень неустойчиво к большинству внешних факторов, а его робастный аналог в виде медианы ряда, а для оценки степени разброса не стандартное отклонение а его аналог в виде абсолютного медианного отклонения (АМО, англ. MAD).  Тогда метка (33) примет вид

 

.                  (34)

 

Переводя АМО(х) в стандартное отклонение теоретическим коэффициентом  (F-1(р) есть квантиль нормального закона распределения для вероятности р) для того чтобы получить проще закон распределения метки (34) и выбирая в качестве предельного коэффициент 3.5 окончательно из (34)

 

            (35)

 

имеем правило Хэмпла (робастный критерий Хоглина-Иглевича. Напомним, что медиана med(x) выбирается по обычному правилу как элемент в середине вариационного ряда (см. ниже). Таким образом, все что выходит за пределы интервала (35) считается грубым и подлежит исключению из обработки.

Для проверки ряда измерений на однородность по главным характеристикам, его делят на 2 или более части и используют как параметрические, так и непараметрические критерии. Так как результаты измерений чаще всего ближе по распределению к нормальному закону, то в параметрических критериях для первого случая используют обычный критерий отношений дисперсий (квадратов стандартного отклонения (средней квадратической погрешности)), или F -критерий Фишера, а для второго – степень отличия центров распределения (обычных средних арифметических), или t -критерий Стьюдента. Очевидно, что для эффективного использования этих критериев необходимо достаточно достоверное представление о виде закона распределения результатов измерений.

Если закон распределения не известен, или известен не достаточно, то необходимо использовать непараметрические критерии, например такие как критерий ранговой корреляции Спирмена для выявления эффекта гетероскедастичности (неравноточности) элементов ряда, критерий однородности Вилкоксона и др.

Суть критерия ранговой корреляции Спирмена следующая. Вычисляют оценки меры рассеивания результатов измерений в виде остатков . Если в ряде прослеживается выраженная неравноточность, то она проявится в виде постоянного увеличения значения остатков от измерения к измерению. То есть, с увеличением номера i величина остатка также увеличивается (уменьшается). Степень связанности номера и остатка в этом критерии характеризуют коэффициентом корреляции, которой, при отсутствии неравенства дисперсий измерений, быть не должно. При этом, для устойчивости процедуры используют ранговый коэффициент корреляции Спирмена. Для реализации критерия находят ранги исследуемого ряда следующим образом. Выстраиваем исследуемый ряд в вариационный (по возрастанию) и получаем ранги ni, как номер i-ого элемента исходного ряда в вариационном. Далее находим разность di = i –  ni и вычисляем коэффициент ранговой корреляции Спирмена по формуле:

 

.                                        (36)

 

Таким образом, критерий сводится к оценке степени значимости (отличия от нуля) коэффициента корреляции между номером элемента в ряде и остатком. При исследовании на значимость применяют критерий Стьюдента:

 

.                                       (37)

 

Полученное значение сравниваем с значением t эт., вычислив его в Matlab (см. пример выше) по модифицируемой доверительной вероятности (1 + р)/2 и числу степеней свободы п – 2. При выполнении неравенства t < t эт исходная гипотеза об отсутствии гетероскедастичности (неравенстве дисперсий измерений) не отвергается с вероятностью р.

 

 

 

                  

 

 

Пример исследования ряда на однородность

 

Для определения наличия грубых ошибок по правилу Хэмпэла в первую очередь необходимо вычислить медиану ряда med(h) и отклонения текущего измерения от медианы hi med(h). Медиана не совсем вычисляется, скорее выбирается по следующему правилу. Ряд измерений выстраивают по возрастанию (вариационный ряд). Если число элементов в ряде не четное, то элемент вариационного ряда с номером (п + 1)/2 и будет медианой ряда. Если число элементов в ряде четное, то элемент с номером (п + 1)/2 получается дробным с половинкой. Тогда медиана будет средним между значениями, соответствующими меньшему целому для номера и большему целому для номера в вариационном ряде. Для нашего примера имеем вариационный ряд

 

                4.592   0.008               

                4.592   0.008

                4.593   0.007

                4.595   0.005

                4.595   0.005

                4.597   0.003

                4.597   0.003

                4.598   0.002

                4.599   0.001

                4.600 10 0

                4.600 11 0

                4.601   0.001

                4.601   0.001

                4.601   0.001

                4.601      0.001

                4.601   0.001

                4.602   0.002

                4.602   0.002

                4.604   0.004

                4.607   0.007

                (hi)вар |xi – med(x)|

 

 

Так как число элементов п = 20 четное, то номер будет (20 + 1)/2 = 10.5. Тогда медиана ряда будет среднее между элементом с номером 10 (4.600) и 11 (4.600) и равна 4.600 м. Далее находим элементы ряда |xi – med(x)| и по тому же правилу его медиану, т.е. среднее между элементом с номером 10 (0.002) в вариационном ряде и номером 11 (0.002) которая равна АМО(h) = 0.002 м. Тогда на основе (35) имеем правило

 

.

Из формулы видно что ни одна разность не превосходит предела и следовательно грубых погрешностей в ряде нет.

Считая, что закон распределения ряда измерений не достаточно известен, для проверки однородности мер рассеивания (гетероскедастичности) применим непараметрический критерий ранговой корреляции Спирмена

Для начала вычислим оценки меры рассеивания результатов измерений в виде остатков  в мм

 

 -4 2 3 -7 -2 2 1 2 3 5 0 1 -2 -6 -1 -7 2 -4 2 8.

 

Чтобы доказать случайность этого ряда вычислим коэффициент ранговой корреляции Спирмена между номером элемента и остатком и проверим его на значимость отличия от нуля. Для этого получим ранги п i остатков как номера исходных элементов в вариационном ряду этих элементов как

 

4.5 14 17.5 1.5 6.5 14 10.5 14 17.5 19 9 10.5 6.5 3 8 1.5 14 4.5 14  20

            

и разности di = i –  ni между номером элемента и его рангом

 

 -3.5 -12 -14.5 2.5 -1.5 -8 -3.5 -6 -8.5 -9 2 1.5 6.5 11 7 14.5 3 13.5 5 0

                                          

и сумму квадратов [d2] = 1285.5. Учесть, что если в ряде, k одинаковых элементов, то у всех их окончательный ранг будет одинаков и равен среднему из рангов этих элементов.  Далее по (36) вычисляем коэффициент ранговой корреляции Спирмена:

 

.

 

При исследовании на значимость по критерию Стьюдента имеем

 

.

 

Эталонное (теоретическое) значение критерия t эт. из Matlab по модифицированной доверительной вероятности (1 + 0.95)/2 = 0.975 и числу степеней свободы 20 – 2 =18 будет

 

tt=tinv(0.975, 18) = 2.1.

 

Так как контрольное неравенство  t < t эт  (0.14 < 2.1) выполняется, то исходная гипотеза об отсутствии гетероскедастичности (неравенстве дисперсий измерений) не отвергается с вероятностью 0.95.


Поделиться:



Последнее изменение этой страницы: 2019-03-29; Просмотров: 422; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.037 с.)
Главная | Случайная страница | Обратная связь