Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Кафедра геодезии и кадастров



Кафедра геодезии и кадастров

Электронные методические указания

 к выполнению  лабораторной работы № 2

«Обработка одной многократно

 измеренной величины»

По дисциплине

 

«Теория математической обработки геодезических измерений»

для студентов 2 курса геодезического факультета

Автор: к.т.н., доцент Дегтярев Александр Михайлович

Версия 5

Новополоцк

2017 г

Оглавление

 

Введение и литература

Классическая обработка результатов многократного

     измерения одной величины

1.1. Обработка результатов многократно измеренной равноточной величины

              1.1.1. Порядок обработки

              1.1.2. Пример обработки равноточных измерений

1.2. Обработка результатов многократно измеренной неравноточной величины

              1.2.1. Порядок обработки

              1.2.2. Пример обработки неравноточных измерений

    1.3. Задача эталонирования

              1.3.1. Пример решения задачи эталонирования

2. Методы выявления мешающих параметров

2.1. Исследование ряда измерений на степень случайности (тренд)

2.1.1. Пример исследование ряда на степень случайности (тренд)

2.2. Исследование ряда измерений на степень однородности

              2.2.1. Пример исследования ряда на однородность

2.3. Исследование ряда измерений на степень независимости

              2.3.1. Пример исследования ряда на независимость

3. Получение альтернативных оценок результатов измерений.

    3.1. Альтернативные оценки сдвига

3.1.1. Пример вычислений альтернативных оценок сдвига

3.2. Альтернативные оценки масштаба

3.2.1. Пример вычислений альтернативных оценок масштаба

4*. Исследовательская работа (Дополнительно).

Введение

В геодезической практике все величины разделяются на измеренные и вычисленные, или полученные путем вычислений, как функции измеренных величин. Результат измерения в геодезии представляет собой именованное число.

По точности результаты измерений делят на равноточные и неравноточные. О равноточности или неравноточности результатов судят по полученным из опыта критериям точности. Основным критерием точности измерений по существующим стандартам является стандартное отклонение σ (старое название средняя квадратическая погрешность т) и различные её модификации в виде относительной погрешности, предельной погрешности, веса и др.

Существенной особенностью производства геодезических работ является наличие избыточных измерений. При измерении одной одномерной величины (длина, направление, угол, превышение и др.) для однозначного определения её значения необходимо выполнить одно измерение. Все остальные выполненные измерения будут считаться избыточными. Избыточные измерения позволяют производить математическую обработку результатов измерений одной величины, такую как контроль качества измерений, оценка точности измерений, получение из них наиболее надежного однозначного значения. Основной задачей математической обработки измерений одной величины является получение наилучшего приближения вероятного значения величины к её истинному значению и оценка качества измерений – количественное и качественное оценивание.

Обработка многократных измерений одной величины является основой всех других способов обработки и поэтому требует тщательного и всестороннего изучения. Теоретический анализ показывает, что основные проблемы обработки связаны с количеством измерений, степенью незнания закона распределения погрешностей результатов измерений и степенью отклонения ряда измерений от основополагающих характеристик: случайности, однородности и независимости результатов измерений. Иногда эту процедуру анализа называют процессом выявления влияния мешающих параметров. Это деление характеристик достаточно условно, так как все они очень тесно связаны между собой.

Анализ существующих подходов к обработке многократно измеренной величины позволяет определить следующие, наиболее часто встречающиеся ситуации:

1. Число измерений меньше 15, и, следовательно, о законе распределения ничего конкретного сказать не возможно, но можно в какой-то мере проследить мешающие параметры;

2. Число измерений больше 15, но меньше 50, и закон распределения погрешностей измерений можно приближенно установить, используя некоторые, достаточно сложные критерии (например, критерий Шапиро-Уилкса), а мешающие параметры устанавливаются довольно уверенно;

3. Число измерений не имеет значения, так как достаточно хорошо известен закон распределения и поэтому мешающие параметры можно хорошо установить по результатам дополнительных исследований.

Под мешающими параметрами будем понимать наличие грубых (сомнительных) погрешностей и разного рода значимых систематических влияний.

Исходя из этого, можно выделить следующие основные подходы при обработке многократно измеренной величины:

1. Классический без анализа, когда закон распределения погрешностей измерений достаточно хорошо известен и не имеется значимых мешающих параметров, т.е. ряд измерений достаточно случаен, однороден и независим. В геодезии не безосновательно предполагается, что результаты измерений в основном удовлетворительно подчиняются нормальному закону распределения Муавра-Гаусса-Лапласа.

    2. Закон распределения погрешностей измерений достаточно хорошо известен, но имеются сомнения на предмет достаточной случайности, однородности и независимости. Это классическая обработка с анализом (выявлением мешающих параметров в виде грубых погрешностей и разного рода систематических влияний).

3. Закон распределения погрешностей измерений практически не известен и также имеются сомнения на предмет достаточной случайности, однородности и независимости. Это альтернативная обработка с анализом (выявлением мешающих параметров в виде грубых погрешностей и разного рода систематических влияний).

4. Закон распределения погрешностей измерений практически не известен, но мы не имеем обоснованных сомнений относительно достаточной случайности, однородности и независимости результатов измерений. То есть, влияние мешающих параметров минимально. Это альтернативная обработка без анализа. 

 Отметим, что оценивание результатов измерений на основе знания закона распределения погрешностей измерений, образует группу алгоритмов, называемых параметрическими. Если при оценивании закон распределения погрешностей измерений не известен, то имеем группу алгоритмов, называемых непараметрическими. Достоинством непараметрических (свободных от распределения) методов проверки статистических гипотез является их расчетная простота. Однако мощность статистических критериев, построенных на их основе, уступает аналогичным параметрическим критериям (например, критериям Стьюдента, Фишера и т. п.). Очевидно, что это плата за незнание вида закона распределения случайных величин.

Рекомендуется следующий порядок использования непараметрических критериев:

– если распределение случайной величины неизвестно, то непараметрические критерии являются единственно возможными критериями для проверки различных статистических гипотез.

– если распределение известно, то рекомендуется сначала применить простые в вычислительном отношении непараметрические критерии. При отклонении ими проверяемой гипотезы дальнейшее уточнение не требуется. Если непараметрический критерий не отклоняет гипотезу, необходимо осуществить ее дальнейшую проверку одним из более точных параметрических критериев,

    В соответствии с изложенным, основной целью работы является освоение студентами методов обработки и оценки точности результатов геодезических измерений одной величины с помощью вычислительных средств в различных случаях практики, которые сводятся к рассмотренным выше ситуациям.

 

Краткая последовательность выполнения работы:

1. Обработать результаты многократно измеренной равноточной величины, считая, что они имеют закон распределения достаточно близкий к нормальному закону (классическая обработка без анализа);

2. Обработать результаты многократно измеренной неравноточной величины с использованием весов измерений на основе классических алгоритмов без анализа;

3. Выполнить задачу эталонирования для равноточного случая;

4. Провести исследование ряда измерений на предмет значимости его отклонения от случайности, однородности и независимости (значимость мешающих параметров) на основе параметрических алгоритмов анализа.

5. Провести исследование ряда измерений на предмет значимости его отклонения от случайности, однородности и независимости (значимость мешающих параметров) на основе непараметрических алгоритмов анализа.

6. Вычислить основные альтернативные оценки для сдвига и масштаба при обработке одной многократно измеренной величины;

7*(по желанию для повышения общей оценки). Выполнить исследовательскую работу, по изучению устойчивости оценок при наличии значимых систематических и грубых погрешностей.

По результатам выполнения работы представляется печатанный отчет.

Состав отчета:

1. Описать суть и методы обработки одной многократно измеренной равноточной и неравноточной величины и задачи эталонирования (желательно не более 1-2 стр). Описание может быть по ходу вычислений.

2. Представить с описанием результаты обработки многократно измеренной равноточной величины в точечном и интервальном виде.

4. Представить с описанием результаты обработки многократно измеренной неравноточной равноточной величины в точечном и интервальном виде.

5. Представить с описанием сути решение задачи эталонирования.

6. Описать необходимость и методы выявления значимости отклонения результатов измерений от случайности, однородности и независимости (значимости систематического влияния и грубых погрешностей).

7. Представить с описанием результаты анализа ряда измерений на степень значимости отклонения результатов от случайности, однородности и независимости (значимости мешающих параметров) в параметрической и непараметрической формах.

8. Описать суть, необходимость и методы получения альтернативных оценок сдвига и масштаба без анализа при обработке многократно измеренной величины.

9. Представить с описанием результаты вычислений альтернативных оценок сдвига и масштаба без анализа при обработке многократно измеренной величины.

    10*(если выполнялись исследования). Представить с выводами результаты исследовательской работы.

 

После выполнения работы студент должен знать:

1. Суть и последовательность обработки многократных равноточных и неравноточных измерений одной величины.

2. Суть и методы выявления степени отклонения измерений от случайности, однородности и независимости (т.е. в основном систематических и грубых погрешностей).

 

Должен уметь:

1. Самостоятельно обработать многогократные равноточные и неравноточные измерения с использованием традиционных и альтернативных оценок.

2. Правильно использовать и анализировать методики выявления грубых и систематических погрешностей при обработке многократных измерений одной величины.

 

Замечание 1. При записи и вычислениях сначала пишется используемая формула, а потом численное значение с подставленными данными, а число цифр в ответе столько, сколько в исходных данных с одной запасной в виде индекса.

 Например, расчет для превышений в геометрическом нивелировании (мм, 3 знака после запятой в исходных данных):

Старое название погрешности – средняя квадратическая погрешность m, новое – стандартное отклонение σ. Пока используются оба.

Замечание 2. Если доверительная вероятность не оговаривается отдельно, то её следует принять в 95%.

Замечание 3. Доверительная вероятность обозначается или р, или β.

Замечание 4. Студент обязан выполнить хотя бы одно дополнительное задание.

Литература

1. Дегтярев А. М. Вероятностно-статистические методы в геодезии. Конспект лекций. – Новополоцк, ПГУ, 2005 г. - 208 с.

2. Маркузе Ю. И. Практикум по теории математической обработки геодезических измерений. – М.: Недра, 1986 г. - 358 с.

    3. Кобзарь А. И. Прикладная математическая статистика. Для инженеров и научных работников. - М.: Физматлит, 2006. - 816 с.

 

Величины

 

    Произведен ряд равноточных измерений одной величины. Исходя из классических предпосылок о соответствии погрешностей измерений нормальному закону распределения и отсутствии значимых систематических и грубых влияний наилучшей оценкой для математического ожидания, будет обычное среднее арифметическое ( простая арифметическая середина )

 

.                                              (1)

 

Оценка меры рассеивания (стандарта), в данной ситуации будет в виде стандартного отклонения σ (старое название средняя квадратическая погрешность ) на основе формулы Бесселя , или погрешность одного измерения

 

.                                 (2)

 

Не сложно доказать, что отклонения от среднего арифметического vi обладают следующими свойствами:

 

.                                   (3)

 

Первое свойство (3) является контролем вычисления (1) и (2). Второе свойство говорит, что при принятых условиях оценка качества (2) является эффективной, т.е. имеет минимальную дисперсию.  

Используя формулу погрешности функции, представленной видом (1), получим стандартное отклонение среднего арифметического (среднюю квадратическую погрешность среднего арифметического) из n измерений

 

.                                                    (4)

 

Обычно, для выявления степени надежности оценок, ищут оценки оценок. Считается, что если оценка оценки не одного порядка с оцениваемой величиной, а хотя бы раза в 2 меньше, то она заслуживает доверия. Стандартное отклонение (2) при достаточно большом n, приближенно, но достаточно надежно, характеризуется стандартным отклонением вида

 

,                                         (5)

 

а стандартное отклонение погрешности среднего арифметического (4) как

 

.                                         (6)

 

Результаты необходимо представить в виде

 

.                      (7)

 

Оценки такого рода называют точечными. Для более детальной и достоверной обработки результатов многократно измеренной величины (особенно при малом п) в обязательном порядке ищутся интервальные оценки для истинных значений основных характеристик, оцененных по формулам (1), (2) и (4). Для них интервальные оценки имеют вид

 

                          (8)

 

Здесь tp квантиль t-распределения Стьюдента для доверительной вероятности p (или уровня значимости α ), с n – 1 степенью свободы; коэффициенты g с n – 1 степенью свободы при доверительной вероятности p находят на основе квантилей распределения c2, и в силу его несимметричности, получаемых по вычисленным вероятностям  для , а для  соответственно = , как

.                                (9)

 

Третья формула из (7) получена из второй простым делением левой и правой части на . Доверительные вероятности для практических целей целесообразно принимать от 90 до 95%.

Квантили соответствующих распределений рекомендуется получить с использованием  математического пакета Matlab (см. примеры ниже).

 

 

Порядок обработки

Исходные данные для обработки получаем следующим образом:

В программе Matlab следует набрать следующие строки

 

randn(‘ state’, sum(ГП*10* clock)); h = n + randn(20, 1)*0.0ГП/Г;

rand(‘state’, sum(ГП *10*clock));  N = fix(rand(20, 1)*ГП /Г )

Здесь n – номер студента по списку, ГП – группа/подгруппа одним числом, Г – номер группы. Например, для студента 3 группы 2 подгруппы и 12 по списку имеем

 

randn(‘state’, sum(320*clock)); h = 12 +randn(20, 1)*0.032/3

rand(‘state’, sum(320*clock)); N = fix(rand(20, 1)*32/3)

получив, таким образом, 20 измерений hi одного превышения и число станций Ni при измерении i-того превышения в виде вектора N из 20 целых величин. Процедура генерации в отчет не включается.

 

Саму обработку результатов проводят в следующем порядке:

1. Получить оценку математического ожидания (оценку среднего вероятного из результатов, или оценку сдвига) в виде среднего арифметического;

    2. Вычислить оценку стандарта в виде стандартного отклонения (средней квадратической погрешности) по Бесселю (погрешность одного измерения);

3. Получить погрешность среднего арифметического;

4. Вычислить погрешность средней квадратической погрешности по Бесселю;

5. Получить интервальную оценку среднего арифметического с доверительной вероятностью 95%;

6. Получить интервальную оценку стандартного отклонения по Бесселю с доверительной вероятностью 95%;

 

Пример обработки равноточных измерений

 

Обработать ряд измерений из 20 превышений.

В первую очередь генерируем в качестве исходных для обработки данных 20 значений измеренного превышения hi которые следует округлить до 3 знаков, так как подразумевается геометрическое нивелирование и точность измерений, таким образом, до мм, а также число станций на секцию п i (см. таблицу 1).

 

h. Ni
1 4.595 10
2 4.601 8
3 4.602 8
4 4.592 10
5 4.597 6
6 4.601 8
7 4.600 8
8 4.601 4
9 4.602 3
10 4.604 4
11 4.599 7
12 4.600 9
13 4.597 9
14 4.593 7
15 4.598 3
16 4.592 9
17 4.601 7
18 4.595 10
19 4.601 8
20 4.607 8

 

Таблица 1. Исходные данные: превышения и число станций

 

Априорно считается, что все условия Гаусса-Маркова и центральной предельной теоремы Ляпунова соблюдены, т.е., постоянство математического ожидания и дисперсии, некоррелированность, отсутствие грубых измерений, значимого систематического влияния и нормальное распределение результатов измерений обеспечены в необходимой степени.

 

Последовательность обработки по пунктам следующая:

 

1. Краткое описание теоретических положений (можно по ходу вычислений).

2. Пользуясь данными таблицы, вычисляем оценку математического ожидания (сдвига, центра) в виде среднего арифметического (СА):

 

,

 

где четвертая индексная цифра в результате – запасная, которая необходима при представлении промежуточных вычислений.

 

2. Вычисляем оценку стандарта в виде стандартного отклонения (СКП)

 

где .

 

3. Находим оценку точности получения среднего арифметического, оценку оценки среднего арифметического и оценку точности стандартного отклонения

 

Так как оценка оценки среднего арифметического и стандартного отклонения величины не одного порядка, то значение оценок среднего арифметического и стандартного отклонения  вычислены по достаточному количеству элементов и заслуживает доверия. Окончательные результаты запишем как

 

 

4. Находим значения интервальных оценок, как более приемлемых для практических нужд, для истинных значений оцениваемых характеристик с вероятностью р = 0.95. Для получения вероятностного коэффициента tр  (квантиля распределения Стьюдента) используем команду в Matlab для вероятности р = 0.95 и числа степеней свободы k = n – 1. У нас n = 20 и k = 19

 

tр=tinv((0.95+1)/2, 19),

 

и получаем значение tр = 2.09. Здесь вероятность 0.95 модифицируется как (1 + p)/2, так как используется двухсторонний интервал. Теперь имеем

 

 

для оценки истинного значения измеряемой величины. Очевидно, что оцененное значение (среднее арифметическое) должно лежать в вычисленном интервале.

5. Получаем интервальные оценки теоретического значения стандарта и стандарта математического ожидания при p = 0.95. Для вычисления вероятностных коэффициентов (квантилей распределения хи-квадрат Пирсона) также воспользуемся командами Matlab при следующих модифицированных вероятностях ((1+ p)/2 = 0.975 для 1, или левой границы и (1- p)/2 = 0.025 для 2, или правой границы интервала)

 

chi1=chi2inv(0.975, 19)

chi2=chi2inv(0.025, 19).

 

В результате имеем вероятностные коэффициенты = 32.9 и = 8.9, по которым вычисляются коэффициенты интервала γ 1 и γ 2 (см. формулы теории выше). Тогда значения коэффициентов  будут.γ 1 = 0.76,         γ 2 = 1.46 соответственно.

Окончательные интервалы для точностных характеристик будут

 

,

 

 

 

 

Пример обработки неравноточных измерений

1. Из таблицы исходных данных видим, что превышение в каждой секции определялось разным количеством станций ni – то есть в разных условиях, что необходимо учесть введением соответствующего веса pi. В данном случае он может быть получен как , где с – константа, например равная 1, 5, 10, или др. Приняв с = 10, имеем наиболее вероятное значение в виде среднего весового

 

 

2. Погрешность одного измерения или ошибка единицы веса будет

 

 

3. Погрешность среднего весового

 

 

Определим погрешности единицы веса и погрешности среднего арифметического для выявления степени их надежности

 

 

.

4. Доверительный интервал для истинного значения определяемой величины при тех же вероятностных условиях будет

 

 

5. Доверительные интервалы для истинного стандарта и истинной погрешности среднего взвешенного будут

.

Задача эталонирования

 

Такого рода задачи возникают в ситуации, когда не известны точностные характеристики средства измерения, но имеется эталон измеряемой величины (например, в виде компаратора). Тогда, произведя n измерений эталона, возможно вычислить как-бы истинные погрешности, считая значение эталона достаточным приближением к истинному значению. В этом случае для оценки качества измерений (точности прибора) пользуются формулой Гаусса , предварительно получив истинные погрешности

 

     ,                                         (18)

 

.                                            (19)

 

Здесь Х – приближение к истинному значению измеряемой величины в виде эталона. Полученное значение σ и является погрешностью прибора в виде стандартного отклонения (СКП), если отсутствуют значимые грубые или систематические влияния. Значимость грубых ошибок достаточно хорошо в этом случае может быть оценена по правилу трех сигм:

 

,                                               (20)

 

где погрешность  получена из (2). Все измерения, выходящие за этот интервал можно считать грубыми и не включать в обработку.

Значимость систематического влияния определяется на основе выполнения неравенства

 

,                                            (21)

 

где  – погрешность среднего арифметического из истинных погрешностей D i. Очевидно, что при отсутствии систематического влияния, величина среднего должна точно равняться нулю.

При невыполнении неравенства (21) получают новый ряд, в среднем свободный от систематического влияния как

                  

                                                  ,                                         (22)

 

а оценку точности проводят по формуле Бесселя (2).

 

Пример решения задачи эталонирования

1. Пусть в качестве эталонного для величины, которая измеряется n раз принято значение hист. = 4.601м. (см. Таблицу 1 исходных данных).

2. Находим истинные погрешности , а по ним находим среднее арифметическое и по формуле Гаусса получаем стандартное отклонение одного измерения

 

 

  3. Находим стандартное отклонение этой погрешности как

 

 

Соотношение этих величин говорит о достаточной надежности оценок, а среднее о некотором малом отрицательном систематическом влиянии. Теперь необходимо выявить значимость этого систематического влияния. Для истинных погрешностей используем формулу . При доверительной вероятности р = 0.95, числе степеней свободы n – 1 = 19 и для квантиля tр = 2.1, получаем неравенство

 

|0.0023| £ 2.1× 0.0012 = 0.0025,

 

которое почти не выполняется и это говорит о том, что уже желательно (но пока не обязательно) учесть имеющееся систематическое влияние, которое становится почти значимым.

    Выявление грубых погрешностей на основе правила «трех сигм» дает интервал для результатов измерений

 

[hист -3 σ ; hист +3 σ ], или [4.585 м; 4.617 м],

 

 в который попадают все результаты, т.е. ни одно из измерений не является грубым.

 

Пример исследования ряда на однородность

 

Для определения наличия грубых ошибок по правилу Хэмпэла в первую очередь необходимо вычислить медиану ряда med(h) и отклонения текущего измерения от медианы hi med(h). Медиана не совсем вычисляется, скорее выбирается по следующему правилу. Ряд измерений выстраивают по возрастанию (вариационный ряд). Если число элементов в ряде не четное, то элемент вариационного ряда с номером (п + 1)/2 и будет медианой ряда. Если число элементов в ряде четное, то элемент с номером (п + 1)/2 получается дробным с половинкой. Тогда медиана будет средним между значениями, соответствующими меньшему целому для номера и большему целому для номера в вариационном ряде. Для нашего примера имеем вариационный ряд

 

                4.592   0.008               

                4.592   0.008

                4.593   0.007

                4.595   0.005

                4.595   0.005

                4.597   0.003

                4.597   0.003

                4.598   0.002

                4.599   0.001

                4.600 10 0

                4.600 11 0

                4.601   0.001

                4.601   0.001

                4.601   0.001

                4.601      0.001

                4.601   0.001

                4.602   0.002

                4.602   0.002

                4.604   0.004

                4.607   0.007

                (hi)вар |xi – med(x)|

 

 

Так как число элементов п = 20 четное, то номер будет (20 + 1)/2 = 10.5. Тогда медиана ряда будет среднее между элементом с номером 10 (4.600) и 11 (4.600) и равна 4.600 м. Далее находим элементы ряда |xi – med(x)| и по тому же правилу его медиану, т.е. среднее между элементом с номером 10 (0.002) в вариационном ряде и номером 11 (0.002) которая равна АМО(h) = 0.002 м. Тогда на основе (35) имеем правило

 

.

Из формулы видно что ни одна разность не превосходит предела и следовательно грубых погрешностей в ряде нет.

Считая, что закон распределения ряда измерений не достаточно известен, для проверки однородности мер рассеивания (гетероскедастичности) применим непараметрический критерий ранговой корреляции Спирмена

Для начала вычислим оценки меры рассеивания результатов измерений в виде остатков  в мм

 

 -4 2 3 -7 -2 2 1 2 3 5 0 1 -2 -6 -1 -7 2 -4 2 8.

 

Чтобы доказать случайность этого ряда вычислим коэффициент ранговой корреляции Спирмена между номером элемента и остатком и проверим его на значимость отличия от нуля. Для этого получим ранги п i остатков как номера исходных элементов в вариационном ряду этих элементов как

 

4.5 14 17.5 1.5 6.5 14 10.5 14 17.5 19 9 10.5 6.5 3 8 1.5 14 4.5 14  20

            

и разности di = i –  ni между номером элемента и его рангом

 

 -3.5 -12 -14.5 2.5 -1.5 -8 -3.5 -6 -8.5 -9 2 1.5 6.5 11 7 14.5 3 13.5 5 0

                                          

и сумму квадратов [d2] = 1285.5. Учесть, что если в ряде, k одинаковых элементов, то у всех их окончательный ранг будет одинаков и равен среднему из рангов этих элементов.  Далее по (36) вычисляем коэффициент ранговой корреляции Спирмена:

 

.

 

При исследовании на значимость по критерию Стьюдента имеем

 

.

 

Эталонное (теоретическое) значение критерия t эт. из Matlab по модифицированной доверительной вероятности (1 + 0.95)/2 = 0.975 и числу степеней свободы 20 – 2 =18 будет

 

tt=tinv(0.975, 18) = 2.1.

 

Так как контрольное неравенство  t < t эт  (0.14 < 2.1) выполняется, то исходная гипотеза об отсутствии гетероскедастичности (неравенстве дисперсий измерений) не отвергается с вероятностью 0.95.

Пример исследования ряда на независимость

.Для исследования ряда на независимость по критерию Дарбина-Уотсона  воспользуемся полученной ранее линейной моделью ряда в зависимости от номера i

 

 

и величинами остатков vi = (hi)мод – hi  в м

 

.

 

Последовательные разности остатков, т.е. величины vi – vi -1 (т.е. 2 остаток минус 1, 3 минус 2, 4 минус 3 и т.д.) получим используя функцию diff в Matlab для вычисления последовательных разностей

 

pr=diff(v),

 

а их сумму квадратов для формулы (39) как

spr2=pr'*pr,

 

которая для нашего ряда остатков равна 0.000479. Знаменатель (39), сумма квадратов остатков, вычислим в Matlab как

 

sv2=v'*v,

 

которая будет равна 0.000299. Тогда по (39) статистика Дарбина-Уотсона для выявления степени независимости между соседними элементами ряда измерений будет

 

,

а выборочный коэффициент корреляции  между соседними остатками по статистике DW из (40)

 

.

 

Анализируя полученные результаты можно сделать вывод, что так как статистика DW = 1.60 ≈ 2, = 0.20 ≈ 2 и 1.5 < DW= 1.60 < 2.5 то автокорреляцию в ряде измерений можно практически считать равной нулю, а ряд практически независимым.

 

 

Пример вычислений альтернативных оценок сдвига

 

По схеме оптимального оценивания для начала найдем среднее арифметическое из значений нашего ряда hi

 

 Далее найдем четыре альтернативные оценки сдвига: усеченное среднее, медиану, псевдомедиану, оценку Хогга, сравним со средним и сделаем выводы об окончательном виде оценки.

Приняв степень усечения α = 10% (0.1) для числа элементов в ряде n = 20, имеем k = 20 ∙ 0.1 = 2 элемента. Строим вариационный ряд. Тогда, 10% усеченное среднее  получим как среднее из ряда в 16 элементов, отбрасываются слева 2 и справа 2 в вариационном ряде (максимальных и минимальных значений)

 

м.

 

------------------------

*Дополнительно . Винзоризованное средне при винзоризации α = 10% (0.1)  получим следующим образом. Строим вариационный ряд, и так как k = 20 ∙ 0.1 = 2 элемента, то в нем 1 и 2 (минимальные значения) заменяем на третье из ряда, а 19 и 20 (максимальные), заменяем на 18 элемент из ряда.

 

4.592   4.593       

                4.592   4.593 k = 2   

                4.593   4.593       

                4.595   4.595       

                4.595   4.595       

                4.597   4.597       

                4.597   4.597       

                4.598   4.598       

                 4.599   4.599       

                4.600   4.600       

                4.600   4.600       

                4.601   4.601       

                4.601   4.601       

                4.601   4.601       

                4.601   4.601       

                4.601   4.601       

                4.602   4.602       

                4.602   4.602       

                4.604   4.602 k =

                4.607   4.602       

                 h(i) 

 

Из полученного нового ряда берем среднее, которое и будет винзоризованное средне при винзоризации α = 10% (0.1)

 

 м.

 

-------------------------

Следующая альтернативная оценка сдвига – медиана ряда. Для её получения, как описано ранее считаем коэффициент t = (n +1)/2 = 10.5. Тогда медиана будет среднее из элемента с номером 10 и 11 в вариационном ряде

 

med(h) = 4. 600 м.

 

Для вычисления псевдомедианы (R -оценки Ходжеса-Лемана θ HL) необходимо на основе (41) вычислить средние Уолша вперед из вариационного ряда, т.е. среднее между 1 и 1 элементом, 1 и 2, 1 и 3, 1 и 4, …, 1 и 20; 2 и 2, 2 и 3, 2 и 4, 2 и 5, …, 2 и 20; 3 и 3, 3 и 4, …, 3 и 20; …, 19 и 19, 19 и 20, 20 и 20. Всего п(п +1)/2 = 210 величин. Для вычислений используем функцию Matlab для вычисления средних Уолша

 

mw = meanw(h, 1).

 

Второй аргумент в функции говорит о том, что в ряд из средних Уолша включаются средние между одноименными элементами, то, что нам и надо. Если взять аргумент равный 0, то эти средние не включаются в новый ряд из средних Уолша. На основе этого ряда получают упрощенную оценку Ходжеса-Лемана, которая также используется достаточно часто. Все средние Уолша в отчете не представляются. Для нахождения медианы, (см. (42)) выстраиваем средние Уолша в вариационный ряд и считаем коэффициент (п +1)/2 = 105.5. Таким образом, искомая медиана из средних Уолша и псевдомедиана (R -оценка Ходжеса-Лемана θ HL) будет среднее из 105 (4.599) и 106 (4.599) элемента из вариационного ряда средних Уолша

 

 м.

 

-------------------------

* Дополнительно. Для вычисления другой R-оценки Бикела-Ходжеса строим вариационный ряд. Из этого ряда строим новый ряд, состоящий из средних арифметических двух значений из вариационного ряда вовнутрь (частных полуразмахов): первое – последнее, второе – предпоследнее и т.д. В числах имеем ряд

4.5995 4.598 4.5975 4.5985 4.598 4.599  4.599 4.5995 4.600 4.600.

 Медиана  этого ряда и есть искомая оценка Бикела-Ходжеса (43)

 

 м.

 

-------------------------------

В заключение вычислим очень полезную и устойчивую адаптивную оценку Хогга на основе схемы (44).

 

                             

 

Чтобы узнать какой из четырех оценок воспользоваться, рассчитаем индикационный коэффициент k на основе оценки не приведенного эксцесса Е* и для контроля его робастный аналог tn. Оценка индикатора на основе не приведенного эксцесса будет (45)

 

.                                              

 

 

Здесь σ – стандартное отклонение из (2)  и равное 0.004 м. 

Значение робастного коэффициента tn по (46), будет

 

,                                       

 

Здесь an(0.05) = 200.05 = 1 – максимальный элемент ряда, bn(0.05) = 200.05 = 1 – минимальный элемент ряда. Тогда числитель будет разность максимального и минимального значений, т.е. 4.607 – 4.592 = 0.015. an(0.5) = 200.5 = 10 – среднее из первых 10 элементов вариационного ряда, равная 4.602, bn(0.5) = 200.5 = 10 – среднее из последних 10 элементов вариационного ряда, равная 4.5958. Тогда знаменатель будет их разность 4.602 – 4.5958 = 0.0062.

    Так как индикатор 2.42 ≈ 2.37 – ряд не имеет значимых отклонений и конечное значение можно принять 2.37. Эта величина попала в интервал от 3 до 4, и таким образом используем в качестве окончательной оценки вторую формулу схемы Хогга , которая является обычным средним арифметическим и равным 4.599 м.;

 

Анализ результатов (обязателен): среднее значение из ряда 4.599 м, усеченное среднее 4.598 м, медиана 4.600, псевдомедиана 4.599, оценка Хогга 4.599 м. Таким образом, и стандартная оценка в виде среднего и все альтернативные, устойчивые к разного рода отклонениям от основных характеристик, дают практически одинаковые результаты, т.е. все отличия меньше погрешности измерения σ = 0.004 м. Значит в качестве конечной оценки сдвига имеет смысл взять среднее значение, равное 4.599 м.

 

 

Пример вычислений альтернативных оценок масштаба

 

Схема оптимального вычисления оценок масштаба следующая: вычисляется традиционная оценка в виде стандартного отклонения σ . Далее вычисляем альтернативные оценки в виде средней абсолютной погрешности САП(h),  абсолютное медианное отклонение АМО(х). Интерквартильный размах IQR дополнительно. Через коэффициенты ki пересчитываем их в стандартное отклонение. Дополнительно вычисляем линейную оценку Даунтона. Сравнивая традиционные и альтернативные величины, делаем вывод о конечном значении оценки сдвига.

Традиционное стандартное отклонение на основе (2) есть σ = 0.004 м.

Среднюю абсолютную погрешность САП(х) вычислим по (47) как

 

 м.                                               

 

Стандартное отклонение через коэффициент k1 и САП(х) будет равно 

 

 м.                       

 

Абсолютное медианное отклонение АМО(х) по (49) будет иметь значение

 м. 

                               

Стандартное отклонение через коэффициент k2 и АМО(х)  будет 

 

 м.

 

-------------------

* Дополнительно. Перед вычислением интерквартильного размаха  IQR(х) получим 3 квартили: нижнюю Q1, среднюю Q2 и верхнюю  квартиль Q3 используя формулы (51)

 

                                     

 

Эти числа есть номера соответствующих квартилей в вариационном ряду. Так как номера дробные, для вычисления окончательных значений проведем линейную интерполяцию. Нижняя  квартиль Q1 имеет номер 5.25, т.е. между 5 (4.595) и 6 (4.597) элементом вариационного ряда со сдвигом на 0.25. Для интерполяции разность между элементами 0.002 умножаем на сдвиг 0.25 и полученную величину прибавляем к меньшему значению

 

Q1 = 0.002 ∙ 0.25 + 4.595 = 4.5955 м.

 

Средняя  квартиль Q2  с номером 10.5 есть ранее вычисленная медиана, равная 4.600 м.

Верхняя  квартиль Q3 имеет номер 15.75, т.е. между 15 (4.601) и 16 (4.601) элементом вариационного ряда со сдвигом на 0.75. Так значения одинаковы,  интерполяция не требуется и  Q3  = 4.601 м.

Теперь величина интерквартильного размаха будет

 

IQR(x) = Q3 – Q1 = 4.601 – 4.5955 = 0.0055 м.                                      

 

Стандартное отклонение через коэффициент k3 и IQR(х)  будет 

 

 м.

 

------------------------

* Дополнительно. Из линейных оценок выделяют L -оценку Даунтона (1966 г.), которая имеет весьма хорошие свойства, устойчива к нарушению основных предположений и очень эффективна. Для её построения также используется вариационный ряд. На основе (54) значение оценки будет 

 

 

м.                         

 

* Дополнительно . Вычислим другую форму оценки Даунтона, которая называется оценкой (статистикой) в последовательных разностях Джини. Для этого вычисляют последовательные разности вперед dij между i и j измерением в нормальном ряде (по аналогии со средними Уолша).  Имея сумму абсолютных значений этих разностей [|dij|] = 0.866 (см. оценку Даунтона), на основе (55) получим  величину оценки Джини

 

 м.                      

 

которая отличается от оценки Даунтона только коэффициентом 1.7724.  

 

-------------------------

Выводы: По результатам вычислений можно сделать следующие выводы: традиционная оценка сдвига в виде стандартного отклонения σ = 0.004 м, с тандартное отклонение через среднюю абсолютную погрешность равно  м, стандартное отклонение через абсолютное медианное отклонение   будет  м,  стандартное отклонение через интерквартильный размах есть  м, а L -оценка Даунтона  м. Таким образом, все вычисленные характеристики не отличаются друг от друга на величину, большую чем погрешность вычисления стандартного отклонения и в качестве окончательной оценки масштаба можно принять стандартного отклонения σ = 0.004 м.

 

 

 

 

*4. Исследовательская работа ( Дополнительно)

 

Исследовательская работа подразумевает следующие направления:

– внести искажения в хорошие нормально распределенные измерения;

– произвести расчеты по рассмотренным формулам, или другим, из дополнительной литературы;

– провести анализ и дать рекомендации по использованию тех или иных формул в зависимости от вида и степени искажения результатов измерений.

В качестве искажений можно использовать:

– 1 или несколько грубых (в 5-10 σ ), с одной стороны, или симметрично в результатах измерений;

– систематическое влияние в виде тренда среднего;

– линейную, или другую неравноточность в результатах измерений;

– различные комбинации перечисленных выше вариантов.

Результаты попытаться обосновать теоретически.

Если студент считает, что полученные им результаты значимы, он может сделать доклад на студенческой научной конференции.

 

 

Кафедра геодезии и кадастров


Поделиться:



Последнее изменение этой страницы: 2019-03-29; Просмотров: 314; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.423 с.)
Главная | Случайная страница | Обратная связь