Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Альтернативные оценки сдвига



 

Одной из наиболее простых и старых робастных альтернативных оценок сдвига является усеченное среднее ( -усеченное среднее), со степенью усечения α %, которое использовали ещё Менделеев и Пуанкаре. Для его вычисления строят из измерений вариационный ряд, в котором необходимо отбросить с левой и правой стороны α % значений, а из оставшихся взять обычное среднее арифметическое. Число отбрасываемых элементов есть целая часть от (α %)∙ n, где n – число измерений в ряде. Другой, более поздний аналог этой оценки, это  винзоризованное среднее ( - винзоризованное среднее Винзора). Для его нахождения необходимо в вариационном ряду % крайним значениям присвоить значения: слева – +1 значение, а справа – (n – 1) значение. Из преобразованного ряда берется обычное среднее арифметическое. Усеченное средне не совсем удобно, так как приводит к потере информации (безвозвратному отбрасыванию выполненных измерений) если число измерений не велико. Винзоризованное среднее в этом отношении лучше, так как не отбрасывает, а модернизирует экстремальные измерения в ряде. Но если экстремальные элементы являются грубыми, да ещё и с одной стороны ряда, то эта оценка приводит к очень негативным результатам, так как не устраняет, а тиражирует эту грубость.

Если степень усечения не известна, или не задана, то её обычно принимают равным 10%.

Другая, наверно самая известная из робастных альтернативных оценок носит название медиана ряда. Медиану med(x) находят в виде среднего элемента в возрастающем вариационном ряду при нечетном числе измерений  п, или как среднее из двух элементов в середине ряда, если п четное (или смотри алгоритм выше. Очевидно, что медиана является наиболее устойчивой оценкой к наличию грубых измерений и, как показал Эджворт, достаточно устойчива к некоторым видам систематического влияния.  

Ещё одну модификацию оценки сдвига на основе медианы называют псевдомедиана, или R-оценка Ходжеса-Лемана.  Её получают как медиану из всех возможных пар средних i и j вперед (ij) из ряда измерений. У автора ряд должен быть вариационным, т.е. значения выстроены по возрастанию, но в принципе это не обязательно. Попарные средние, в статистике, носят название средних Уолша, и вычисляются как

 

                                                                    (41)

 

Тогда псевдомедиана (оценка Ходжеса-Лемана) ряда будет

 

.                     (42)

Средние берутся только вперед: между 1 и 2, 1 и 3, 1 и 4 …, 2 и 3, 2 и 4 … и т.д. и к полученному ряду добавляется исходный ряд, т.е. средние между 1 и 1, 2 и 2, 3 и 3 и т.д., так как в форуле автора ij.

 

-------------------------

* Дополнительно. Ещё одна модификация оценки на основе медианы получила название  оценка Бикела-Ходжеса . Находится как медиана из ряда, полученного из средних арифметических двух значений из вариационного ряда вовнутрь (частных полуразмахов): первое – последнее, второе – предпоследнее и т.д.;

 

.                                       (43)

 

Здесь x(i)  – номер элемента в вариационном ряде.

 

---------------------------

Наряду с этими оценками большое распространение в условиях неопределенности и малом количестве измерений получила адаптивная оценка Хогга. Для её получения используется следующая схема:

 

                         (44)

 

Здесь  – среднее из первых 25% и последних 25% значений вариационного ряда;

     – -урезанное среднее. Если  = 0, то имеем стандартное среднее арифметическое;  = 0.25, то из вариационного ряда удаляется 25% наименьших и 25% наибольших значений, а из оставшихся берется среднее арифметическое;  = 0.5, то удаляем по 50% слева и справа и получают обычную медиану.

Для того чтобы узнать какой оценкой из четырех пользоваться, рассчитывают коэффициент k, характеризующий «тяжесть хвостов» распределения, с учетом того, что для нормального распределения это должна быть какая либо известная величина. Для оценки коэффициента k используют

–  значение оценки не приведенного эксцесса

 

,                                           (45)

 

тогда для точно нормального закона эта величина равна точно 3;

– если требуется устойчивая (и непараметрическая) оценка коэффициента, то для вычисления используют линейные комбинации измерений, наподобие описанных выше. Значение коэффициента, обозначенного tn, по Хоггу, вычисляют по формуле

 

,                                   (46)

 

где  – средние по (100∙ b)% наибольших и наименьших элементов вариационного ряда соответственно

Оценка Хогга очень устойчива к разного рода отклонениям от главных предположений (нормальность, случайность, однородность и независимость) и является достаточно эффективной уже при числе измерений порядка пяти и как показали исследования, является одной из лучших альтернативных оценок.

Таким образом, для эффективного оценивания сдвига ряда измерений вычисляется среднее арифметическое и одна (или несколько) альтернативных робастных оценок. Если нет отличия, или оно минимальное, оставляют среднее арифметическое. Если отличия большие, то в качестве окончательной оценки, берётся альтернативная оценка.

 

 

 

Пример вычислений альтернативных оценок сдвига

 

По схеме оптимального оценивания для начала найдем среднее арифметическое из значений нашего ряда hi

 

 Далее найдем четыре альтернативные оценки сдвига: усеченное среднее, медиану, псевдомедиану, оценку Хогга, сравним со средним и сделаем выводы об окончательном виде оценки.

Приняв степень усечения α = 10% (0.1) для числа элементов в ряде n = 20, имеем k = 20 ∙ 0.1 = 2 элемента. Строим вариационный ряд. Тогда, 10% усеченное среднее  получим как среднее из ряда в 16 элементов, отбрасываются слева 2 и справа 2 в вариационном ряде (максимальных и минимальных значений)

 

м.

 

------------------------

*Дополнительно . Винзоризованное средне при винзоризации α = 10% (0.1)  получим следующим образом. Строим вариационный ряд, и так как k = 20 ∙ 0.1 = 2 элемента, то в нем 1 и 2 (минимальные значения) заменяем на третье из ряда, а 19 и 20 (максимальные), заменяем на 18 элемент из ряда.

 

4.592   4.593       

                4.592   4.593 k = 2   

                4.593   4.593       

                4.595   4.595       

                4.595   4.595       

                4.597   4.597       

                4.597   4.597       

                4.598   4.598       

                 4.599   4.599       

                4.600   4.600       

                4.600   4.600       

                4.601   4.601       

                4.601   4.601       

                4.601   4.601       

                4.601   4.601       

                4.601   4.601       

                4.602   4.602       

                4.602   4.602       

                4.604   4.602 k =

                4.607   4.602       

                 h(i) 

 

Из полученного нового ряда берем среднее, которое и будет винзоризованное средне при винзоризации α = 10% (0.1)

 

 м.

 

-------------------------

Следующая альтернативная оценка сдвига – медиана ряда. Для её получения, как описано ранее считаем коэффициент t = (n +1)/2 = 10.5. Тогда медиана будет среднее из элемента с номером 10 и 11 в вариационном ряде

 

med(h) = 4. 600 м.

 

Для вычисления псевдомедианы (R -оценки Ходжеса-Лемана θ HL) необходимо на основе (41) вычислить средние Уолша вперед из вариационного ряда, т.е. среднее между 1 и 1 элементом, 1 и 2, 1 и 3, 1 и 4, …, 1 и 20; 2 и 2, 2 и 3, 2 и 4, 2 и 5, …, 2 и 20; 3 и 3, 3 и 4, …, 3 и 20; …, 19 и 19, 19 и 20, 20 и 20. Всего п(п +1)/2 = 210 величин. Для вычислений используем функцию Matlab для вычисления средних Уолша

 

mw = meanw(h, 1).

 

Второй аргумент в функции говорит о том, что в ряд из средних Уолша включаются средние между одноименными элементами, то, что нам и надо. Если взять аргумент равный 0, то эти средние не включаются в новый ряд из средних Уолша. На основе этого ряда получают упрощенную оценку Ходжеса-Лемана, которая также используется достаточно часто. Все средние Уолша в отчете не представляются. Для нахождения медианы, (см. (42)) выстраиваем средние Уолша в вариационный ряд и считаем коэффициент (п +1)/2 = 105.5. Таким образом, искомая медиана из средних Уолша и псевдомедиана (R -оценка Ходжеса-Лемана θ HL) будет среднее из 105 (4.599) и 106 (4.599) элемента из вариационного ряда средних Уолша

 

 м.

 

-------------------------

* Дополнительно. Для вычисления другой R-оценки Бикела-Ходжеса строим вариационный ряд. Из этого ряда строим новый ряд, состоящий из средних арифметических двух значений из вариационного ряда вовнутрь (частных полуразмахов): первое – последнее, второе – предпоследнее и т.д. В числах имеем ряд

4.5995 4.598 4.5975 4.5985 4.598 4.599  4.599 4.5995 4.600 4.600.

 Медиана  этого ряда и есть искомая оценка Бикела-Ходжеса (43)

 

 м.

 

-------------------------------

В заключение вычислим очень полезную и устойчивую адаптивную оценку Хогга на основе схемы (44).

 

                             

 

Чтобы узнать какой из четырех оценок воспользоваться, рассчитаем индикационный коэффициент k на основе оценки не приведенного эксцесса Е* и для контроля его робастный аналог tn. Оценка индикатора на основе не приведенного эксцесса будет (45)

 

.                                              

 

 

Здесь σ – стандартное отклонение из (2)  и равное 0.004 м. 

Значение робастного коэффициента tn по (46), будет

 

,                                       

 

Здесь an(0.05) = 200.05 = 1 – максимальный элемент ряда, bn(0.05) = 200.05 = 1 – минимальный элемент ряда. Тогда числитель будет разность максимального и минимального значений, т.е. 4.607 – 4.592 = 0.015. an(0.5) = 200.5 = 10 – среднее из первых 10 элементов вариационного ряда, равная 4.602, bn(0.5) = 200.5 = 10 – среднее из последних 10 элементов вариационного ряда, равная 4.5958. Тогда знаменатель будет их разность 4.602 – 4.5958 = 0.0062.

    Так как индикатор 2.42 ≈ 2.37 – ряд не имеет значимых отклонений и конечное значение можно принять 2.37. Эта величина попала в интервал от 3 до 4, и таким образом используем в качестве окончательной оценки вторую формулу схемы Хогга , которая является обычным средним арифметическим и равным 4.599 м.;

 

Анализ результатов (обязателен): среднее значение из ряда 4.599 м, усеченное среднее 4.598 м, медиана 4.600, псевдомедиана 4.599, оценка Хогга 4.599 м. Таким образом, и стандартная оценка в виде среднего и все альтернативные, устойчивые к разного рода отклонениям от основных характеристик, дают практически одинаковые результаты, т.е. все отличия меньше погрешности измерения σ = 0.004 м. Значит в качестве конечной оценки сдвига имеет смысл взять среднее значение, равное 4.599 м.

 

 


Поделиться:



Последнее изменение этой страницы: 2019-03-29; Просмотров: 512; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.052 с.)
Главная | Случайная страница | Обратная связь