Дисперсия функции нескольких измеряемых величин

⇐ ПредыдущаяСтр 3 из 3

Пусть случайная величина г = f(x, y) является линейной функцией независимых случайных величин (измерений) х и у, например г_ср = ах_ср + Ьу_ср, где а и Ъ — постоянные величины. Определив средние арифметические , и их дисперсии σ _x, σ _y, σ _z, можно показать, что

(15)

(16)

Пример 4. З начения х равны 10, 11, 12, а у — 6, 8, 10. Определить и , если

□ Среднее арифметическое независимых переменных

= (10 + 11 + 12)/3 = 11 = (6 + 8 + 10)/3 = 8.

Дисперсии: = ((10 – 11)² + (11 – 11)² + (12 – 11)²)/(3 – 1) = 0, 66,

= ((6 – 8)² + (8 – 8)² + (10 – 8)²)/(3 – 1) = 2, 66.

Тогда для функции г, которая может принять девять значений, найдем согласно (15) и (16)

= 1· + 1· = 11+ 8 = 19, = 1·0, 66 + 1·2, 66 = 3, 33. ■

Критерий значимости. Пусть известна некоторая фактическаячастота события (результата измерений одного и того же состояния объекта). Если эта частота для данной данной партии (серии) отлична от теоретической, то случайно ли такое отклонение? Например известно, что процент брака при выпуске некоторой продукции в среднем равен а, что является теоретическим прогнозом для других партий. В данной партии фактический процент брака составил β, где β ≠ а. Можно ли объяснить расхождение случайными причинами или причина есть результат влияния новых, неизвестных факторов?

Меру расхождения принято называть критерием значимости, численное значение которого определяется выражением

, (17)

где Ф — фактически полученное значение частоты; Е — ожидаемая частота события. Суммирование производится по всем сериям или всем возможным состояниям в каждой серии.

Теоретическим путем критерий можно получить по двум параметрам: вероятности р и числу степеней свободы К (см..табл. П.1). В этом случае оценка случайность — неслучайность определяется по следующей схеме. По формуле (17) определяют → по значению , при известном числе степеней свободы К, под которым понимается число классов, значения которых могут быть заданы правильно, по табл. П.1 определяют вероятность р → если вероятность р меньше некоторой заданной величины (обычно 0, 1), то расхождение между опытной (Ф) и теоретической (Е)частотами не случайны.

Пример 5. Две серии измерений N₁ = 1000 и N₂ = 500 были получены при автоматическом кондуктометрическом контроле электропроводности турбинного конденсата энергоблока, работающего в базовом режиме. В первой серии наблюдались Ф₁ = 20 случаев превышения установленного норматива, во второй Ф₂ = 15. Можно ли считать, что количественные расхождения превышений норматива в двух сериях случайны, или они отражают различия водно-химических режимов в этих сериях, например, из-за увеличения присосов охлаждающей воды в конденсаторе турбины?

□ Всего на 1500 измерений имеем 35 случаев превышения норматива. Следовательно, вероятности нормативных изерений и превышений норматива в обоих сериях соответственно равны:

= ((N₁ + N₂) - (Ф₁+ Ф₂))/( N₁ + N₂) = ((1000 + 500) – (20 +15))/(1000 + 500) = 1465/1500 = 0, 9767;

= (Ф₁ + Ф₂)/(N₁ + N₂) = (20 + 15)/(1000 + 500)= 0, 0233.

Тогда теоретические числа нормативных E_nor и превысивших норматив измерений E_ex составят для:

- первой серии (E_nor)₁ = N₁ = 0, 9767 • 1000 = 976, 7, (E_ex)₁ = N₁ = 0, 0233- 1000 = 23, 3;

- второй серии (E_nor)₂ = N₂ = 0, 9767 • 500 = 488, 4, (E_ex)₂ = N₂ = 0, 0233- 500 = 11, 6.

Значение критерия значимости χ ²расчитывается по формуле (17)

χ ² = (20 – 23, 3)²/23, 3 + (15 – 11, 6)²/11, 6 + (980 – 976, 7)²/976, 7 + (485 – 488, 4)²/488, 4 = 1, 5.

Теперь находим число степеней свободы К. В нашем случае имеем два класса m показаний: «в норме» и «превышение нормы», т.е. т = 2. Но, при известном общем числе измерений произвольным может быть только один класс, другой определяется по разности. Так, в первой серии превышения нормы составили Ф₁ = 20 случаев (произвольный класс j_arb), а показания «в норме» определились как разность: N₁ - Ф₁ = 1000 - 20 = 980 измерений (непроизвольный класс j_inv). Таким образом, число степеней свободы К = т -j_inv= 2 – 1 = 1.

Далее из табл. П.1 по числам χ ²= 1, 5 и К = 1 находим значение вероятности события, которое оказывается равным р ≈ 0, 2. Так как 0, 2 > 0, 1, то расхождение показаний кондуктометра в двух сериях измерений следует признать случайным. ■

Критерий Фишера. Измеряя одни и те же величины различными способами или в различные периоды времени, получаем, как правило, отличающиеся друг от друга значения. Поскольку каждое измерение выполнено с некоторой погрешностью, абсолютное значение и знак которой неизвестны, то возникает неопределенность в объяснении причин расхождения при сопоставлении результатов измерений:

- наблюдаемое расхождение соответствует различию между измеряемыми параметрами;

- получены два значения одной случайной величины, а их видимое различие определяется только случайными колебаниями неконтролируемых параметров.

Для раскрытия этой неопределенности следует ответить на два взаимосвязаных вопроса:

- равноточны ли измерения в разных сериях опытов (оценка различия воспроизводимых результатов);

- какова оценка значимости различия средних значений результатов в сериях.

Равноточность двух серий измерений определяется сопоставлением дисперсий и их результатов, где - большее значение дисперсии, т.е. > . Для оценки меры статистически значимого различия дисперсий используется критерий Фишера

. (18)

Расчетное значение критерия Фишера F сравнивают с его критической величиной F_cr(α, К_1, К₂), значение которой представлено в табл.П.2 для разных уровней значимости α и степеней свободы К₁= n₁– 1 и К₂= n₂– 1, где n₁ и n₂ — количество параллельных измерений в сериях опытов с наибольшей и наименьшей дисперсией. Из сопоставления вытекает:

- если F > F_cr, то с доверительной вероятностью β = 1 – α, можно полагать, что дисперсии в первой и второй сериях опытов статистически неодинаковы, воспроизводимость опытов во второй серии выше, т.е. разброс данных относительно среднего меньше;

- если F < F_cr, то данные измерений не дают основания полагать, что разброс значений во второй серии меньше, чем в первой.

Для оценки значимости различия средних значений результатов в сериях измерений отметим, что существует риск погрешности в признании двух дисперсий статистически неравными при F > F_cr. Этот риск равен α только в том случае, если есть основания полагать, что в одной серии опытов разброс результатов относительно среднего меньше, чем в другой. В частности, это может быть при применении более совершенной измерительной аппаратуры или более сложных методик измерения. Если подобного заранее утверждать нельзя, то используются двухсторонние доверительные границы. При этом a priori полага.n, что разброс данных, т.е. дисперсия в одной серии опытов, может быть как больше, так и меньше, чем в другой. Тогда, из табл.П.2, определяющих значения F_cr с односторонними пределами уровня значимости α, получим риск погрешности равный 2α.

Распределение Стьюдента. При малом количестве измерений (п < 20) фактическое распределение отличается от нормального тем сильнее, чем меньше количество измерений. Пусть, есть среднее арифметическое некоторого количества измерений во всем множестве измерений N, т.е. истинное значение, а - среднее значение измеряемого свойства в выборке из п < N измеренийсо средним квадратичным отклонением S. Критерий Стьюдента используется как параметр распределения расхождения

, (19)

которыйхарактеризует отношение отклонения среднего значения (выборка из п измерений)от принимаемого за истинное среднего значения (вся совокупность N измерений) к стандартному отклонению .

Критерий t можно использовать для сравнения выборок n₁ и n₂ . Теоретические значения t, табулированные в табл.П.З, являются функцией вероятности погрешности р и числа ступеней свободы К. Чем больше К, тем ближе функция распределения t к нормальному распределению Гаусса.

Пример 6. В табл.2 представлены результаты анализа двух выборок твердого топлива на ТЭС, взятых с некоторым временным интервалом. Каждая выборка содержала по 5 проб с определением одного и того же свойства (влажность, зольность, выход летучих и др.). Определить, как отличаются средние значения определяемого свойства в двух выборках, если качество анализа одинаково во всех пробах.

Таблица 2

Результаты анализа твёрдого топлива на зольность

Номер выборки	Результаты анализа свойств х_i пробы (n = 5)				S

	17, 5	17, 8	17, 4	17, 5	17, 7	87, 9	17, 58	1545, 4	0, 175
	17, 0	17, 0	17, 4	17, 0	17, 3	85, 9	17, 18	1475, 9	0, 187

□ Отличия среднего арифметического в двух выборках ищем путём определения критерия t. При отсутствии отличий разность средних для двух выборок должна стремиться к нулю. Заносим в табл.2 значения , , , полученные в ходе предварительной обработки результатов анализа, после чего, определяем и , где n = 1, 2, 3, 4, 5.

S₁ = (1545, 4/4 – (87, 9)²/(5·4))^{0, 5} = 0, 175, S₂ = (14795, 9/4 – (85, 9)²/(5·4))^{0, 5} = 0, 187,

t = (17, 58 – 17, 18)·((0, 175² + 0, 187²)/5)^-1/2 = 3, 67.

По табл. П.З при К = 8 (из 5 анализов 4 независимы для каждой из двух выборок) и при вычисленном значении t = 3, 67 находим р ≈ 0, 01 < 0, 1. Следовательно, вероятность погрешности слишком мала и приходится признать, что различия анализируемого свойства в двух выборках не случайны. ■

Доверительный интервал. По данным выборки с нормальным законом распределения требуется оценить исследуемое свойство величины как центра генеральной совокупности (или истинного значения данного свойства всего множества), если для неё известны число элементов п, среднее квадратическое отклонение S и среднее арифметическое . Значение для заданной выборки определимв виде интервала численных значений ( - а) < < ( + а) в окрестности известной средней арифметической , который называется доверительным интервалом. Очевидно, что на его границы будут влиять заданная вероятность погрешности р, число элементов выборки n ичисло ступеней свободы К, т.е. все те величины, которые определяют критерий Стьюдента t.

Если определена требуемая вероятность ошибки отклонения значения от центра группировки (обычно р = 0, 05 или 5 %), то доверительный интервал для искомого значения

( - ) < < ( + ), (20)

где t определено с доверительной вероятностью α = 1 - р (если р = 0, 05, то α = 0, 95 или 95 %). Величина S (п)^-1^/2есть среднеквадратическое отклонение среднего арифметического S₀ (13), т.е.

( - t S₀) < < ( + t S₀). (21)

Поскольку t S₀ = ζ, то доверительный интервал можно записать как ± ζ, где ζ ширина доверительного интервала, а относительная погрешность результата серии измерений (коэффициент вариации), выраженная в %, определится как δ = 100 .

Пример 7. По результатам восьми титрований параметра x_i, см³, представленных в табл.3, определить доверительный интервал, в котором с доверительной вероятностью α = 0, 95 располагается истинное значение измеряемого параметра М(x).

□ Искомое значение доверительного интервала равно ζ = t S₀, где t критерий Стьюдента, а S₀ среднеквадратичное отклонение среднего арифметического = = 612, 37/8 = 76, 546 см³.

Результаты вспомогательных, для определения t и S₀, расчётов занесены в табл.3.

Таблица 3.

Исходные данные и результаты их обработки.

№ измерения	x_i, см³	x_i -	(x_i - )²
	76, 48	-0, 066	0, 004
	76, 25	-0, 296	0, 088
	76, 43	-0, 116	0, 014
	76, 48	-0, 066	0, 004
	77, 20	0, 654	0, 427
	76, 48	-0, 066	0, 004
	76, 45	-0, 096	0, 009
	76, 60	0, 054	0, 003
сумма	612, 37	0, 002	0, 554

Среднеквадратичное отклонение S = = (0, 554/7)^{0, 5} = 0, 281, а среднеквадратичное отклонение среднего арифметического S₀ = = 0, 281 (8)^{-0, 5} = 0, 099. Теперь, при вероятности погрешности р = 1 – α = 1 – 0, 95 = 0, 05 и числе степеней свободы К = 8 – 1 = 7, в соответствии с табл.П.3, критерий t = 2, 365.

Ширина доверительного интервала ζ = t S₀ = 2, 365·0, 099 = 0, 234, что составляет коэффициент вариации серии измерений δ = 100 ζ ( )^-1 = (0, 234 / 76, 546)·100 = 0, 31 %. Следовательно, доверительный интервал, в котором с доверительной вероятностью α = 0, 95 располагается истинное значение измеряемого параметра, равен М(x) = 76, 546 ± 0, 234 см³, или 76, 31 см³ ≤ М(x) ≤ 76, 79 см³. ■

⇐ Предыдущая 1 23