Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ТЕОРИИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ



 

2.1. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ. ВЫБОРКА

 

Основу математического моделирования технологических процессов производства ЭС составляют экспериментально-статистические методы. Для их применения необходимо набрать достаточное количество статистических данных по показателям качества изделия. Эти данные являются случайными величинами.

Случайная величина (СВ) – переменная, которая в результате опыта (измерения, эксперимента, испытания) может принимать то или иное значение, причем неизвестно заранее, какое именно. СВ могут быть дискретными (с дискретным рядом возможных значений) и непрерывными (принимающими любые значения из конкретного или бесконечного интервала).

Случайное событие – событие, которое в результате опыта может произойти или не произойти.

Сбор и обработка статистических данных осуществляется на основе контроля определенного числа изделий. Вся совокупность однородных изделий, подлежащих исследованию, называется генеральной совокупностью.

При массовом производстве генеральная совокупность может содержать число изделий, насчитывающее десятки и сотни тысяч. Измерять показатели качества изделий в таких случаях бывает экономически нецелесообразно. Поэтому контролируют параметры из некоторой части изделий, а результаты распространяют на всю генеральную совокупность.

Выборка – часть изделий, случайным образом взятая из генеральной совокупности. Оценка, полученная по результатам измерений параметров в выборке, называется выборочной оценкой. Число изделий в выборке определяет объем выборки. Очевидно, чем больше объем выборки, тем выше точность выборочных оценок. Однако с ростом объема выборки увеличивается трудоемкость измерения параметров в выборке, т.е. растут затраты времени и средств на выполнение контрольно-измерительных операций. Поэтому, в зависимости от требуемой точности, объем выборки ограничивают десятками – тысячами изделий. Оценку, обеспечивающую требуемую точность, принято называть состоятельной, а соответствующую выборку – репрезентативной (представительной).

Выборочная оценка производится по выборке ограниченного объема. Если из генеральной совокупности осуществить повторную выборку того же объема, то, в силу ограниченности объема выборки, та же оценка примет несколько отличающееся значение. Таким образом, выборочная оценка представляет собой случайную величину, меняющуюся от выборки к выборке. Выборочные оценки, обладающие тем свойством, что при любом объеме выборки их математическое ожидание равно оцениваемой числовой характеристике, называются несмещенными оценками. Требование несмещенности оценки особо важно при малом объеме выборки, когда величина смещения может исказить результаты.

Большое значение для установления меры качества того или иного способа оценки числовой характеристики принадлежит понятию эффективности выборочной оценки. Оценку, имеющую меньшее рассеяние (дисперсию) относительно истинного значения, называют эффективной оценкой.

 

2.2. ЗАКОНЫ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН

 

Обозначим:

Х – случайная величина (СВ);

x1, x2, …, xi, …, xn – значения СВ;

Р – вероятность появления СВ Х;

p1, p2, …, pi, …, pn – вероятности появления значений x1, x2, …, xi, …, xn соответственно;

n – объем выборки.

Законом распределения СВ называется любое соотношение, устанавливающее связь между возможными значениями СВ и соответствующими вероятностями их появления.

Закон распределения дискретной СВ представляется в виде статистического ряда распределения:

X x1 x2 xi xn
P p1 p2 pi pn

 

В этой таблице – вероятность принятия СВ значения хi c частотой mi; .

Графическое изображение статистического ряда называется полигоном.

Для непрерывной СВ не существует статистического ряда распределения, но есть аналог, где вместо дискретных значений Х берутся интервалы значений СВ равной длины l, а величины P представляют отношение числа значений СВ, попавших в данный интервал, к суммарному числу наблюдаемых значений.

Длина интервала l и число интервалов q находятся из выражений:

; ,

где хmax и хmin – максимальное и минимальное значение СВ в выборке.

Если значение СВ находится в точности на границе двух интервалов, то условно считается, что оно в равной мере принадлежит к обоим интервалам, и поэтому необходимо прибавить к величинам m того и другого интервала по 0, 5. Если два значения СВ находятся на границе – то надо прибавить по 1 и т.д.

Графическое изображение полученного закона распределения непрерывной СВ называется гистограммой, где по оси абсцисс откладываются интервалы длиной l (их число равно q), а по оси ординат – прямоугольники с высотой, равной вероятности попадания СВ в i-й интервал (i=1, 2, …, q).

Наиболее полную информацию о связи X и P дают интегральный и дифференциальный законы распределения.

Интегральный закон распределения (функция распределния) F(x) – вероятность того, что СВ X меньше некоторой текущей переменной x:

.

F(x) существует как для дискретной, так и для непрерывной СВ.

Свойства функции распределения:

1. F(x) – неубывающая функция своего аргумента, т.е. при

;

2. ;

3. .

Эмпирическая функция распределения F*(x), т.е. вычисленная по экспериментальным статистическим данным, находится по формуле:

Тогда для непрерывной СВ имеем:

где xi – среднее значение i-го интервала (i=1, 2, …, q).

Дифференциальный закон распределения (плотность распределения) f(x) характеризует плотность, с которой распределены значения СВ в точке Х=х:

Плотность распределения – это производная от функции распределения.

Свойства плотности распределения:

1) ;

2)

Функция распределения от плотности распределения выражается следующим образом:

В теории математического моделирования показатели качества ЭС являются непрерывными СВ.

 

2.3. ОСНОВНЫЕ ВИДЫ ЗАКОНОВ РАСПРЕДЕЛЕНИЯ ДЛЯ НЕПРЕРЫВНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН

 

РАВНОВЕРОЯТНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ

Простейшим распределением для непрерывной СВ Х является равновероятный закон распределения с плотностью распределения f(x) вида:

где х1 и х2 – пределы изменения Х.

Тогда:

 

ЭКСПОНЕНЦИАЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ

 

Распределение СВ Х подчиняется экспоненциальному закону, если плотность распределения f(x) имеет вид:

где λ – интенсивность случайного события – постоянная величина. Тогда функция распределения:

Характерным признаком этого распределения является постоянство значения λ.

Экспоненциальный закон используется при математическом моделировании, когда более поздним наблюдениям над показателем качества ЭС придается больший «вес» по сравнению с ранними.

 

НОРМАЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ (НЗР)

 

НЗР – наиболее часто встречающийся на практике вид распределения в технологии производства ЭС.

Анализ общих условий возникновения НЗР показывает, что если отклонение параметра γ от номинального значения вызвано действием достаточно большого числа k независимых или слабо зависимых факторов xi

и среди k факторов нет явно превалирующих над остальными, то закон распределения параметра γ при увеличении k стремится к нормальному. Причем закон распределения факторов xi может быть любым. Это утверждение является следствием центральной предельной теоремы теории вероятностей (теоремы Ляпунова).

Для НЗР:

Из выражения для функции распределения F(x) можно найти вероятность нахождения непрерывной СВ в пределах значений x1 и x2:

где Ф(z)– нормированная функция Лапласа. Значения функции Ф(z) табулированы [2].

Из приведенного выражения можно вычислить вероятность нахождения СВ Х в пределах: ±S; ±2S; ±3S. Они равны соответственно: 0, 683; 0, 955; 0, 9973.

Практически рассеяние СВ, подчиненной НЗР, находится в пределах m(x)±3S(x), т.к. вероятность попадания ее за пределы этого участка очень мала (0, 0027), т.е. такое событие можно считать почти невозможным. Отсюда следует правило « трех сигм »: если СВ имеет НЗР, то отклонение ее значений от математического ожидания по абсолютной величине не превосходит утроенного среднеквадратического отклонения. S – выборочная оценка σ (сигмы).

При математическом моделировании часто приходится проверять распределение показателей качества ЭС на соответствие НЗР.

 

2.4. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН

 

ХАРАКТЕРИСТИКИ ПОЛОЖЕНИЯ

1. Математическое ожидание – среднее значение СВ в генеральной совокупности. Оно характеризует центр распределения СВ Х.

Статистическое значение математического ожидания вычисляется по формуле:

2. Медиана Me – значение СВ, которое делит упорядоченный ряд статистических данных на две равные по объему группы.

Если в упорядоченном ряде нечетное 2k+1 число значений статистических данных, то значение xk+1

Если в упорядоченном ряде четное 2k число значений статистических данных, то значение

3. Мода Mo – значение СВ, которое наиболее часто встречается в наблюдаемом ряде статистических данных. Бывают двумодальные и многомодальные распределения.

 

ХАРАКТЕРИСТИКИ РАССЕЯНИЯ

 

1. Размах ( R ) статистических данных.

2. Центр интервала статистических данных (xср.).

3. Дисперсия – математическое ожидание квадрата отклонения СВ от среднего значения. Она характеризует степень рассеяния СВ от среднего значения.

Статистическое значение дисперсии вычисляется по формуле:

4. Среднеквадратическое отклонение (S). S – корень квадратный от дисперсии; имеет ту же размерность, что и СВ.

5. Коэффициент вариации (V). Характеризует рассеивание СВ в относительных единицах.

 

2.5. СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ

 

Под статистическими понимают гипотезы, которые относятся к отдельным параметрам закона распределения СВ или к самому закону.

В теории простых гипотез проверяемую гипотезу обозначают через Н0 и называют ее нулевой гипотезой. Конкурирующую гипотезу называют альтернативной и обозначают Н1.

 

ГИПОТЕЗА О РАВЕНСТВЕ ДИСПЕРСИЙ

 

Берутся две выборки изделий объемом n1 и n2. У изделий контролируется параметр Х и вычисляются значения

Нулевая гипотеза Н0: .

Альтернативная 1: .

При НЗР параметра Х для проверки гипотезы Н0 используется F-критерий Фишера. Для этого:

а) вычисляется

(1)

б) определяется табличное значение Fтабл.

где α – уровень принимаемого решения,

в) сравниваются Fрасч. и Fтабл..

Если Fрасч.< Fтабл., то гипотеза о равенстве дисперсий в двух выборках справедлива с вероятностью .

Если Fрасч.Fтабл., то с вероятностью верна гипотеза Н1.

 

ГИПОТЕЗА ОБ ОДНОРОДНОСТИ ДИСПЕРСИЙ

 

Для K выборок одинакового объема n по результатам контроля СВ Х вычислены дисперсии Необходимо проверить отличается ли хотя бы одна выборка по дисперсии от остальных.

Гипотеза Н0: дисперсии однородны (нет отличия).

Гипотеза Н1: дисперсии неоднородны (отличаются).

Для проверки гипотезы используется G-критерий:

а) находится ,

где - максимальная дисперсия из вычисленных;

б) определяется табличное значение Gтабл.,

;

в) сравниваются Gрасч и Gтабл.

Если Gрасч.< Gтабл., то принимается гипотеза Н0 с вероятностью Р=1-α .

Если Gрасч.≥ Gтабл., то принимается гипотеза Н1 с вероятностью Р=1-α .

ГИПОТЕЗА О РАВЕНСТВЕ СРЕДНИХ

 

Берутся две выборки изделий объемом n1 и n2. По результатам контроля параметра Х вычисляются значения

Нулевая гипотеза Н0:

Альтернативная –Н1:

Для проверки гипотезы используется t-критерий Стьюдента.

Для этого:

а) проверяется равенство дисперсий (см. гипотезу о равенстве дисперсий);

б) вычисляется расчетное значение tрасч.

в) определяется tтабл.=f(α, υ ), где

г) сравниваются tрасч. и tтабл..

Если tрасч.< tтабл., то принимается гипотеза Н0 с вероятностью Р=1-α.

Если tрасч.≥ tтабл., то принимается гипотеза Н1 с вероятностью Р=1-α.

 

ГИПОТЕЗА О ЗАКОНЕ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ

 

1. Для проверки соответствия экспериментальных данных НЗР часто используется критерий Колмогорова.

Для этого:

а) строится эмпирическая функция распределения F*(x) по выборке объемом n в интервале xmin≤ X≤ xmax (см. п. 2.2);

б) строится теоретическая функция распределения F(x) в интервале

xmin≤ X≤ xmax, путем нахождения величин для всех хi, где xi – среднее значение i-го интервала, а Ф – табулированная функция Лапласа;

в) функции F*(x) и F(x) наносятся на один график;

г) определяется максимальная величина модуля разности между F*(x) и F(x):

д) определяется вспомогательная величина

е) определяется вероятность из таблицы:

λ 0, 33 0, 57 0, 97 1, 0 1, 07 1, 22 1, 36 1, 63
P 0, 9 0, 3 0, 27 0, 2 0, 1 0, 05 0, 01

 

ж) если то принимается гипотеза: экспериментальное распределение статистических данных СВ подчиняется нормальному закону.

2. Оценку соответствия результатов эксперимента НЗР можно осуществить используя критерий Пирсона.

Сущность критерия:

а) строится распределение СВ Х в интервале xmin≤ X≤ xmax (см. п. 2.2);

б) вычисляется

где q – число интервалов длиной l ;

mi – число значений СВ, попавших в i-й интервал;

n – объем выборки;

– вероятность попадания СВ в i-й интервал (Φ – табулированная функция Лапласа [2] );

в) определяется табличное значение , где . Значения табулированы [2];

г) сравниваются и .

Если < , то с вероятностью Р=1-α принимается гипотеза: экспериментальное распределение СВ Х подчиняется НЗР. Если , то с вероятностью Р=1-α оно не соответствует нормальному закону распределения.

На практике большее применение для проверки НЗР имеет критерий Колмогорова.

2.6. ОШИБКИ ИЗМЕРЕНИЯ ФИЗИЧЕСКИХ ВЕЛИЧИН И МЕТОДЫ ИХ ИСКЛЮЧЕНИЯ

 

При производстве электронных средств никогда не удастся выполнить изделие, идеально соответствующее замыслу разработчика, воплощенному в рабочей документации на изделие. Как в отдельных составляющих изделие частях, так и в нем самом всегда наблюдаются те или иные отклонения от установленных норм, называемые погрешностями (ошибками). В зависимости от причин, их вызывающих, ошибки делят на случайные, систематические и грубые (промахи).

 

СЛУЧАЙНЫЕ, СИСТЕМАТИЧЕСКИЕ И ГРУБЫЕ ОШИБКИ

 

Под случайными понимают ошибки, значения которых меняются от одного измерения к другому. Они являются следствием случайных ошибок контрольно-измерительных приборов, случайных ошибок экспериментатора, неточных соблюдений методики измерения, непостоянством самой контролируемой величины. Для количественной оценки случайных ошибок применяют математический аппарат теории вероятностей и математической статистики.

Наиболее полно случайные ошибки могут быть оценены функцией их распределения, получаемой многократными наблюдениями с последующей статистической обработкой экспериментальных данных.

Отличие систематических ошибок от случайных состоит в том, что их значение остается постоянным при проведении серии однотипных измерений; причины их возникновения известны, следовательно, они могут быть исключены из окончательного результата, если их величина предварительно определена. К систематическим ошибкам можно отнести ошибки эталонов, по которым проградуированы контрольно-измерительные приборы, систематические ошибки, связанные с принятой методикой измерения (например, ошибки, возникшие вследствие не учета температурных поправок, применения приближенных формул расчета и т.д.), «личные» ошибки экспериментатора, т.е. присущие данному лицу и др. Различают также постоянные (неизменные во времени) и прогрессирующие (возрастающие или убывающие во времени) систематические ошибки.

Грубые ошибки (промахи) являются результатом нарушения условия и процесса измерений. Их характерным признаком является резкое отличие от результатов предшествующих измерений. Повторение эксперимента (если возможно) является наиболее надежным, достоверным и эффективным способом обнаружения грубых ошибок.

Современные математические методы обработки результатов эксперимента базируются на вероятностном подходе и предполагают, что ошибки измерения являются случайными. При этом предполагается, что к началу этой обработки все грубые и систематические ошибки выявлены и устранены.

Рассмотрим практический метод исключения грубых ошибок, если их не удалось исключить в процессе проведения экспериментов.

 

МЕТОД ИСКЛЮЧЕНИЯ РЕЗКО ВЫДЕЛЯЮЩИХСЯ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА

Критерий Романовского.

Имеется упорядоченный статистический ряд измеренных значений случайной величины Х: x1, x2, …, xi, …, xn. x1=xmin; xn=xmax.

Здесь: x1 или (и) xn – значения, которые вызывают сомнения (резко отличаются от остальных измерений). В практических случаях в качестве x1 и xn может быть несколько измерений, т.е. их может быть ≥ 2;

n – объем выборки.

Сущность критерия:

а) вычисляется , где

x* - резко выделяющееся значение, в качестве которого взято значение (несколько значений) x1 и xn;

m и S – выборочные математическое ожидание и среднее квадратическое отклонение, вычисленные без значения (нескольких значений) х* при объеме выборки n-1 (или n-≥ 2, если несколько измерений имеют значение х*);

б) определяется из табл.1.

 

Таблица 1

Табличные значения критерия Романовского

α
0, 01 11, 5 6, 5 5, 0 4, 4 3, 7 3, 5 3, 4 2, 9 2, 8 2, 7 2, 69 2, 6
0, 02 5, 1 4, 1 3, 6 3, 4 3, 2 3, 1 3, 0 2, 6 2, 5 2, 49 2, 4 2, 3
0, 05 15, 6 5, 0 3, 6 3, 0 2, 8 2, 6 2, 5 2, 4 2, 3 2, 2 2, 1 2, 0 2, 0 2, 0

 

в) сравниваются tрасч и tтабл.

Если tрасч > tтабл, то с вероятностью Р=1-α значение x* статистического ряда не принадлежит к рассматриваемой совокупности СВ Х и оно должно быть исключено при статистической обработке экспериментальных данных. В дальнейшем эта процедура повторяется со значением, находящимся рядом с x*.

Пример. При изучении технологического процесса изготовления электронного средства при n независимых равноточных измерениях некоторой физической величины без резко выделяющегося значения xn=xmax получено среднее значение m=8, 6 и среднее квадратическое отклонение S=0, 121. Известно также, что n измерение дало результат xn=x*=8, 92. Необходимо выяснить с вероятностью P=0, 98, является ли этот результат грубой ошибкой, если n=61.

Решение. Вычислим .

Из табл.1 имеем: .

Поскольку 2, 64> 2, 4, то это означает, что измерение х61=8, 92 содержит грубую ошибку с вероятностью 0, 98.

Вопрос решился бы иначе, если бы, например, число измерений в результате эксперимента равнялось 11. В этом случае по табл.1 имеем: . Поскольку 2, 64< 3, 0, то исключать х*11=8, 92 не следует из полученного ряда измерений.

 

 

КОНТРОЛЬНЫЕ ВОПРОСЫ

 

1. Что такое генеральная совокупность и выборка изделий?

2. Какие оценки называются состоятельными, несмещенными и эффективными?

3. Как строится полигон?

4. Как строится гистограмма?

5. Характеристики положения случайных величин.

6. Характеристики рассеяния случайных величин.

7. Критерий Колмогорова.

8. Случайные, систематические и грубые ошибки.

9. Критерий Романовского.

 


 


Поделиться:



Популярное:

Последнее изменение этой страницы: 2017-03-08; Просмотров: 973; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.091 с.)
Главная | Случайная страница | Обратная связь