Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Математическая статистика. Эмпирическая функция распределения. Полигон и гистограмма.
Математи́ ческая стати́ стика — наука, разрабатывающая математические методы систематизации и использования статистических данных для научных и практических выводов.
Во многих своих разделах математическая статистика опирается на теорию вероятностей, позволяющую оценить надёжность и точность выводов, делаемых на основании ограниченного статистического материала (напр., оценить необходимый объём выборки для получения результатов требуемой точности при выборочном обследовании). Эмпирическая функция распределения Пусть известно статистическое распределение частот количественного признака X. Введем обозначения: – число наблюдений, при которых наблюдалось значение признака, меньшее , – общее число наблюдений (объем выборки).
Ясно, что относительная частота события равна . Если будет изменяться, то будет изменяться и относительная частота, то есть относительная частота есть функция от Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической. Эмпирической функцией распределения (функцией распределения выборки) называют функцию , определяющую для каждого значения относительную частоту события Итак, по определению где – число вариант, меньших , – объем выборки. Из определения функции вытекают следующие ее свойства: 1) значения эмпирической функции принадлежат отрезку 2) – неубывающая функция; 3) если – наименьшая варианта, то , при если – наибольшая варианта, то при Итак, эмпирическая функция распределения выборки служит для оценки теоретической функции распределения генеральной совокупности.
Выборочные средние, дисперсии. Генеральные средник, дисперсии. Взаимосвязь. Точечные и интервальные оценки.
Как уже было отмечено выше, функция распределения дает полное статистическое описание СВ. Распределение СВ характеризуется числовыми характеристиками, важнейшими из которых являются среднее значение и дисперсия. Характеристики распределений генеральных совокупностей можно оценить по выборочным данным. Оценки могут быть несмещенными, эффективными и состоятельными. Несмещенной является оценка, среднее значение которой совпадает со средним значением соответствующей характеристики генеральной совокупности. Т.е.
Здесь - оценка, - истинное значение характеристики, – оператор усреднения. Эффективной называется оценка, которая из всех возможных вариантов оценок имеет минимальную дисперсию.
Состоятельной называется оценка, которая при увеличении объема выборки стремится к истинному значению по вероятности, т.е. Рассмотрим наиболее важные с точки зрения практики управления качеством оценки математического ожидания и дисперсии для случая гауссовских выборочных данных (ГОСТ Р 50779.21-96). Точечная оценка математического ожидания определяется по формуле Поскольку значения в этой формуле случайны и их число конечно, величина также является случайной. При условии, что гауссовские независимые числа, является гауссовским случайным числом. Покажем, что среднее значение и дисперсия этого числа равны соответственно среднее генеральной совокупности) и где - дисперсия отдельного отсчета. Для нахождения дисперсии найдем дисперсию отдельных слагаемых в последнем соотношении Далее примем во внимание, что дисперсия суммы независимых слагаемых равна сумме дисперсий этих слагаемых, т.е. Соотношения (2.11) и (2.12) показывают, что оценка (2.10) является несмещенной и эффективной.
Точечная оценка дисперсии определяется по формуле Задача линейного программирования. Основные элементы. Свойство линейности целевой функции. Линейное программирование — математическая дисциплина, посвящённая теории и методам решения экстремальных задач на множествах -мерного векторного пространства, задаваемых системами линейных уравнений и неравенств. Математическая формулировка Нужно определить максимум линейной целевой функции (линейной формы) при условиях Иногда на также накладывается некоторый набор ограничений в виде равенств, но от них можно избавиться, последовательно выражая одну переменную через другие и подставляя её во всех остальных равенствах и неравенствах (а также в функции ). Такую задачу называют «основной» или «стандартной» в линейном программировании. Геометрический способ решения задач линейного программирования для двух переменных. Пример. Областью решения линейного неравенства с двумя переменными является полуплоскость. Для того, чтобы определить, какая из двух полуплоскостей соответствует этому неравенству, нужно привести его к виду или Тогда искомая полуплоскость в первом случае расположена выше прямой a0 + a1x1 + a2x2 = 0, а во втором - ниже нее. Если a2=0, то неравенство (8) имеет вид ; в этом случае получим либо - правую полуплоскость, либо - левую полуплоскость.
Областью решений системы неравенств является пересечение конечного числа полуплоскостей, описываемых каждым отдельным неравенством. Это пересечение представляет собой многоугольную область G. Она может быть как ограниченной, так и неограниченной и даже пустой (если система неравенств противоречива). Рис. 2
Область решений G обладает важным свойством выпуклости. Область называется выпуклой, если произвольные две ее точки можно соединить отрезком, целиком принадлежащим данной области. На рис. 2 показаны выпуклая область G1 и невыпуклая область G2. В области G1 две ее произвольные точки А1 и В1 можно соединить отрезком, все точки которого принадлежат области G1. В области G2 можно выбрать такие две ее точки А2 и В2, что не все точки отрезка А2В2 принадлежат области G2.
Опорной прямой называется прямая, которая имеет с областью по крайней мере одну общую точку, при этом вся область расположена по одну сторону от этой прямой. На рис. 2 показаны две опорные прямые l1 и l2, т. е. в данном случае прямые проходят соответственно через вершину многоугольника и через одну из его сторон.
Аналогично можно дать геометрическую интерпретацию системы неравенств с тремя переменными. В этом случае каждое неравенство описывает полупространство, а вся система - пересечение полупространств, т. е. многогранник, который также обладает свойством выпуклости. Здесь опорная плоскость проходит через вершину, ребро или грань многогранной области.
Основываясь на введенных понятиях, рассмотрим геометрический метод решения задачи линейного программирования. Пусть заданы линейная целевая функция f = c0 + c1x1 + c2x2 двух независимых переменных, а также некоторая совместная система линейных неравенств, описывающих область решений G. Требуется среди допустимых решений найти такое, при котором линейная целевая функция f принимает наименьшее значение.
Положим функцию f равной некоторому постоянному значению С: f = c0 + c1x1 + c2x2 = C. Это значение достигается в точках прямой, удовлетворяющих уравнению При параллельном переносе этой прямой в положительном направлении вектора нормали n(c1, c2) линейная функция f будет возрастать, а при ее переносе в противоположном направлении - убывать.
Предположим, что прямая, записанная в виде (9), при параллельном переносе в положительном направлении вектора n первый раз встретится с областью допустимых решений G в некоторой ее вершине, при этом значение целевой функции равно С1, и прямая становится опорной. Тогда значение С1 будет минимальным, поскольку дальнейшее движение прямой в том же направлении приведет к увеличению значения f.
Таким образом, оптимизация линейной целевой функции на многоугольнике допустимых решений происходит в точках пересечения этого многоугольника с опорными прямыми, соответствующими данной целевой функции. При этом пересечение может быть в одной точке (в вершине многоугольника) либо в бесконечном множестве точек (на ребре многоугольника).
|
Последнее изменение этой страницы: 2017-03-14; Просмотров: 511; Нарушение авторского права страницы