Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Принятие решений в условиях неопределенности
Оно характеризуется тем, что при выборе альтернативы ЛПР не знает состояние среды и не имеет информации о вероятностях их проявления. Однако ЛПР известно множество возможных состояний среды и функция реализации , где – множество допустимых альтернатив, – множество состояний среды, – множество исходов. Оценочная структура представлена функцией . Тогда целевая функция указывает полезность (ценность) того исхода, который получается в результате, когда ЛПР выбирает альтернативу , а среда находится в состоянии . Таким образом, . Пример: аренда комнат в отеле, – число комнат, – степень заполнения комнат В ячейках следующей таблицы должна содержаться соответствующая прибыль: Здесь – прибыль от аренды. Если и конечны, то целевая функция может быть задана таблично. Если приписать элементам множеств и номера, то – выигрыш ЛПР в случае выбора -го варианта при -ом состоянии среды. Пусть , . Тогда матрица выигрышей (платежная матрица) имеет вид Подходы к сравнению альтернатив, представленных в платежной матрице. 1-й подход. Использование принципа доминирования. Он заключается в отбрасывании доминируемых альтернатив. Тогда , если , в противном случае и несравнимы по доминированию. Пример: При попарном сравнении имеем: , , причем других пар, находящихся в отношении доминирования, нет, то есть альтернативы , и несравнимы по отношению доминирования. Для выбора оптимальной альтернативы из оставшихся необходимо использование других методов. 2-й подход. Основной принцип: формулируется некоторая гипотеза о поведении среды, позволяющая дать каждой альтернативе единую числовую оценку, которая даёт критерии для сравнения альтернатив по предпочтению. Оптимальной будет альтернатива, имеющая наибольшую оценку (для функции потерь – наименьшую). Основные типы критериев: 1) Критерий Лапласа. Критерий основан на гипотезе равновероятности (равновозможности) состояний среды. Тогда оценка -й альтернативы равна и . Недостаток такого подхода состоит в эффекте компенсации маленьких выигрышей большими. 2) Критерий Вальда. Критерий основан на гипотезе антагонизма, то есть при выборе решения надо рассчитывать на самый худший возможный вариант. Тогда оценкой -й альтернативы служит число и . – максиминная альтернатива. Принцип максимина - максимизация минимально возможного (то есть гарантированного) выигрыша. Еще одно название – принцип максимального гарантированного результата. Недостаток: при выборе решения учитывается только наихудший вариант. Если целевая функция является функцией потерь, то оценкой альтернативы является число и . Тогда – минимаксная альтернатива (минимакс). Это – принцип минимизации максимально возможных потерь. 3) Критерий Гурвица. Критерий связан с введением показателя , называемого показателем пессимизма. Гипотеза поведения среды: вероятность наихудшего состояния равна , а наилучшего – . Тогда оценка альтернативы : . Если , то это критерий крайнего пессимизма (критерий Вальда). Если , то это критерий крайнего оптимизма. Недостаток: учитываются только два крайних исхода; субъективность определения показателя . 4) Критерий Сэведжа. Критерий основан на преобразовании первоначальной матрицы выигрышей в матрицу рисков (матрицу сожалений) . Риском при выборе альтернативы в состоянии называется число , где . Оптимальная альтернатива минимизирует максимальный риск, то есть используется минимаксный критерий для матрицы сожалений. Оптимальные решения, получаемые по указанным критериям, в общем случае могут не совпадать, так как критерии противоречат друг другу, поскольку основаны на разных гипотезах. Пример: необходимо выбрать проект электростанции. Возможно 4 варианта: – ТЭЦ, – ГЭС, – АЭС, – ПЭС. Состояния среды, влияющие на строительство и дальнейшую эксплуатацию, учитывает следующие факторы: погода, возможность наводнения, цена топлива, расходы на его транспортировку. Пусть выделено 4 варианта комбинаций факторов: . В матрице выигрышей показана эффективность каждого из вариантов: 1) Критерий Лапласа. Здесь ; ; ; . Таким образом, – оптимальная альтернатива. 2) Критерий Вальда. ; ; ; . Таким образом, – оптимальная альтернатива. 3) Критерий Гурвица. Пусть ; тогда ; ; ; . Таким образом, – оптимальная альтернатива. Оценим влияние на результат. В данной задаче , поэтому остается две альтернативы, которые могут стать оптимальными: и . Условие сводится к неравенству . Таким образом, при оптимальной будет альтернатива , а при оптимальной будет . 4) Критерий Сэведжа. Преобразуем матрицу выигрышей в матрицу рисков. Таким образом, – оптимальные альтернативы.
Популярное:
|
Последнее изменение этой страницы: 2016-03-17; Просмотров: 1249; Нарушение авторского права страницы