Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Характеристика методов теории полезности



Декомпозиционные методы теории ожидаемой полезности получили наиболее широкое распространение среди группы аксиоматических методов принятия решений в условиях риска и неопределенности.

Основная идея этой теории состоит в получении количественных оценок полезности возможных исходов, которые являются следствиями процессов принятия решений. В дальнейшем на основании этих оценок можно выбрать наилучший исход. Для получения оценок полезности необходимо иметь информацию о предпочтениях лица, ответственного за принимаемое решение.

Парадигма анализа решения может быть сведена к процессу, включающему пять этапов [10].

Этап 1. Предварительный анализ. На этом этапе формулируется проблема и определяются возможные варианты действий, которые можно предпринять в процессе ее решения.

Этап 2. Структурный анализ. Этот этап предусматривает структуризацию проблемы на качественном уровне, на котором ЛПР намечает основные шаги процесса принятия решений и пытается упорядочить их в виде некоторой последовательности. Для этой цели строится дерево решений, (рис.1.3).

Рис. 1.3. Фрагмент дерева решений

Дерево решений имеет два типа вершин: вершины-решения (обозначены квадратиками) и вершины-случаи (обозначены кружочками). В вершинах-решениях выбор полностью зависит от ЛПР, в вершинах-случаях ЛПР не полностью контролирует выбор, так как случайные события можно предвидеть лишь с некоторой вероятностью.

Этап 3. Анализ неопределенности. На этом этапе ЛПР устанавливает значения вероятности для тех ветвей на дереве решений, которые начинаются в вершинах-случаях. При этом полученные значения вероятностей подлежат проверке на наличие внутренней согласованности.

Для получения значений вероятности привлекается вся доступная информация: статистические данные, результаты моделирования, экспертная информация и т. д.

Этап 4. Анализ полезности. На данном этапе следует получить количественные оценки полезности последствий (исходов), связанных с реализацией того или иного пути на дереве решений. На рис. 1.3 показан один из возможных путей - от начала до точки G.

Исходы (последствия принимаемых решений) оцениваются с помощью функции полезности фон Неймана - Моргенштерна [39], которая каждому исходу rk ставит в соответствие его полезность и(rk). Построение функции полезности осуществляется на основе знаний ЛПР и экспертов.

Этап 5. Процедуры оптимизации. Оптимальная стратегия действий (альтернатива, путь на дереве решений) может быть найдена с помощью вычислений, а именно: максимизации ожидаемой полезности на всем пространстве возможных исходов. Одно из условий постановки задачи оптимизации - наличие адекватной математической модели, которая связывает параметры оптимизации (в данном случае это альтернативные варианты действий) с переменными, входящими в целевую функцию (функция полезности). В методах теории полезности такие модели имеют вероятностный характер и основаны на том, что оценка вероятности ожидаемого исхода может быть использована для введения числовых оценок возможных вероятных распределений на конечном множестве исходов.

Задача выбора наилучшего решения в соответствии с аксиоматикой теории полезности [10] может быть представлена следующим образом:

где и(К) - многомерная функция полезности;

К- точка в критериальном пространстве;

f(K/A) - функция плотности условного от альтернативы А распределения критериальных оценок.

Построение функций полезности является основной и наиболее трудоемкой процедурой методов теории полезности, после этого с помощью такой функции можно оценить любое количество альтернатив.

Процедура построения функции полезности включает пять шагов.

Шаг 1. Подготовительный. Главная задача здесь - подбор экспертов и разъяснение им того, как следует выражать свои предпочтения.

Шаг 2. Определение вида функции. Функция полезности должна отражать представления ЛПР и экспертов об ожидаемой полезности возможных исходов. Поэтому множество исходов упорядочивается по их предпочтительности, после чего в соответствие каждому возможному исходу необходимо поставить предполагаемое значение ожидаемой полезности. На этом шаге выясняют, является ли функция полезности монотонной, убывающей или возрастающей, отражает ли она склонность, несклонность или безразличие к риску и т. п.

Шаг 3. Установление количественных ограничений. Здесь определяется интервал изменения аргумента функции полезности и устанавливаются значения функции полезности для нескольких контрольных точек.

Шаг 4. Подбор функции полезности. Необходимо выяснить, являются ли согласованными количественные и качественные характеристики, выявленные к данному моменту. Положительный ответ на этот вопрос равнозначен существованию некоторой функции, которая обладает всеми требуемыми свойствами. Если последует отрицательный ответ, то возникает проблема согласования свойств, что предполагает возврат на более ранние шаги.

Шаг 5. Проверка адекватности. Необходимо убедиться в том, что построенная функция полезности действительно полностью соответствует истинным предпочтениям ЛПР. Для этого применяются традиционные методы сравнения расчетных значений с экспериментальными.

Рассмотренная процедура соответствует задаче со скалярной функцией полезности. В общем случае последняя может быть векторной величиной. Это имеет место, когда ожидаемую полезность невозможно представить единственной количественной характеристикой (задача со многими критериями). Обычно многомерная функция полезности представляется как аддитивная или мультипликативная функция частных полезностей. Процедура построения многомерной функции полезности еще более трудоемка, чем одномерной.

Таким образом, методы теории полезности занимают промежуточное место между методами принятия решений в условиях определенности и методами, направленными на выбор альтернатив в условиях неопределенности. Для применения этих методов необходимо иметь количественную зависимость между исходами и альтернативами, а также экспертную информацию для построения функции полезности. Эти условия выполняются не всегда, что накладывает ограничение на применение методов теории полезности. К тому же следует помнить, что процедура построения функции полезности трудоемка и плохо формализуема.


Лекция 11

Общая постановка однокритериальной задачи принятия решений.

Пусть исход управляемого мероприятия зависит от выбранного решения (стратегии управления) и некоторых неслучайных фиксированных факторов, полностью известных лицу, принимающему решение. Стратегии управления могут быть представлены

в виде значений n-мерного вектора , на компоненты которою наложены ограничения, обуслов­ленные рядом естественных причин и имеющие вид

; (2.2)

,

где , некоторый массив фиксированных неслучайных параметров.

Условия (2.2) определяют область допустимых значений стратегий X.

Эффективность управления характеризуется некото­рым численным критерием оптимальности F:

, (2.3)

где C — массив фиксированных, неслучайных параметров. Массивы и C характеризуют свойства объектов, участвующих в управлении, и условия протекания управ­лении.

Перед лицом, принимающим решение, стоит задача выбора такого значения вектора управления из области его допустимых зна­чений, которое максимизирует значение критерия опти­мальности F, а также значение этого максимума

где область представляется условием (2.2).

В (2.4) символы и обозначают максимально до­стижимое в условиях (2.2) значение критерия оптималь­ности F и соответствующее ему оптимальное значение вектора управления X.

Совокупность соотношений (2.2), (2.3) и (2.4) пред­ставляет собой общий вид математической модели однокритериальной статической детерминированной ЗПР.

Задача в такой постановке полностью совпадает с общей постановкой задачи математического программи­рования. Поэтому весь арсенал методов, разработанных для решения задач математического программирования, может быть использован для решения задач принятия решений данного класса. Мы не будем здесь из-за не­достатка места останавливаться на обзоре соответствую­щих методов решения.

Рассмотрим пример однокритериальной статической детерминированной ЗПР.

Пусть необходимо отображать некоторое количество информационных моделей (например, картографическую информацию). Для отобра­жения любой из моделей всегда требуется решить п различных задач (отображение символов, отображение векторов, поворот и перемещение изображении, масштабирование и т.п.). Все задачи взаимно независимы. Для решения них задач могут быть использованы т различных микропроцессоров . В течение времени T микропроцессор , может решить , задач типа , т.е. решить задачу , несколько раз по одному и тому же алгоритму, но для различных исходных данных.

Информационную модель можно отображать только в том случае, если она содержит полный набор результатов решения всех задач .

Требуется распределить задачи по микропроцессором так, чтобы число информационных моделей, синтезированные за время Т, было максимально. Иначе говори, необходимо указать, какую часть времени Т микропроцессор должен занимать решением задачи ,.

Обозначим эту величину через (если эта задача не будет решать­ся на данном микропроцессоре, то ).

Очевидно, что общее время занятной каждого микропроцессора решением тех задач не должно превышать общего запаса времени T, «доля» — единицы. Таким образом, имеем следующие ограничительные условия:

Общее количество решений задачи , полученных всеми микро­процессорами вместе,

Так как информационная модель может быть синтезирована лишь из полного набора результатов решения всех задач, то количество информационных моделей F будет определяться минимальным из чисел .

Итак, имеем следующую математическую модель: требуется найти такие , чтобы обращалась в максимум функция F

при

 

Общая постановка однокритериальной статической задачи принятия решений в условиях риска. Как отмечалось, каждая выбранная стратегия управления в условиях риска связана с множеством возможных исходов, причем каждый исход имеет определенную вероятность появления, известную заранее человеку, принимающему решение.

При оптимизации решения в подобной ситуации стохастическую ЗПР сводят к детерминированной. Широ­ко используют при этом следующие два принципа: искус­ственное сведение к детерминированной схеме и оптими­зация в среднем.

В первом случае неопределенная, вероятностная кар­тина явления приближенно заменяется детерминирован­ной. Для этого все участвующие в задаче случайные факторы приближенно заменяются какими-то неслучай­ными характеристиками этих факторов (как правило, их математическими ожиданиями).

Этот прием используется в грубых, ориентировочных расчетах, а также в тех случаях, когда диапазон возмож­ных значений случайных величин сравнительно мал. В тех случаях, когда показатель эффективности управле­ния линейно зависит от случайных параметров, этот прием приводит к тому же результату, что и «оптимизация в среднем».

Прием «оптимизация в среднем» заключается в пере­ходе от исходного показателя эффективности Q, являюще­гося случайной величиной:

где X — вектор управления; А — массив детерминирован­ных факторов; — конкретные реализации слу­чайных фиксированных факторов к его осредненной, статической характеристике, например к его мате­матическому ожиданию M[Q]:

 

Здесь В — массив известных статистических характе­ристик случайных величин — закон распределения вероятностей случайных величин .

При оптимизации в среднем по критерию (2.5) в каче­стве оптимальной стратегии будет выбрана такая стратегия, которая, удовлетворяя ограничениям на об­ласть допустимых значений вектора X, максимизирует значение математического ожидания F = M[Q] исходного показателя эффективности Q, т. е.

 

 

В том случае, если число возможных стратегий i ко­нечно и число возможных исходов j конечно то выражение (2.6) переписывается в виде

где — значение показателя эффективности управления в случае появления j-го исхода при выборе i стратегии управления; — вероятность появления j-го исхода при реализации i-й стратегии.

Из выражений (2.6) и (2.7) следует, что оптимальная стратегия X приводит к гарантированному наилучшему результату только при многократном повторении ситуации в одинаковых условиях. Эффективность каждого отдель­ного выбора связана с риском и может отличаться от средней величины как в лучшую, так и в худшую сторону.

Сравнение двух рассмотренных принципов оптимиза­ции в стохастических ЗПР показывает, что они представ­ляют собой детерминизацию исходной задачи на разных уровнях влияния стохастических факторов. «Искусствен­ное сведение к детерминированной схеме» представляет собой детерминизацию на уровне факторов, «оптимизация в среднем» — на уровне показателя эффективности.

После выполнения детерминизации могут быть исполь­зованы все методы, применимые для решения однокритериальных статических детерминированных ЗПР.

Рассмотрим пример однокритериальной статической задачи при­нятия решений в условиях риска.

Для создания картографической базы данных необходимо кодиро­вать картографическую информацию. Использование поэлементного ко­дирования приводит к необходимости использования чрезвычайно больших объемов памяти. Известен ряд методов кодирования, позво­ляющих существенно сократить требуемый объем памяти [например, линейная интерполяции, интерполяция классическими многочленами, кубинские сплайны и т.д; см. кн. 4 настоящего сериала]. Основным показателем эффективности метода кодирования является коэффициент сжатия информации. Однако значение этого коэффициента зависит от вида кодируемой картографической информации (гидрография, границы административных районов, дорожная сеть и т. д). Обозначим через значение коэффициента сжатия i-го метода ко­дирования для /го вида информации. Конкретный район, подлежащий кодированию, заранее неизвестен. Однако предварительный анализ кар­тографической информации всего региона и опыт предыдущих разра­боток позволяют вычислить вероятность появления каждого из видов информации. Обозначим через , вероятность появления j-го вида,

Тогда, используя метод оптимизации в среднем, следует выбрать такой метод кодирования, для которого

 

 


Лекция №12


Поделиться:



Популярное:

Последнее изменение этой страницы: 2017-03-11; Просмотров: 838; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.027 с.)
Главная | Случайная страница | Обратная связь