Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Динамическая модель принятия решений с непрерывным временем



 

Рассмотрим повторяющуюся игру с непрерывным временем

 

 

проистекающую на отрезке t [0, 1].

 

Множество выборов игроков содержат функции

(t): [0, 1] → ,

а функции выигрыша определяются сверткой по времени следующего вида:


Здесь, как и ранее

 

 

На функции накладываются условия измеримости (интегрируемости) так, что интегралы (2) существуют.

 

Построим и изучим свойства ситуаций равновесия на классе стратегий

 

 

где

 

 

По определению положим при то есть в начальной момент, когда нет предыстории, может быть выбрана любая точка из исходного множества

 

Содержательно использование такой стратегии соответствует следующей информированности игроков: каждый игрок в момент времени знает предисторию – действия партнеров до этого момента.

 

Замечание 4. Здесь информированность игроков друг о друге соответствует в статике нереализуемой паре

 

 

но в динамике противоречие снимается тем, что речь идет о взаимной информированности в предшествующий принятию решения момент времени.

 

Итак, будем изучать ситуацию равновесия в информационном расширении исходной динамической игры, а именно, в игре

 

 

где множества определяются функциями ,

пара стратегий проектируется в пару управлений ( (t), (t)):

( (t), (t)),

а выигрыши вычисляются по правилу:

Выберем элемент и построим стратегии вида:

 

 

Теорема. Набор образуют ситуацию равновесия в игре .

 

Доказательство. Набор таких стратегий очевидно реализует (проектируется) ситуацию , следовательно, каждый игрок получает выигрыш

 

 

Пусть теперь , а , то есть игрок 2 пытается получить больший выигрыш, отклонившись от равновесной стратегии. Пусть - время начала отступления игрока 2 от выбранной стратегии

 

 

Тогда выигрыш игрока 2 при любой стратегии оценивается следующей цепочкой неравенств:

 

 

,

то есть отклонение не увеличивает выигрыш игрока 2.

 

Аналогично показывается, что игроку 1 также невыгодно отклоняться от равновесной стратегии. Теорема доказана.

 

Следствие. Необходимым и достаточным условием существования ситуации равновесия в изучаемой игре является условие

D (взаимовыгодное множество D не пусто).

Упражнение. Показать, что , если в статической антагонистической игре с функцией выигрыша или существует седловая точка.

Замечание 5. Седловая точка всегда существует на классе смешанных стратегий. При этом равновесные стратегии можно выбрать таким образом, что стохастика проявится только в стратегиях наказания, которые никогда не реализуются в силу предположений о рациональном поведении игроков.

 

Замечание 6. Можно вместо стационарных стратегий использовать нестационарные траектории удовлетворяющие условию

 

 

Это позволяет, например, в игре “семейный спор” супругам по очереди использовать разновыгодные ситуации равновесия.

 

Замечание 7. Всегда
где P – множество Парето, следовательно эффективные точки могут быть реализованы как исходы равновесных стратегий. То есть всегда можно выбрать паретовскую точку и сделать из неё ситуацию равновесия.

 

Таким образом, в динамических моделях принятия решений всегда с использованием необходимой информации можно построить компромиссные – равновесные решения.

 

В иерархической игре игрок 1 (начальник) всегда может выбрать для себя наилучшую равновесную ситуацию. Более того, начальник может выбрать наилучшую для себя точку из множества , то есть как и в статической игре начальник реализует максимум своей функции выигрыша с учетом интересов подчиненного, который получит не менее своего минимаксного выигрыша.

 

Однако используемый класс стратегий предполагает непрерывное наблюдение, а, следовательно, анализ большого объема поступаемой информации.

 

Несколько смягчает ситуацию тот факт, что необходимо знать только, нарушил партнер (подчинённый) договоренность или нет.

 

Тем не менее, задача более экономного использования информации остается актуальной.


Поделиться:



Популярное:

  1. Анализатор – это сложная нейродинамическая система, которая представляет собой афферентную часть рефлекторного аппарата.
  2. Апелляция решений, разрешающих или отказывающих в разрешении использовать запрещенные препараты исключительно по терапевтическим показаниям
  3. В зависимости от способа функционирования и порядка принятия решения : коллегиальные (предст.орган) и единоличные (глава местной админ.)
  4. В замкнутой системе момент импульса не изменяется со временем
  5. Виды налоговых правонарушений и ответственность за их совершение. Процедура обжалования решений налоговых органов
  6. Вопрос 209. Рассмотрение судом дел об оспаривании решений и действий, нарушающих права и свободы граждан и организаций.
  7. Вопрос 227. Рассмотрение гражданских дел третейскими судами. Исполнение решений третейских судов. Оспаривание решений третейских судов.
  8. Вопрос 246. Встречный иск в арбитражном процессе. Порядок предъявления, условия принятия и последствия их отсутствия.
  9. Вопрос 262. Рассмотрение арбитражными судами дел об оспаривании решений третейских судов и о выдаче исполнительных листов на принудительное исполнение решений третейских судов.
  10. Вопрос 368. Досудебное соглашение о сотрудничестве. Особый порядок принятия судебного решения.
  11. Вопрос 437. Правовые последствия принятия решения Европейским судом по правам человека. Исполнение решений Европейского суда в части принятия мер индивидуального и общего характера.
  12. Геометрическая интерпретация решений дифференциальных


Последнее изменение этой страницы: 2016-07-13; Просмотров: 648; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.012 с.)
Главная | Случайная страница | Обратная связь