Динамическая модель принятия решений с непрерывным временем

⇐ ПредыдущаяСтр 11 из 13Следующая ⇒

Рассмотрим повторяющуюся игру с непрерывным временем

проистекающую на отрезке t [0, 1].

Множество выборов игроков содержат функции

(t): [0, 1] → ,

а функции выигрыша определяются сверткой по времени следующего вида:

Здесь, как и ранее

На функции накладываются условия измеримости (интегрируемости) так, что интегралы (2) существуют.

Построим и изучим свойства ситуаций равновесия на классе стратегий

где

По определению положим при то есть в начальной момент, когда нет предыстории, может быть выбрана любая точка из исходного множества

Содержательно использование такой стратегии соответствует следующей информированности игроков: каждый игрок в момент времени знает предисторию – действия партнеров до этого момента.

Замечание 4. Здесь информированность игроков друг о друге соответствует в статике нереализуемой паре

но в динамике противоречие снимается тем, что речь идет о взаимной информированности в предшествующий принятию решения момент времени.

Итак, будем изучать ситуацию равновесия в информационном расширении исходной динамической игры, а именно, в игре

где множества определяются функциями ,

пара стратегий проектируется в пару управлений ( (t), (t)):

( (t), (t)),

а выигрыши вычисляются по правилу:

Выберем элемент и построим стратегии вида:

Теорема. Набор образуют ситуацию равновесия в игре .

Доказательство. Набор таких стратегий очевидно реализует (проектируется) ситуацию , следовательно, каждый игрок получает выигрыш

Пусть теперь , а , то есть игрок 2 пытается получить больший выигрыш, отклонившись от равновесной стратегии. Пусть - время начала отступления игрока 2 от выбранной стратегии

Тогда выигрыш игрока 2 при любой стратегии оценивается следующей цепочкой неравенств:

∙

то есть отклонение не увеличивает выигрыш игрока 2.

Аналогично показывается, что игроку 1 также невыгодно отклоняться от равновесной стратегии. Теорема доказана.

Следствие. Необходимым и достаточным условием существования ситуации равновесия в изучаемой игре является условие

D (взаимовыгодное множество D не пусто).

Упражнение. Показать, что , если в статической антагонистической игре с функцией выигрыша или существует седловая точка.

Замечание 5. Седловая точка всегда существует на классе смешанных стратегий. При этом равновесные стратегии можно выбрать таким образом, что стохастика проявится только в стратегиях наказания, которые никогда не реализуются в силу предположений о рациональном поведении игроков.

Замечание 6. Можно вместо стационарных стратегий использовать нестационарные траектории удовлетворяющие условию

Это позволяет, например, в игре “семейный спор” супругам по очереди использовать разновыгодные ситуации равновесия.

Замечание 7. Всегда
где P – множество Парето, следовательно эффективные точки могут быть реализованы как исходы равновесных стратегий. То есть всегда можно выбрать паретовскую точку и сделать из неё ситуацию равновесия.

Таким образом, в динамических моделях принятия решений всегда с использованием необходимой информации можно построить компромиссные – равновесные решения.

В иерархической игре игрок 1 (начальник) всегда может выбрать для себя наилучшую равновесную ситуацию. Более того, начальник может выбрать наилучшую для себя точку из множества , то есть как и в статической игре начальник реализует максимум своей функции выигрыша с учетом интересов подчиненного, который получит не менее своего минимаксного выигрыша.

Однако используемый класс стратегий предполагает непрерывное наблюдение, а, следовательно, анализ большого объема поступаемой информации.

Несколько смягчает ситуацию тот факт, что необходимо знать только, нарушил партнер (подчинённый) договоренность или нет.

Тем не менее, задача более экономного использования информации остается актуальной.

⇐ Предыдущая 4 5 6 7 8 9 101112 13 Следующая ⇒