Повторяющиеся решения. Игры с бесконечным и конечным числом повторений.

Стр 1 из 2Следующая ⇒

Повторяющиеся игры – это игры, когда игра повторяется несколько раз, причём она может повторяться конечное и бесконечное число раз, но результаты анализа различны. Участники игры оценивают результаты своих действий во все предыдущие моменты и выбирают свои стратеги на основании ранее полученного опыта.

Фирмы С и D участвуют в повторяющейся одномоментной игре и повторяют её 2-а раза.

Матрица игры:

Поскольку фирмы во 2-ой игре могут принимать решения на основе

1-ой игры, то их стратегии могут изменяться. Т.о. в повторяющейся

игре возможности у игроков больше и количество стратегий

больше:

1-ая стратегия – “зуб за зуб” – игрок начинает с решения не

не рекламировать, последовательно выбирает ту стратегию,

которую выбрал его соперник в предыдущей период.

2-ая стратегия – “беспощадная” или “жестокая” – игроки решают сначала

выбирать не рекламировать, а затем могут выбрать не рекламировать, если другой

игрок не рекламировал раньше, и рекламировать всегда, если один игрок хотя бы раз

принял рекламу.

Если игра одномоментная, то преобладает решение – не учитывать совместных интересов двух фирм (С и D). Но, если опыт предыдущий учтён, то результаты меняются. Если игра повторяется, то любой из участников выигрывает, если другой не рекламирует, т.е. кооперативное действие игроков – не рекламировать, а наказание другого участника – это рекламировать.

1-ая и 2-ая стратегии имеют общие черты: они начинаются с кооперативного действия –не рекламировать, затем наказание одного из участников, который выбрал – рекламировать. Отличие этих стратегий в том, в “беспощадной” стратегии наказание более суровое. Если игра повторяется бесконечное число раз, то игроки приходят к решению кооперироваться, применять совместные действия.

Сделаем небольшое отступление. Чтобы продолжить обсуждение надо ввести некоторые понятия:

Владелец денег вкладывает их в банк и получает какой-то %. А если берёт деньги из банка, то платит %. Стоимость доллара меняется, она дешевеет со временем.

r – ежегодный процент.

Доллар завтра будет стоить 1+r, тогда стоимость денежной единицы через год = 1/1+r, через два года единица будет стоить 1/(1+r)².

Поэтому, если зарабатываем ежегодно какую-то сумму Х, на следующий год предшествующий период мы получим сумму Х + X/1+r + X/(1+r)² +…+ x/(1+r)^t= X/(1+r)^t= δ ^t· x – ТЗ.

Коэффициент 1/1+r = δ – называется дисконт. Дисконтирование –приведение денег к единому моменту времени. Текущие значения (ТЗ) – это доход за определённый период времени. ТЗ – это величина течения дохода за момент t. Если время t увеличится до бесконечности, то сумма будет: δ ^t· x, а предел X/1-δ.

Предположим, что С и D следуют “беспощадной” стратегии. В начальный момент обе фирмы не рекламируют, но если посчитать выигрыш в бесконечной игре, они никогда не рекламировать не будут. С и D получат по 50. 50/1-δ – это выигрыш. Допустим в первый период С – рекламирует, а D выбирает “беспощадную” стратегию – не рекламировать (С получит 55). Но т.к. в последующие периоды D – рекламирует, то наивысший выигрыш С – 45 в последующие периоды. Если С будет использовать эту стратегию, то С=55 + 45/1-δ – это выигрыш (если сравнить, то 2-ой выигрыш будет больше, чем 1-ый, если δ ≥ 1/2, т.е. ‘беспощадную” стратегию выгодно использовать только в том случае, если δ ≥ 50%).

В повторяющейся игре лучше – не рекламировать. А в одномоментной – рекламировать, т.к. рекламирование даёт выигрыш только в первый период, а в повторяющейся игре, если другой игрок проводит “беспощадную” стратегию, то рекламировать выгодно.

Может ли быть так, что сегодняшний выигрыш будет больше, чем проигрыши всех последующий периодов. Это может произойти, но только в одном случае, если очень большой дисконт (ссудный %), тогда настоящие деньги стоят очень дорого, тогда возможны риски, и индивидуальные интересы преобладают над совместными (рискнуть и прорекламировать).

В “беспощадной” стратегии необходимо наказание того игрока, который нарушил правила игры (начал рекламировать), чтобы удержать другого игрока от того, чтобы он не поставил свои интересы выше кооперативных. Но это маловероятно, тогда бесконечная игра рассматривается так: после окончания каждой игры существует возможность начать игру сначала – это возможность θ , тогда ожидаемые текущие значения (ТЗ) выигрыша при “беспощадной” стратеги будут равны 50 + 50θ + 50θ ² +…, но а предел этой суммы будет равен 50/1-θ. Выигрыш в первой игре: 55 + 45θ + 45θ ² +…, предел суммы равен 55 + 45/1-θ.

Если сравнить эти два выражения, то видим, что при замене 2-х букв δ на θ, получим выражения с конечным числом повторений.

Если вероятность продолжения игры ≥ ½, то игрокам лучше следовать стратегии - не рекламировать, иначе наказание будет большим – это игра с бесконечным числом повторений.

Если игра с конечным числом повторений (если знаем сколько раз повториться игра), то результат такой – существует период игры, когда нет возможности наказания другого участника, этот последний период аналогичен одномоментной игре, т.о. участники выбирают стратегию – рекламировать. В этом случае рациональное поведение игроков не зависит от их прошлых действий, поэтому в последний момент они обязательно будут рекламировать – это единственная стратегия. А если каждый период рассматривать как последний, то они будут рекламировать всегда (это может быть, если действие фирмы законодательно не оформлено).

12 Следующая ⇒