АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Обратная индукция и конечные игры с совершенной информацией

Читайте также:
  1. Аспекты несовершенной системы качества продукции
  2. Биосинтез ДНК (репликация). Биосинтез РНК (транскрипция). Посттранскрипционный процессинг РНК. Основные положения аминокислотного кода. Обратная транскрипция.
  3. Глава 6. МЕХАНИЗМ РЫНКА СОВЕРШЕННОЙ КОНКУРЕНЦИИ
  4. Глава 7. МЕХАНИЗМ РЫНКА НЕСОВЕРШЕННОЙ КОНКУРЕНЦИИ
  5. Действие нормативных актов во времени, в пространстве и по кругу лиц. Обратная сила закона.
  6. Действие уголовного закона во времени. Обратная сила закона.
  7. Долгосрочное равновесие фирмы и отрасли в условиях совершенной конкуренции: механизм установления и поддержки
  8. И ОБМЕНА ДЕЛОВОЙ ИНФОРМАЦИЕЙ ПО ФАКСУ
  9. Коммуникационный процесс - это обмен информацией между людьми, целью которого является обеспечение понимания передаваемой и получаемой информации.
  10. Конечные результаты обучения
  11. Конкуренция и конкурентные среды. Рыночная власть. Цели и методы гос. регулирования конкурентных сред. Распределение рыночной власти в рынке несовершенной конкуренции.
  12. Нормативно-правовое регулирование работы с информацией ограниченного доступа.

Для того чтобы внимательнее посмотреть на обратную индукцию в конечной игре с совершенной информацией, начнём с определения оптимального «действия» в последних вершинах дерева, где принимается решение (т.е. тех вершин, для которых «последователи» – это только терминальные вершины). Решение, принимаемое игроком в такой вершине, не зависит уже от стратегического взаимодействия и потому является простой задачей принятия решения. Затем мы может обратиться к «предпоследней» вершине и найти оптимальное решение там, предвидя, естественно, ход, который будет сделан в последней вершине. И так далее.

Рассмотрим следующий пример позиционной игры (рис. 9.10):

Рис. 9.10. Дерево неантагонистической позиционной игры 3-х игроков

 

Принимая оптимальные решения для третьего игрока в последних вершинах дерева, приходим к первой редуцированной игре следующего вида (рис. 9.11):

Рис. 9.11. Редуцированная игра после принятия решения третьим игроком

 

Принимая оптимальное решение для второго игрока, получаем вторую редуцированную игру (рис. 9.12):

Рис. 9.12. Редуцированная игра после принятия решения вторым

игроком

 

Опишем с учётом наших последовательных рассуждений оптимальные стратегии игроков:

, т.к. ;

, если игрок 1 играет R, т.к. ;

Игровая ситуация является равновесной по Нэшу. Игрок отклонившись в единоличном порядке от своей оптимальной стратегии может лишь ухудшить своё положение. Найденное решение игры проведено в соответствии с принципом последовательной рационализации.

В любой конечной игре с совершенной информацией существует ситуация равновесия по Нэшу в чистых стратегиях, которая может быть найдена с помощью обратной индукции. Более того, если ни один из игроков не имеет одинаковых выигрышей ни в одной из терминальных вершин, то существует единственное равновесие по Нэшу, которое может быть полученное методом обратной индукции.

53.Модель дуополии Штакельберга.

Дуополия по Штакельбергу – это модификация дуополии по Курно. Теперь мы считает, что есть лидер, который делает ход первым. Затем, зная этот выбор, другой игрок делает свой ход.

Итак, игра протекает следующим образом:

1) фирма 1 выбирает ;

2) фирме 2 становится известна величина , и после этого она выбирает ;

3) Выигрыш фирмы определяется формулой , .

Для нахождения равновесия воспользуемся обратной индукцией. Определим сначала функцию реагирования фирмы 2, решая задачу

.

Привлекая необходимое условие существования экстремума получаем функцию реагирования . То же самое было и в случае дуополии Курно. Разница, однако, в том, что действительная, а не гипотетическая функция реагирования фирмы 2.

Фирма 1, естественно, также может вычислить эту функцию реагирования, а, следовательно, задача фирмы 1 выглядит так:

,

что даёт и .

Прибыль в случае дуополии по Штакельбергу:

, .

Для сравнения в модели Курно:

.

54.Модель последовательного торга.

Рассмотрим следующую игру. Игроки 1 и 2 торгуются о разделе 1 доллара: 1-й игрок предлагает некоторый способ деления, 2-й либо принимает это предложение, либо нет; если нет, то он предлагает способ деления, а 1-й принимает, либо нет и т.д.

Каждое предложение занимает один период, но при этом есть дисконтирующий множитель. Итак, формально рассмотрим следующую трёхпериодную (трёхшаговую) игру.

1.а) В начале первого периода игрок 1 предлагает «свою долю» доллара, оставляя игроку 2.

1.b) Игрок 2 принимает предложение, тогда игра заканчивается, либо отклоняет его. В этом случае игра переходит ко 2-му периоду.

2.a) В начале второго периода игрок 2 предлагает долю , которую получает игрок 1, оставляя себе .

2.b) Игрок 1 либо принимает предложение, либо нет. В последнем случае игра переходит к 3-му периоду.

3) Игроки в третьем периоде получают доли , , причём d задан экзогенно.

Решим данную задачу с помощью метода обратной индукции. Сначала вычислим, что происходит, если дело доходит до 2-го периода. Игрок 1 может получить d, если отклонит . С учётом дисконтирования (мы сравниваем стоимость в разных (соседних) периодах) игрок 1 примет тогда и только тогда, когда , – коэффициент дисконтирования. Это значит, что задача игрока 2 состоит в выборе между получением и получением в следующем периоде. Дисконтированная стоимость последнего действия есть , что меньше, чем , а потому игрок 2 во втором периоде предлагает .

Таким образом, если игра доходит до второго периода, то 2-й игрок предложит , и игрок 1 примет это предложение.

Однако игрок 1 может предвидеть, что игрок 2 может получить во втором периоде, отклоняя предложение . В первом периоде стоимость с учётом дисконтирования составит . Значит, игрок 2 принимает тогда и только тогда, когда , или .

Поэтому задача игрока 1 в первом периоде состоит в выборе между получением в этом периоде и получением в следующем периоде. Дисконтированная величина составляет , что меньше, чем . Значит, оптимальное предложение в первом периоде есть . Следовательно, в первом периоде игрок 1 предлагает , а игрок 2 принимает это предложение и получает . Таким образом, выигрыш игроков есть и соответственно.

55.Модель «инвесторы и банк»:

Представим следующую ситуацию. Два инвестора вкладывают по D долларов в банк. Банк инвестировал эти средства в долгосрочный проект. Если форс-мажорные обстоятельства заставляют банк ликвидировать свои инвестиции до того, как проект «созревает», то он покрывает некоторую сумму , где . Если банк позволяет проекту «созреть», то проект принесёт , .

Есть два периода, когда вкладчики могут забрать свой вклад: период 1 – до «созревания», период 2 – после созревания. Для упрощения не будем учитывать дисконтирование. Если оба вкладчика забирают вклады в период 1, то оба получают по r и игра заканчивается. Если только один вкладчик забирает в период 1, то он получает D, а второй получает . Наконец, если ни один вкладчик не забирает в период 1, то проект «созревает», и оба вкладчика забирают свои деньги в период 2, и каждый получает по R. Если только один вкладчик забирает деньги в период 2, то он получает , другой получает D. Если, наконец, ни один не забирает в период 2, то банк возвращает по R каждому.

Дерево игры изображено на рис. 8.16.

Рис. 8.16.

Без строгой формализации игру в период 1 можно изобразить следующим образом:

  Забирать Не забирать
Забирать (r, r) (D, 2 rD)
Не забирать (2 rD, D) (Шаг 2)

Для периода 2:

  Забирать Не забирать
Забирать (R, R) (2 RD, D)
Не забирать (D, 2 RD) (R, R)

Рассмотрим внимательно матрицу для периода 2. Поскольку и , то в соответствии с принципом последовательной рациональности можем перейти к матрице для периода 1:

  Забирать Не забирать
Забирать (r, r) (D, 2 rD)
Не забирать (2 rD, D) (R, R)

 

Т.к. и , то получаем два равновесия по Нэшу, дающие выигрыши (r, r) и (R, R). Принцип рационализации даёт нам окончательное решение (R, R).

 

 


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.005 сек.)