АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Определение оптимальных стратегий и цены игры и составляет сущность процесса нахождения решения игры

Читайте также:
  1. Access. Базы данных. Определение ключей и составление запросов.
  2. FAST (Методика быстрого анализа решения)
  3. I. 2.1. Графический метод решения задачи ЛП
  4. I. Дифракция Фраунгофера на одной щели и определение ширины щели.
  5. I. Определение
  6. I. Определение
  7. I. Определение основной и дополнительной зарплаты работников ведется с учетом рабочих, предусмотренных технологической картой.
  8. I. Определение пероксида водорода (перекиси водорода)
  9. I. Определение проблемы и целей исследования
  10. I. Определение ранга матрицы
  11. I. Пограничное состояние у новорожденных детей. Определение, характеристика, тактика медицинского работника.
  12. I. Сестринский процесс при гипертонической болезни: определение, этиология, клиника. Принципы лечения и уход за пациентами, профилактика.

З а д а ч а 16. Рассчитать цену игры, заданную матрицей

,

из предположения, что игроки имеют оптимальные смешанные стратегии u*=(0,3; 0,3; 0,4), z*=(0,2; 0,5; 0,3).

Р е ш е н и е. Определим максимин и минимакс игры. Для этого выпишем вектор-строку минимальных выигрышей игрока А и максимальных проигрышей игрока В: α=(2; 3; 2), β=(5; 5; 4). Тогда максимин равен αmax =3, минимакс равен βmin=4. Следовательно, цена игры будет находиться между числами 3 и 4. Рассчитаем ее, воспользовавшись выражением (26).

.

Получили ответ – цена игры равна 3,63, что соответствует теоретическим представлениям.

Справедлива фундаментальная теорема Дж.Неймана, которую приведем без доказательства.

Т е о р е м а 2 (основная теорема матричных игр). Любая матричная игра имеет решение в смешанных стратегиях.

Значение и нетривиальность теоремы обусловлены тем, что в общем случае матричные игры в чистых стратегиях решения не имеют.

Т е о р е м а 3. Для того, чтобы число v было ценой игры, а u* и z* - оптимальными стратегиями, необходимо и достаточно выполнение неравенства:

; (j=1…n);

; (i=1…m).

Эта теорема определяет, что, соблюдая оптимальные смешанные стратегии, первый игрок может выиграть не менее цены игры, а второй игрок имеет шанс проиграть не более цены игры.

Т е о р е м а 4. Если один из игроков применяет оптимальную смешанную стратегию, то его выигрыш (или проигрыш второго) равен цене игры v независимо от того, с какими частотами будет применять второй игрок стратегии, вошедшие в оптимальную (в том числе и чистые стратегии).

Она важна тем, что позволяет выработать методику решения игры для игр 2×2, 2×n, m×2.

Рассмотрим возможность приложения приведенных выше теорем для решения парной игры типа 2×2 аналитическим методом.

З а д а ч а 17. Найти решение игры, заданной матрицей

.

Р е ш е н и е. В данной задаче имеем две стратегии первого игрока, т.е. m=2, и две стратегии второго игрока, т.е. n=2. Прежде всего проверим, возможность наличия седловой точки в данной игре. Для этого выпишем минимальные выигрыши первого игрока по двум чистым стратегиям (по строкам) α=(2; 4) и максимальные проигрыши второго игрока также по его двум чистым стратегиям (по столбцам) β=(6; 5). Из этих векторов выпишем макcимин для первого игрока αmax=4, минимакс для второго игрока βmin=5. Так как они не равны, то решение следует искать в смешанных стратегиях, а цена игры должна быть в пределах .

Предположим, что для игрока А стратегия задается вектором u=(u1; u2), а для игрока В – вектором z=(z1; z2). Тогда, на основании теоремы 4, при применении игроком В чистой стратегии z1 или z2 игрок А получит средний выигрыш, равный цене игры v, т.е.

(при стратегии z1),

(при стратегии z2).

Помимо двух записанных уравнений относительно u1* и u2* добавим уравнение, связывающее их как частоты:

.

Решая полученную систему трех уравнений с тремя неизвестными, находим

; ; .

Найдем теперь оптимальную стратегию для игрока В. В отношении его можно составить следующую систему уравнений:

(при стратегии u1),

(при стратегии u2),

.

Здесь имеются три уравнения, а неизвестных два, т.е. одно из уравнений уже лишнее. Решая систему, получаем

; .

Следовательно, решением задачи будут смешанные стратегии при цене игры:

; ; .

Результаты полностью согласуются с теоретическими предпосылками.


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.003 сек.)