Авто Автоматизация Архитектура Астрономия Аудит Биология Бухгалтерия Военное дело Генетика География Геология Государство Дом Другое Журналистика и СМИ Изобретательство Иностранные языки Информатика Искусство История Компьютеры Кулинария Культура Лексикология Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлы и Сварка Механика Музыка Население Образование Охрана безопасности жизни Охрана Труда Педагогика Политика Право Приборостроение Программирование Производство Промышленность Психология Радио Регилия Связь Социология Спорт Стандартизация Строительство Технологии Торговля Туризм Физика Физиология Философия Финансы Химия Хозяйство Ценнообразование Черчение Экология Эконометрика Экономика Электроника Юриспунденкция

Графо-аналитический метод решения матричной игры 2 х n и m х 2

Читайте также:

Пусть игра задана платежной матрицей . По оси абсцисс отложим единичный отрезок А₁ А₂, где точка А₁ (0, 0) изображает стратегию А₁, А₂ (1, 0) – стратегию А₂, а каждая промежуточная точка S_A этого отрезка изображает смешанную стратегию первого игрока P_A = (p₁, p₂), где p₁– расстояние от точки S_A до A₂, p₂–расстояние от точки S_A до A₁. Выигрыш игрока A будем откладывать на вертикальных отрезках.

Случай 1. Если игрок B применит стратегию В₁, то выигрыш игрока A при стратегии А₁ равен а₁₁, поэтому на оси ординат отложим отрезок А₁В₁ = а₁₁. При применении игроком A стратегии А₂ выигрыш равен а₂₁, отложим этот отрезок на перпендикуляре из точки А₂, обозначим полученную точку В₁'. Ордината любой точки М₁ отрезка В₁В₁^′ равна среднему выигрышу игрока A при применении смешанной стратегии S_A(действительно, этот выигрыш равен математическому ожиданию случайной величины, т.е. a₁₁p₁ + a₂₁p₂). Запишем уравнение прямой В₁В₁^′:
, т. е. ,
тогда при x = p₂ получим
y = a₁₁ + p₂a₂₁ – p₂a₁₁ = a₁₁(1-p₂) + p₂a₂₁ = a₁₁p₁ + a₂₁p₂
Случай 2. Если игрок B применяет стратегию В₂, то аналогично откладываем отрезки а₁₂ и а₂₂ и получаем отрезок В₂В₂^′. Ордината любой точки М₂ отрезка В₂В₂^′ – выигрыш игрока A, если A применяет смешанную стратегию S_A, а B – стратегию В₂.
Построим нижнюю границу выигрыша игрока А – ломаную В₁ NВ₂^′. Ординаты точек этой ломаной показывают минимальные выигрыши игрока А при использовании им любой смешанной стратегии. Оптимальное решение игры определяет точка N, в которой выигрыш игрока А принимает наибольшее значение. Ордината точки N равна цене игры. Проекция этой точки на ось ОХ показывает оптимальную стратегию (р₁, р₂).
Аналогично находится оптимальная стратегия Q = (q₁, q₂) игрока B, только в соответствии с принципом минимакса надо находить верхнюю границу выигрыша, т. е. строить ломаную А₂NА₁^′ и брать точку N с наименьшей ординатой.
Абсцисса точки N определяет оптимальную стратегию игрока B, т. е. Q = (q₁, q₂).

Пример. Решить игру, заданную платежной матрицей , графоаналитическим способом.
Решение. Нижняя цена игры a = 1,5, верхняя цена игры b = 2. Так как , седловой точки нет. Так как a₁ = 1,5, a₂₁ = 2 строим точки B₁(0;1,5) и B₂(1;2), соединяем их отрезком. Так как a₂₁ = 3, a₂₂ = 1 строим точки B₂(0;3) и B₂’(1;1), соединяем их отрезком.

Уравнение прямой В₁В₁ ^′:
, т. е. y = 0,5x + 1,5;
уравнение В₂В₂ ^′: , т. е. y = 3-2x.
Найдем точку N пересечения прямых В₁В₁ ^′ и В₂В₂ ^′, для чего решим систему уравнений:

т. е. N (0,6; 1,8), откуда p₂= 0,6; p₁= 0,4; γ = 1,8 – цена игры.
Аналогично строим точки А₁ (0; 1,5) и А₁^′ (1;3), А₂ (0; 2) и А₂^′ (1; 1) и находим точку M пересечения прямых А₁А₁ ^′ и А₂А₂ ^′.

Ответ: смешанная стратегия игрока А: P_A= (0,4; 0,6), игрока В: Q_B = (0,8; 0,2); цена игры 1,8.

1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 |

Поиск по сайту:

Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.697 сек.)

Главная | О проекте | Полезные cсылки | Контакты | Случайная страница