|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Итеративный метод решения игрМатричная игра порядка В основе метода лежит предположение, что одна и та же игра играется много раз, а игроки выбирают свои стратегии, на основе опыта сыгранных партий рассуждая следующим образом. Пусть в игре было сделано r партий и игрок A обобщив свои наблюдения, обнаружил, что игрок B применял свою первую стратегию k 1 раз, вторую – k 2 раз и так далее. На основании этого он считает, что вероятность выбора игроком B стратегии Bj равна Доказано, что если каждый из игроков имеет единственную оптимальную смешанную стратегию, то при неограниченном увеличении числа партий приближенные смешанные стратегии стремятся к оптимальным стратегиям обоих игроков. Средний выигрыш игрока A и средний проигрыш игрока B стремится при этом к цене игры v. Проиллюстрируем метод Брауна на примере. Пример. Пусть платежная матрица имеет вид
Легко установить, что матрица седловой точки не имеет. Нижняя цена игры α = 1, верхняя цена β = 3. Проделаем ряд партий фиктивной игры, которая проводится по методу Брауна. Партия 1. Совершенно произвольно предположим, что в первой партии игроки выбирают стратегии A 1 и B 1. Запишем номер партии, выбранные игроками стратегии и результат игры при любом ответе противника в таблицу.
Партия 2. Игрок A установил, что игрок B использовал в первой партии стратегию B 1 и согласно методу Брауна он считает, что во второй партии игрок B поступает точно также, а поэтому он выбирает стратегию A 1, которая делает ему наибольший выигрыш, равный 4. С другой стороны, игрок B хочет минимизировать свой проигрыш (и он тоже проводит рассуждения аналогичные рассуждениям игрока A). Он знает, что в первой партии игрок A выбрал стратегию A 1 и (согласно методу Брауна) он считает, что во второй партии игрок A выбирает ту же стратегию A 1. Поэтому игрок B выбирает стратегию, которая даст ему при этом наименьший проигрыш, то есть стратегию B 2 или B 3 с одинаковым проигрышем равным 1. Будем считать, для определенности, что игрок B выбирает стратегию с меньшим номером, то есть B 2. Запишем суммарный итог двух партий во второй строке таблицы. Выигрыш игрока A будет равен 8, если игрок B раз выберет стратегию B 1; ну а если игрок B оба раза выберет стратегию B 2 или B 3, то выигрыш игрока A будет равен 2. Проигрыш игрока B: если в ответ на стратегию игрока B: B 1 и B 2, игрок A оба раза ответит стратегией A 1 или A 2, то проигрыш будет равен 5, а если стратегией A 3, то проигрыш равен 2.
Партия 3. Каждую чистую стратегию выбирает игрок A в третьей партии. Игрок A анализирует смешанную стратегию игрока B: Итак, в третьей партии игрок A выбирает стратегию A 1, а B – B 2. Запишем эти стратегии и ожидаемый накопленный за три партии выигрыш игрока A (при любой чистой стратегии игрока B) и накопленный проигрыш игрока B (для каждой чистой стратегии игрока A) в третью строку таблицы. И, так далее, в таблице записаны 20 партий фиктивной игры. Из таблицы видно, что игрок A использовал стратегию A 1 – 3 раза; A 2 – 6 раз и A 3 – 11 раз. Оценка его оптимальной смешанной стратегии записывается в виде: X 20 = (0,15; 0,30; 0,55). Аналогично, оценка оптимальной смешанной стратегии игрока B имеет вид: Y 20 = (0,35; 0,15; 0,50). Минимальный средний выигрыш игрока A за 20 партий равен: 29/20 = 1,45; а максимальный средний проигрыш игрока B равен: 41/20 = 2,05. Это и есть, соответственно, оценки нижней и верхней цены игры. Рассмотренный итерационный процесс сходится очень медленно. Но очень легко программируется и вычисления его просты; и даже при больших размерах матрицы он достаточно эффективен. Поиск по сайту: |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (1.972 сек.) |