|
||||||||||||||||||||||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Игры с седловой точкойРассмотрим общие принципы решения игр двух лиц с нулевой суммой. На основании принципа разумности рекомендуется выбирать в качестве наилучшей стратегии ту, которая обеспечивает наибольший гарантированный выигрыш (то есть выигрыш, не зависящий от действий противника, выигрыш, который противник никоим образом не может уменьшить). Пусть игра определяется матрицей: . Игрок A имеет m чистых стратегий Ai, а игрок B – n чистых стратегий Bj, . Паре стратегий (Ai, Bj) соответствует платеж Cij, выплачиваемый игроком B игроку A в конце игры, то есть выигрыш игрока A. Если игрок A использует стратегию Ai, то он получит выигрыш, по крайней мере равный , где минимум берется по всем стратегиям игрока B. И так как игрок A свободен в выборе своей стратегии, то для него естественно стремится к тому, чтобы сделать возможно большим; то есть стремится выбрать такую стратегию Ai 0, чтобы получить выигрыш не меньше, чем , где максимум берется по всем стратегиям игрока A. Стратегия Ai 0 называется максиминной стратегией игрока A. Это его наиболее осторожная стратегия, применение которой при любом поведении игрока B гарантирует игроку A выигрыш Cij не менее α. Величина α называется нижней ценой игры или максимином. Игрок B, рассуждая таким же образом, выбирает стратегию Bj 0, при которой игрок A получит выигрыш не более чем . Стратегия Bj 0 называется минимаксной стратегией игрока B. Это его наиболее осторожная стратегия, применение которой дает гарантию игроку B в том, что игрок A при любом своем поведении получает выигрыш не более чем . Величина называется верхней ценой игры или минимаксом. Таким образом, при наиболее острожной игре игрок A должен применить максиминную, а игрок B минимаксную стратегии. Принцип осторожности, которой диктует игрокам выбор таких стратегий называется принципом минимакса, а обе стратегии обобщенно минимаксными. Таким образом, в рекомендациях теории игр не учитываются элементы риска, а также возможные просчеты и ошибки игроков. А в реальной конфликтной ситуации имеются и элементы риска и ошибки. В каком же отношении находятся верхняя и нижняя цены игр. Можно показать, что для этих величин всегда справедливо неравенство , то есть нижняя цена игры всегда не больше верхней α ≤ β. Если нижняя цена игры равна верхней, то есть если α = β , то те значения i 0, j 0 при которых это равенство достигается указывают оптимальные стратегии игроков Ai 0 и Bj 0. В этом случае игрок A придерживаясь своей максиминной стратегии получает не менее чем v, а игрок B придерживаясь своей минимаксной стратегии помешает игроку A получить больше чем v. Всякое отклонение от оптимальных стратегий невыгодно обоим игрокам, так как для любых стратегий Ai и Bj справедливы неравенства: Ci,j 0 ≤ Ci 0, j 0 ≤ Ci 0, j. Элемент Ci 0, j 0 называется седловой точкой матрицы C. Это название соответствует тому, что элемент Ci 0, j0 матрицы C является одновременно минимальным в своей строке и максимальным в своем столбце. Этот элемент Ci 0, j 0 = v называется ценой игры, а сама игра называется игрой с седловой точкой.
Пример. Рассмотрим игру с платежной матрицей:
α=β=v= 26 Проверим, есть ли у этой матрицы седловая точка. Для этого в каждой строке выберем минимальный элемент (и запишем в последний столбец таблицы), а в каждом столбце выберем максимальный элемент (и запишем в последнюю строку таблицы). Затем находим нижнюю и верхнюю цену игры, для этого выбираем максимальный элемент в последнем столбце и минимальный элемент в последней строке. Получим: , то есть верхняя и нижняя цены равны. Платежная матрица имеет седловую точку: C 1,3. Следовательно, пара стратегий (A 1, B 3) является оптимальной и цена игры равна 26. Это и есть решение данной игры. Действительно, если игрок A будет придерживаться стратегии A 1, он выиграет не менее 26, а может выиграть и больше, если игрок B отклонится от своей оптимальной стратегии B 3.
Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.004 сек.) |