|
|||||||||||||||||||||||||||||||||||||||||||||||||||
|
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Игры без седловых точек
Рассмотри игру заяц – контролер:
α =max(-25;-1,1)=-1,1
α = -1,1; β = 0 Седловой точки нет. Рассмотрим игру, заданную платежной матрицей:
α=max(-1;1)=1=> A 2.
β = min(3; 5) = 3 => B 1. α ≠ β, применение своей максиминной стратегии гарантирует игроку выигрыш: α = 1, а применение своей минимаксной стратегии гарантирует игроку проигрыш: β = 3. Естественно, что в данной ситуации игрок A хотел бы выиграть больше чем 1, а игрок B проиграть меньше чем 3. например, того и другого одновременно устроило бы значение выигрыша и проигрыша равного соответственно 2. Так как применение любой чистой стратегии не дает возможность повысить средний выигрыш, то следует использовать более сложную, смешанную стратегию, которая содержит чистые стратегии в качестве элементов. В одноходовой игре, каждый игрок использует только одну стратегию, поэтому, смешанная стратегия имеет смысл при многократном повторении игры. Каждая стратегия используется в смешанной со своей относительной частотой. Если частота не равна нулю, то стратегия называется активной, ее игрок использует; если частота равна нулю, то фактически этой стратегией игрок не пользуется. Рассмотрим игру, в которой у игрока A имеется m стратегий Ai, у B – n стратегий Bj с платежной матрицей Смешанные стратегии
где xi – это вероятность (частота), с которой игрок A применяет чистую стратегию Ai, а yj – вероятность (частота), с которой игрок B применяет чистую стратегию Bj. Средний выигрыш игрока A при этом будет определятся, как математическое ожидание его выигрышей:
Цель игрока A –увеличение своего выигрыша за счет применения своей смешанной стратегии при наилучшей игре игрока B, цель которого уменьшение своего проигрыша. Таким образом, для решения игры надо найти такие Нижняя цена игры: Верхняя цена игры: И оптимальными будут такие стратегии α=β=v, то есть v = Число v = Основная теорема теории игры, доказанная Нейманом утверждает, что каждая матричная игра с нулевой суммой имеет оптимальные смешанные стратегии. Теорема Неймана: Каждая конечная игра имеет по крайней мере одно оптимальное решение, возможно среди смешанных стратегий. Пусть Справедлива теорема об активных стратегиях. Теорема. Если один из игроков придерживается своей оптимальной стратегии, то выигрыш остается неизменным и равным цене игры V, если второй игрок не выходит за пределы своих активных стратегий. Эта теорема имеет большое значение, так как дает конкретные модели нахождения оптимальных стратегий при отсутствии седловой точки. Рассмотрим игру 2×2, – простейший случай конечной игры. Если игра имеет седловую точку, то оптимальное решение – это пара чистых стратегий. Пусть седловой точки нет, тогда существует пара оптимальных смешанных стратегий: Выигрыш игрока А (проигрыш игрока В) – случайная величина, математическое ожидание которой и есть цена игры. Поэтому средний выигрыш игрока А будет равен V и для 1-й, и для 2-й чистых стратегий игрока В. Пусть платежная матрица имеет вид: Решив эту систему, получим:
и цена игры: Применяя теорему об активных стратегиях при нахождении оптимальной стратегии игрока В, получаем, что при любой чистой стратегии игрока А (А 1 или А 2) средний проигрыш игрока В равен цене игры: Решив эту систему, получим:
Эти значения и определяют оптимально-смешаную стратегию игрока В.
Пример: Рассмотрим игру «Поиск». Игрок А может спрятаться в одном из убежищ I или II. Игрок В ищет игрока А и если найдет, то получает штраф от игрока А в 1 ден.ед., в противном случае платит игроку А 1 ден.ед. построить платежную матрицу и найти цену игры. Решение. У игрока А две стратегии: А 1 – спрятаться в убежище I; А 2 – спрятаться в убежище II. У игрока В тоже две стратегии: В 1 – искать в убежище I; В 2 – искать в убежище II. Платежная матрица имеет вид:
Найдем решение в смешанных стратегиях:
Решив системы, найдем: Вывод: каждое из убежищ выбирается с вероятностью Поиск по сайту: |
||||||||||||||||||||||||||||||||||||||||||||||||||
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.092 сек.) |