Авто Автоматизация Архитектура Астрономия Аудит Биология Бухгалтерия Военное дело Генетика География Геология Государство Дом Другое Журналистика и СМИ Изобретательство Иностранные языки Информатика Искусство История Компьютеры Кулинария Культура Лексикология Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлы и Сварка Механика Музыка Население Образование Охрана безопасности жизни Охрана Труда Педагогика Политика Право Приборостроение Программирование Производство Промышленность Психология Радио Регилия Связь Социология Спорт Стандартизация Строительство Технологии Торговля Туризм Физика Физиология Философия Финансы Химия Хозяйство Ценнообразование Черчение Экология Эконометрика Экономика Электроника Юриспунденкция

Введем необходимые для дальнейшего понятия

Читайте также:

ГЛАВА III. ПОЗИЦИОННЫЕ ИГРЫ

В общих играх число игроков может быть больше двух, некоторые ходы возможно являются случайными, игроки могут иметь по несколько ходов, причем информация о прошедшем может меняться от хода к ходу. Такие игры называются позиционными или играми в развернутой форме.

Введем необходимые для дальнейшего понятия.

1.Позиционные игры- это класс бескоалиционных игр, в которых принятие игроками решений (т. е. выбор ими стратегий) рассматривается как многошаговый или непрерывный процесс, то есть при принятии решений игрок проходит последовательно состояния, в каждом из которых ему приходится принимать частичное решение.

2. Нормализация игры — процесс сведения позиционной игры к матричной игре.

3. Позиционная многоходовая игра является теоретико-игровой моделью конфликтной ситуации, в которой противники для достижения своих целей последовательно делают по одному выбору (ходу) из конечного числа возможных способов действий на каждом этапе развития этой ситуации.

4. Переходы игрока из одного информационного состояния в другое могут сопровождаться получением или утратой им информации об уже имевших место информационных состояниях (как самого игрока, так и других игроков) и выбиравшихся в них альтернативах. Информация игрока о самом себе (т. е. о собственных бывших состояниях и альтернативах) называется его памятью..

Игрок имеет в игре полную память, если при каждом его ходе он помнит, в каких информационных множествах он уже побывал к этому моменту, и какие ходы он там делал. Фактически это определение означает наличие полной информации игрока о самом себе.

И.5. Теорема Куна. Для того чтобы смешанная стратегия i игрока i была эквивалентна его соответствующей стратегии поведения i необходимо и достаточно, чтобы игрок i имел в игре полную память.

И.6. Позиционные игры с конечным числом информационных состояний это игра с полной информацией (т. е. в любой её момент каждый игрок знает все бывшие информационные состояния и сделанные в них выборы), В таких играх имеются ситуации равновесия в чистых стратегиях, т. е. без обращения к смешанным стратегиям. Таким образом игра с полной информацией это позиционная игра, все информационные множества которой состоят из одной позиции.

Теорема (Цермело–Нейман) Конечные игры n лиц с полной информацией имеют ситуации равновесия в чистых стратегиях.

7.Игра в позиционной форме предусматривает принятие решений в каждой (реализующейся в ходе конкретной партии) позиции. Однако каждая сторона может заблаговременно составить свой план ведения игры, предусматривающий, какое решение должно быть выбрано на каждом ходе (если развитие игры приведет в позицию, соответствующую этому ходу). Принятие такого плана сводит многократные выборы решений в ходе игры к единственному выбору (т.е. к выбору плана, определяющего решения во всех позициях данной стороны). Такие планы называются стратегиями сторон в позиционной игре.

8. Позиционные игры удобно задавать графически в виде дерева игры (рис.3.1.). Дерево состоит из вершин, соединенных между собой ветвями. Вершины дерева называют еще позициями игры, а его ветви – ходами игрока.

Рис. 3.1.

Основными свойствами дерева игры являются:

* дерево содержит одну единственную начальную вершину (“корень” дерева), в которую не входит ни одна ветвь;

* дерево имеет не менее одной вершины, из которой не выходит ни одна ветвь. Эти вершины называются конечными вершинами;

* из корня дерева имеется единственный путь к каждой из остальных вершин дерева.

Вершина соответствует определенному состоянию игры перед очередным ходом. Каждую вершину занимает только один игрок, и ей присваивается номер, равный номеру игрока, который делает выбор.

Вершины, соответствующие случайным ходам, обозначают номером 0. Ветви, выходящие из вершины, изображают выборы, которые могут быть сделаны игроком при данном ходе. Вероятности выполнения случайного хода записывают у соответствующих ветвей. Возле конечных вершин дерева указываются исходы игры – значения выигрыша игроков (а в антагонистических играх – выигрыш первого игрока).

Партия начинается с корня (нижней вершины). Каждый ход есть изменение позиции, соответствующее перемещению из одной вершины на какую-нибудь из примыкающих верхних вершин. Число ветвей у вершины равно числу вариантов хода. Партия заканчивается при достижении одной из конечных вершин. Величина называется длиной дерева.

В зависимости от выбора игроков возможно столько различных партий игры, сколько конечных вершин у дерева.

Очевидно, если в игре нет случайных ходов, и каждый из игроков выбрал свою стратегию, то исход игры однозначно определен. Для игры со случайными ходами, результат партии становится случайной величиной, поэтому необходимо случайные выигрыши заменить их математическими ожиданиями. Как совокупность всех решений, которые должен принять игрок, можно описать как одно решение – выбор стратегии, так и совокупность случайных ходов, может быть заменена одним случайным испытанием Н.

В рассматриваемом примере (рис.3.2) случайное испытание Н может иметь следующие исходы:

Н=|(Г,3),(Г,2),(Р,3),(Р,2)|, с вероятностями , где Г – означает выпадение “герба”, Р – “решки”, а цифры 2, 3 соответствуют случайному выбору на четвертом ходу.

Игра, полученная путем усреднения случайных исходов, не полностью эквивалентна исходной игре, так как она характеризует не частный результат отдельной партии, а средние исходы большого числа партий.

Информация, доступная игрокам задается информационным разбиением вершин на множества V _i, называемые классами информации или информационными множествами. Если достигнута вершина v ÎV _i, то игроку, который должен ходить, указывается только класс информации, а не точное положение вершины v. Таким образом, в классы информации могут входить несколько вершин, неразличимых игроком, делающим выбор на данном ходе, т.е. игрок не в состоянии различить, какой из нескольких вершин соответствует состояние игры в данный момент времени.

В рассматриваемом примере класс информации V ₁ состоит из двух вершин. В том случае, когда всякий класс информации содержит только одну вершину, имеем игру с полной информацией (например, игра в шахматы). В играх с неполной информацией содержится хотя бы один класс информации с числом вершин не менее двух.

При вычерчивании дерева игры классы информации обводят замкнутой линией.

Игрок всегда знает, какому классу информации соответствует состояние игры в данный момент, но не знает конкретной вершины этого класса.

Классы информации (информационные множества) должны удовлетворять следующим условиям:

1. содержать вершины только одного игрока;

2. каждая вершина может принадлежать только одному классу информации;

3. вершины класса информации соответствуют только одному временному ходу;

4. из всех вершин, составляющих класс информации, может выходить только одинаковое количество ветвей.

Дерево, изображенное на рис.3.2., соответствует следующей игре:

Первый игрок выбирает одно из двух направлений (“налево” или “направо”). Ход “налево” оценивается тремя баллами, а “направо” – четырьмя. Затем бросается жребий (монета) и, если выпадает герб, второму игроку сообщается предыдущий выбор первого игрока. Если выпадает решка, то второй игрок знает лишь, что он находится в классе информации V ₁, но не знает, в какой из двух вершин этого класса он находится.

Второй игрок выбирает одно из двух направлений (“налево” или “направо”). Ход “налево” оценивается пятью баллами, а “направо” – двумя. Четвертый ход является опять случайным и состоит в выборе с равными вероятностями одного из направлений: “налево”, “направо”, которые оцениваются тремя и двумя баллами соответственно. Поскольку вероятности выбора направления при случайном ходе одинаковы (равны ), то их можно на графическом изображении дерева игры и не указывать.

Числа, выбранные в первом, третьем и четвертом ходах, складываются, и полученная сумма уплачивается вторым игроком первому, если она четная, в противном случае первый игрок платит второму.

Пространства Ф₁ и Ф₂ всех возможных стратегий игроков 1 и 2 в рассматриваемом примере следующие:

Ф₁=|(3), (4)|;

Ф₂=|(3,Г,5),(3,Г,2),(3,Р,5),(3,Р,2),(4,Г,5),(4,Г,2),(4,Р,5),(4,Р,2)|,

где первое число каждой стратегии в пространстве Ф₂ соответствует выбору первого игрока, второе число – выпаданию герба или решки (“Г” – выпал “герб”; “Р” – выпала “решка”). Третья – выбору второго игрока пятерки или двойки.

Очевидно, что если в игре нет случайных ходов и каждый из игроков выбрал свою стратегию, то исход игры однозначно определен.

1 | 2 | 3 |

Поиск по сайту:

Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.005 сек.)

Главная | О проекте | Полезные cсылки | Контакты | Случайная страница