|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Основная теорема антагонистических игр Джона фон Неймана и седловая точка функции выигрышаКаждая конечная игра имеет, по крайней мере, одно решение, возможно, в области смешанных стратегий. Применение оптимальной стратегии позволяет получить выигрыш, равный цене игры: Применение первым игроком оптимальной стратегии Аналогично для второго игрока оптимальная стратегия Если платежная матрица не содержит седловой точки, то задача определения смешанной стратегии тем сложнее, чем больше размерность матрицы. Поэтому матрицы большой размерности целесообразно упростить, уменьшив их размерность путем вычеркивания дублирующих (одинаковых) и не доминирующих стратегий. Если, то такая игра называется игрой с седловой точкой, элемент матрицы соответствующий паре оптимальных стратегий 15.Аналитическое решение игры 2×2 в смешанных стратегиях для игрока A. (из лекции)
16.Аналитическое решение игры 2×2 в смешанных стратегияхдля игрока B. Первый случай. Решение игры 2х2 Рассмотрим игру ( Использование игроком А своей оптимальной стратегии гарантирует ему получение среднего выигрыша не меньшего, чем цена игры ν. При этом, если игрок В использует свою оптимальную стратегию, то средний выигрыш игрока будет равен ν, если игрок В не использует свою оптимальную стратегию, то средний выигрыш игрока А будет больше ν. Записанное выше положение имеет вероятностный смысл, т.е. средний выигрыш будет тем ближе к ν, чем больше партий сыграют игроки: средний выигрыш стремится к ν по вероятности (другими словами, средний выигрыш будет не точно равен ν, а при мерно равен и чем больше партий, тем меньше отклонение). Кроме того, определение смешанной стратегии требует выбирать чистые стратегии игроками случайно в соответствии с вероятностями (относительными частотами) их использования (условие секретности выбора чистой стратегии).
Для решения матричных игр ( Чтобы найти оптимальную смешанную стратегию игрока В:
Получим:
Цена игры
17. Геометрический метод нахождения цены игры 2×2 и оптимальных стратегий игрока A. В точках Рис. 3.1. Графическая интерпретация игры Изобразим стратегию Каждой точке на отрезке [0; 1] соответствует смешанная стратегия игрока А, причем Ломанная если Таким образом, задача сводится к нахождению координат точки с учетом того, что прямую 18.Геометрический метод нахождения цены игры 2×2 и оптимальных стратегий игрока B. Для игрока В оптимальная смешанная стратегия находится аналогично, но точка М определяется не самой высокой точкой нижней ломанной, а самой низкой точкой высокой ломанной – полужирная ломанная на рис. 3.2. Рис. 3.2. Графическая интерпретация игры Найдя координаты точки
19.Геометрический метод нахождения цены игры 2× n и оптимальных стратегий игрока A. В парной игре у каждого противника есть определенный набор стратегий. Назовем их условно для первого игрока: А1, А2; для второго игрока: В1, В2,…Вn (n количество стратегий игрока B – игра 2 × n). В результате выбора игроками любой пары стратегий А(i) и B(j) однозначно определяется исход игры – выигрыш a(i,j) игрока А (положительный или отрицательный) и проигрыш –a(i,j) игрока В. Значения a(i,j) известны для любой пары стратегий А(i), B(j). На основе этих данных можно построить платежную матрицу (матрицу игры), элементами которой являются выигрыши. Строки таблицы соответствуют стратегиям игрока A, столбцы – стратегиям игрока В. При решении данной задачи необходимо определить то, с какими вероятностями игрок А будет выбирать свои стратегии (А1 и А2), при оптимальном решении. Оптимальным для игрока А будет являться такое решение, при котором он получит максимальный выигрыш. Обозначим вероятность выбора первой стратегии для первого игрока p1 и p2 соответственно для второй стратегии. В декартовой системе координат на оси абсцисс отложим единичный отрезок A1 A2. Точка A1(х=0) изображает стратегию A1, а все промежуточные точки этого отрезка — смешанные стратегии SA первого игрока, причем расстояние от SA до правого конца отрезка — это вероятность p1 стратегии A1, расстояние до левого конца — вероятность p2 стратегии A2. По оси ординат будет откладываться цена игры. На перпендикулярах к отрезку А1А2 в точках 0 и 1 отложим выигрыши при стратегиях А1 и А2 соответственно. Соединим значения выигрышей игрока А при различных стратегиях игрока В (a1j1 – a2j1 и т. Д.). Найдем нижнюю огибающую (линию, проходящую через минимальные выигрыши игрока А при каждой смешанной стратегии). Точка N будет являться максимальным гарантированным выигрышем игрока А, а следовательно, смешанная стратегия игрока А в этой точке будет оптимальной. Опустим перпендикуляр из точки N на ось абсцисс, чтобы найти вероятности стратегий А1 и А2, а также на ось ординат, чтобы найти значение выигрыша.
20.Геометрический метод нахождения цены игры m ×2 и оптимальных стратегий игрока B. В парной игре у каждого противника есть определенный набор стратегий. Назовем их условно для первого игрока: А1, А2,…Аm; для второго игрока: В1, В2 (m, n количество стратегий игроков – игра m × 2). В результате выбора игроками любой пары стратегий А(i) и B(j) однозначно определяется исход игры – выигрыш a(i,j) игрока А (положительный или отрицательный) и проигрыш -a(i,j) игрока В. Значения a(i,j) известны для любой пары стратегий А(i), B(j). На основе этих данных можно построить платежную матрицу (матрицу игры), элементами которой являются выигрыши. Строки таблицы соответствуют стратегиям игрока A, столбцы – стратегиям игрока В. При решении данной задачи необходимо определить то, с какими вероятностями игрок В будет выбирать свои стратегии (В1 и В2), при оптимальном решении. Оптимальным решением для игрока В,в этом случае, будет являться такое решение, при котором он понесет минимальные потери. Обозначим вероятность выбора первой стратегии для первого игрока q1 и q2 соответственно для второй стратегии. В декартовой системе координат на оси абсцисс отложим единичный отрезок B1 B2. Точка B1(х=0) изображает стратегию B1, а все промежуточные точки этого отрезка — смешанные стратегии SB первого игрока, причем расстояние от SB до правого конца отрезка — это вероятность q1 стратегии B1, расстояние до левого конца — вероятность q2 стратегии B2. По оси ординат будет откладываться цена игры. На перпендикулярах к отрезку B1B2 в точках 0 и 1 отложим выигрыши при стратегиях B1 и B2 соответственно. Соединим значения выигрышей игрока B при различных стратегиях игрока A (ai11 – ai12 и т. д.). Найдем верхнюю огибающую (линию, проходящую через максимальные проигрыши игрока B при выборе каждой смешанной стратегии). Точка M будет являться минимальным гарантированным проигрышем игрока B, а следовательно, смешанная стратегия игрока B в этой точке будет оптимальной. Опустим перпендикуляр из точки M на ось абсцисс, чтобы найти вероятности стратегий B1 и B2, а также на ось ординат, чтобы найти значение выигрыша. 21. Доминирование смешанных стратегий для игрока A. Стратегия игрока, состоящая в случайном выборе одной из его чистых стратегий, называется смешанной стратегией. Таким образом, смешанная стратегия игрока представляет собой дискретную случайную величину, значениями которой являются номера его чистых стратегий.
где pi ≥ 0 - вероятность применения игроком А чистой стратегии Ai, и p1 +...+ pi +...+ рт = 1, как сумма вероятностей несовместных событий (состоящих в выборе одной из чистых стратегий) полной группы, а смешанная стратегия Q характеризуется законом распределения
где qj ≥ 0 - вероятность выбора игроком В чистой стратегии Bj, q1 +...+ qj +...+ qn = 1. Один из способов упрощения игр основывается на принципе доминирования, который позволяет в некоторых случаях игру с матрицей А свести к эквивалентной игре с матрицей меньшего размера.
Между множеством строк ( из которого ясно, что, в частности, каждой чистой стратегии Если для двух выпуклых комбинаций строк матрицы А и выполняются неравенства то говорят, что строка (2) доминирует строку (1), а строка (1) доминирует строкой (2). Если каждое неравенство (3) является равенством, то строки (1) и (2) называют дублирующими. Если же каждое неравенство (3) является строгим, то говорят, что строка (2) строго доминирует строку (1), а строка (1) строго доминируется строкой (2). Аналогичная терминология используется и для соответствующих стратегий игрока А. А именно, если строка (2) доминирует, соответственно дублирует, соответственно строго доминирует строку (1), то говорят, что стратегия Таким образом, по данным определениям и для игрока А, предпочтительными оказываются доминирующие стратегии. 22. Доминирование смешанных стратегий для игрока B. Стратегия игрока, состоящая в случайном выборе одной из его чистых стратегий, называется смешанной стратегией. Таким образом, смешанная стратегия игрока представляет собой дискретную случайную величину, значениями которой являются номера его чистых стратегий.
где pi ≥ 0 - вероятность применения игроком А чистой стратегии Ai, и p1 +...+ pi +...+ рт = 1, как сумма вероятностей несовместных событий (состоящих в выборе одной из чистых стратегий) полной группы, а смешанная стратегия Q характеризуется законом распределения
где qj ≥ 0 - вероятность выбора игроком В чистой стратегии Bj, q1 +...+ qj +...+ qn = 1.
Один из способов упрощения игр основывается на принципе доминирования, который позволяет в некоторых случаях игру с матрицей А свести к эквивалентной игре с матрицей меньшего размера.
Между смешанными (в том числе и чистыми) стратегиями
столбцов проигрышей Н(
из которого видно, что, в частности, каждой чистой стратегии Если для двух выпуклых комбинаций столбцов матрицы А
и
выполняются неравенства то говорят, что столбец (4) (стратегия Таким образом, по данным определениям для игрока В предпочтительными оказываются доминирующие стратегии. 23. Решение матричной игры m×n сведением к задаче линейного программирования для игрока A.
Пусть дана матричная игра с матрицей А порядка m х n. Po=(p1o,p2o,…,pmo)
Если игрок А применяет любую смешанную стратегию P=(p1,p2,…,pm) против любой чистой стратегии Bj игрока В, то он получает выигрыш F(P,Bj)=a1jp1+a2jp2+…+anjpm, j=1,2,…,n
Разделим каждое неравенство на V>0 и введем x1=p1/v, x2=p2/v,…,xm=pm/v Разделив на V>0 равенство Получаем задачу линейного программирования для игрока А: x1+x2+…+xm->min(поскольку первый игрок стремится найти такие значения хi и, следовательно, pi, чтобы цена игры v была максимальной) Po=(p1o=x1o*V, p2o=x2o*V,…,pmo=xmo*V) 24. Решение матричной игры m×n сведением к задаче линейного программирования для игрока B. Пусть дана матричная игра с матрицей А порядка m х n.
Qo=(q1o,q2o,…,qno) Если игрок В применяет любую смешанную стратегию Q=(q1,q2,…,qm) против любой чистой стратегии Ai игрока A, то он получает проигрыш F(P,Bj)=a1jq1+a2jq2+…+anjqm, j=1,2,…,n
Разделим каждое неравенство на V>0 и введем y1=q1/v, y2=q2/v,…,ym=qm/v Разделив на V>0 равенство Получаем задачу линейного программирования для игрока В: y1+y2+…+ym->max (поскольку второй игрок стремится найти такие значения yj и, следовательно, qj, чтобы цена игры v была наименьшей) Qo=(q1o=y1o*V, q2o=y2o*V,…,qmo=ymo*V) 25. Основные понятия и определения теории игр с природой. Во многих задачах финансово-экономической сферы принятие решения осложняется наличием неопределенности, заключающейся в неполноте информации об окружающей среде. Такую неопределенность могут порождать различные причины. Это могут быть действительные природные физические (климатические), биологические, химические, социальные и другие процессы, которые сопровождают экономическую деятельность, политика гос-ва и др. Поэтому в таких задачах принятие решения зависит от реальных условий, которые называют в соответствующей математической модели «природой». Саму же модель называют «игрой с природой». «Природа» может выступать как антагонистическая сторона, а может как кооперативная среда. Игру с природой можно определить как парную игру, в которой сознательный игрок А, заинтересованный в наиболее выгодном для него исходе игры, выступает против участника, совершенно безразличного к результату – природа (обозначим его П). Очевидно, что при решении игр с природой достаточно найти наилучшие рекомендации только для игрока А, потому как природа в рекомендациях не нуждается, развиваясь в соответствии с определенными законами независимо от того, удобно это человеку или нет. В любой момент времени природа П может находиться только в одном (но неизвестно, в каком) из n состояний П 1, П 2, …, Пn, то есть состояния природы разделены между собой во времени. Совокупность Для описания игры с природой необходимо также множество стратегий игрока A: Результаты реализации стратегий при различных состояниях природы могут быть описаны матрицей V:
Будем предполагать, что в платёжной матрице игры представлены выигрыши лица, принимающего решения. Показателем благоприятности состояния Риском Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.026 сек.) |