Авто Автоматизация Архитектура Астрономия Аудит Биология Бухгалтерия Военное дело Генетика География Геология Государство Дом Другое Журналистика и СМИ Изобретательство Иностранные языки Информатика Искусство История Компьютеры Кулинария Культура Лексикология Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлы и Сварка Механика Музыка Население Образование Охрана безопасности жизни Охрана Труда Педагогика Политика Право Приборостроение Программирование Производство Промышленность Психология Радио Регилия Связь Социология Спорт Стандартизация Строительство Технологии Торговля Туризм Физика Физиология Философия Финансы Химия Хозяйство Ценнообразование Черчение Экология Эконометрика Экономика Электроника Юриспунденкция

Смешанные стратегии. Функция выигрыша и цена игры в смешанных стратегиях

Читайте также:

Стратегия игрока, состоящая в случайном выборе одной из его чистых стратегий, называется смешанной стратегией. Это дискретную случайную величину, значениями которой являются номера его чистых стратегий.

Р и Q - смешанные стратегии игроков А и В. Таким образом, смешанная стратегия Р(Q) задается законом распределения

	…	i	…	m
p1	…	pi	…	pm

где pi ≥ 0 (qj ≥ 0) - вероятность применения игроком А (B) чистой стратегии Ai (Bj), и p1 +...+ pi +...+ рт = 1 (так же для q).

Смешанную стратегию Р можно отождествить с m-мерным вектором (p1,..., рт), т. е.

То же относится и к В: p меняем на q, i меняем на j

Обозначим через

--- множество всех смешанных стратегий игрока А Каждую чистую стратегию Ai, i = 1,..., m, игрока A можно рассматривать как смешанную стратегию в которой чистая стратегия Ai выбирается с вероятностью pi = 1, а все остальные чистые стратегии - с 0. Поэтому конечное множество , состоящее из т чистых стратегий игрока А, является собственным (при т ≥ 2) подмножеством бесконечного множества его смешанных стратегий SA:

каждую смешанную стратегию можно представить линейной комбинацией чистых стратегий с коэффициентами, являющимися координатами данной смешанной стратегии:

Функция выигрыша игрока А в смешанных стратегиях, заданная на декартовом произведении множеств смешанных стратегий, ставит в соответствие каждой ситуации в смешанных стратегиях средний выигрыш игрока А, определяемый выражением:

Таким образом,à ,

где

Матричная форма выигрыш-функции:

Нижней ценой (или максимином) матричной игры в смешанных стратегиях называется

Верхней ценой (или минимаксом):

Для любой конечной матричной игры существуют нижняя и верхняя цены игры в смешанных стратегиях.

Смешанная стратегия PО SA, максимизирующая показатель эффективности α(Р) - максиминная смешанная стратегия игрока А, а нижняя цена игры показатель t` эффективности:

В частном случае PО = является максиминной чистой стратегией игрока A.

Аналогично, смешанная стратегия QО SB, минимизирующая показатель неэффективности β(Q), назовем минимаксной смешанной стратегией игрока В. Показатель неэффективности минимаксной смешанной стратегии QО равен верхней цене игры :

Если QО = то - минимаксная чистая стратегия.

13. Теорема о соотношении нижней и верхней цен игры в чистых и смешанных стратегиях.

Теорема. Нижняя цена игрыαи верхняя цена игрыβв чистых стратегиях, нижняя цена игры и верхняя цена игры в смешанных стратегиях удовлетворяют следующим неравенствам:

Доказательство. Начнем доказательство с левого неравенства (1).

По определению:

нижней цены в смешанных стратегиях

Здесь правая часть не зависит от Р и потому это неравенство остается верным и для Р = , i= 1,..., m:

Так как полученное неравенство справедливо для всех i= 1,..., m, то оно будет справедливым в частности для того номера i, который максимизирует показатель эффективности :

Итак, первое из неравенств (1) доказано.

Докажем второе неравенство ≤ в (1). Для любых Р и Q по

имеем

Соотношение (2) означает, что в любой ситуации в смешанных стратегиях (Р,Q) выигрыш H (P, Q)игрока A не меньше показателя эффективности α(P)его стратегии Р и не больше показателя неэффективности стратегии Q противника В.

Так как (2) справедливо для любых Р и Q , то из него следует, что

Докажем последнее (правое) из неравенств (1). В силу определения

верхней цены игры в смешанных стратегиях

В частности, это неравенство справедливо и для чистых стратегий Q = ,j = 1,..., n, игрока В

и, следовательно, неравенство остается в силе и для того номера j,который минимизирует показатель неэффективности β() стратегии , т.е.

Итак, (1) доказано.

1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 |

Поиск по сайту:

Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.469 сек.)

Главная | О проекте | Полезные cсылки | Контакты | Случайная страница