|
|||||||||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Смешанные стратегии. Функция выигрыша и цена игры в смешанных стратегияхСтратегия игрока, состоящая в случайном выборе одной из его чистых стратегий, называется смешанной стратегией. Это дискретную случайную величину, значениями которой являются номера его чистых стратегий.
где pi ≥ 0 (qj ≥ 0) - вероятность применения игроком А (B) чистой стратегии Ai (Bj), и p1 +...+ pi +...+ рт = 1 (так же для q). Смешанную стратегию Р можно отождествить с m-мерным вектором (p1,..., рт), т. е. То же относится и к В: p меняем на q, i меняем на j Обозначим через --- множество всех смешанных стратегий игрока А Каждую чистую стратегию Ai, i = 1,..., m, игрока A можно рассматривать как смешанную стратегию в которой чистая стратегия Ai выбирается с вероятностью pi = 1, а все остальные чистые стратегии - с 0. Поэтому конечное множество , состоящее из т чистых стратегий игрока А, является собственным (при т ≥ 2) подмножеством бесконечного множества его смешанных стратегий SA: каждую смешанную стратегию можно представить линейной комбинацией чистых стратегий с коэффициентами, являющимися координатами данной смешанной стратегии: Функция выигрыша игрока А в смешанных стратегиях, заданная на декартовом произведении множеств смешанных стратегий, ставит в соответствие каждой ситуации в смешанных стратегиях средний выигрыш игрока А, определяемый выражением: Таким образом,à , где Матричная форма выигрыш-функции: Нижней ценой (или максимином) матричной игры в смешанных стратегиях называется Верхней ценой (или минимаксом): Для любой конечной матричной игры существуют нижняя и верхняя цены игры в смешанных стратегиях. Смешанная стратегия PО SA, максимизирующая показатель эффективности α(Р) - максиминная смешанная стратегия игрока А, а нижняя цена игры показатель t` эффективности: В частном случае PО = является максиминной чистой стратегией игрока A. Аналогично, смешанная стратегия QО SB, минимизирующая показатель неэффективности β(Q), назовем минимаксной смешанной стратегией игрока В. Показатель неэффективности минимаксной смешанной стратегии QО равен верхней цене игры : Если QО = то - минимаксная чистая стратегия. 13. Теорема о соотношении нижней и верхней цен игры в чистых и смешанных стратегиях. Теорема. Нижняя цена игрыαи верхняя цена игрыβв чистых стратегиях, нижняя цена игры и верхняя цена игры в смешанных стратегиях удовлетворяют следующим неравенствам: Доказательство. Начнем доказательство с левого неравенства (1). По определению: нижней цены в смешанных стратегиях Здесь правая часть не зависит от Р и потому это неравенство остается верным и для Р = , i= 1,..., m:
Так как полученное неравенство справедливо для всех i= 1,..., m, то оно будет справедливым в частности для того номера i, который максимизирует показатель эффективности : Итак, первое из неравенств (1) доказано.
Докажем второе неравенство ≤ в (1). Для любых Р и Q по и имеем Соотношение (2) означает, что в любой ситуации в смешанных стратегиях (Р,Q) выигрыш H (P, Q)игрока A не меньше показателя эффективности α(P)его стратегии Р и не больше показателя неэффективности стратегии Q противника В. Так как (2) справедливо для любых Р и Q , то из него следует, что Докажем последнее (правое) из неравенств (1). В силу определения верхней цены игры в смешанных стратегиях В частности, это неравенство справедливо и для чистых стратегий Q = ,j = 1,..., n, игрока В и, следовательно, неравенство остается в силе и для того номера j,который минимизирует показатель неэффективности β() стратегии , т.е. Итак, (1) доказано. Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.005 сек.) |