|
|||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Обобщенный критерий пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами для смешанных стратегийПусть числа удовлетворяют условиям (1.1). Если игрок A придерживается смешанной стратегии P=(p1,.., pm), то при состоянии природы Пj вероятность выигрыша aij совпадает с вероятностью pi выбора чистой стратегии Ai в этой смешанной стратегии. Таким образом, выигрыш игрока A при выборе им смешанной стратегии P=(p1,.., pm) и при состоянии природы Пj представляет собой дискретную случайную величину, принимающую значения aij соответственно с вероятностями pi, i=1,.., m, Тогда средневзвешенные выигрыши игрока A при смешанной стратегии P=(p1,.., pm) и при каждом состоянии природы Пj, j=1,.., n, вычисляемые как математические ожидания соответствующих случайных величин, образуют следующую строку: (2.1) Переставляя выигрыши строки (2.1) внеубывающем порядке, получим строку (2.2) где — перестановка чисел 1,2,..., n, зависящая, очевидно, от смешанной стратегии P=(p1,.., pm). Вообще говоря, для некоторых номеров j { 1,..,n } возможно равенство , т.е. Поставив каждой смешанной стратегии P=(p1,.., pm) в соответствие (единственное) число (2.3) мы получим числовую функцию векторного аргумента, определенную формулой (2.3) на множестве SAвсех смешанных стратегий игрока A. Числа в формуле (2.3) являются параметрами. Функцию (2.3) назовем функцией эффективности смешанных стратегий G(P), а значение этой функции на смешанной стратегии P — показателем эффективности смешанной стратегии P. Рассмотрим сужение G | функции G на множество = {A1, A2,...Am } чистых стратегий игрока A. Для чистой стратегии имеем и строка (2.1) превращается в k -юстроку матрицы A , строка (2.2) — в неубывающуюперестановку k -й строки матрицы A , а (2.3) — в показатель эффективности стратегии Ak по обобщенному критерию Гурвица с коэффициентами ([7], см. также [6, 10]). Таким образом, сужение G | функции G на множество Пусть S — произвольное непустое подмножество множества S A смешанных стратегий игрока A. Функция G(P) ограничена сверху намножестве S A. Действительно, если — наибольший элемент матрицы A, то для любого P SA, в силу (2.3), (2.2), (1.2) и (1.1), будем иметь Аналогичным образом устанавливаетсяограниченность функции G(P) и снизу намножестве S Aнаименьшим элементомматрицы A. Поскольку функция G(P) ограниченасверху на всем множестве S A, то онаограничена сверху и на любом его подмножестве S. Следовательно, на каждом подмножестве S существует конечный супремум (2.4) который мы назовем ценой игры в стратегиях множества S. В частности, если множество S есть множество чистых стратегий игрока A, то G S представляет собой цену игры в чистых стратегиях. Если S совпадает с множеством S A всех смешанных стратегий, то G S есть цена игры в смешанных стратегиях. Обобщенным критерием пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами назовем критерий, по которому оптимальной стратегией в множестве S считается стратегия PО, обладающая следующими двумя свойствами: 1) стратегия PО принадлежит множеству S: PО S; 2) показатель эффективности G(PО ) стратегии PО совпадает с ценой игры G S в стратегиях множества S: G(PО)=GS (2.5) Решением игры в стратегиях множества S назовемдвухэлементное множество {S0,G S}, вкотором элемент S0 — множество всехоптимальных стратегий в множестве S, а G S— цена игры в стратегиях множества S (см. (2.4)). Частным решением игры в стратегияхмножества S назовем двухэлементное множество {P0,G S},элементами которого являются какая-нибудьоптимальная стратегия P0 в множестве S ицена игры GS в стратегиях множества S. решение игры. Если множество S конечно, в частности если S есть множество чистых стратегий, то в нем всегда существует стратегия P0, удовлетворяющая равенству (2.5), т.е. стратегия, на которой функция эффективности G (P) достигает своего супремума G Sна множестве S (см. (2.4)). Таким образом, в конечном множестве S всегда существует оптимальная стратегия. Если же множество S бесконечно, тосуществование в нем оптимальной стратегиитребует доказательства. 35. Выбор коэффициентов Коэффициенты определенного в предыдущем пункте обобщенного критерия Гурвица предназначены для приближенного количественного выражения представления лица, принимающего решение, — игрока A о различной степени опасности, благоприятности или нейтральности обстановки, в которой он должен выбрать оптимальную стратегию. Показателем пессимизма игрока A при выборе им оптимальной стратегии назовемчисло (3.1) где [ n/2 ] — целая часть числа n/2. Показателем оптимизма игроканазовем число (3.2) Очевидно, что Коэффициенты , удовлетворяющие условиям (1.1), выбираются игроком A субъективно из следующих соображений. Если он оценивает ситуацию, в которой предстоит принять решение, как опасную, то его поведение при выборе стратегии должно быть осторожным, осмотрительным, не претендующим на большие выигрыши. В этой ситуации игрок A проявляет больше пессимизма, чем оптимизма. Поэтому коэффициенты естественно выбирать таким образом, чтобы показатель пессимизма был больше показателя оптимизма. Если же игрок A считает ситуацию благоприятной, то целесообразный выбор коэффициентов должен быть таким, чтобы показатель оптимизма был больше показателя пессимизма . В случае, если игрок A не может определенно отдать предпочтение ни опасности, ни благоприятности ситуации, т.е. считает ее нейтральной, то естественно выбрать коэффициенты так, чтобы показатели пессимизма и оптимизма были бы равными, т.е. = = 0,5. Таким образом, показатели пессимизма и оптимизма можно трактовать как количественные меры соответственно пессимизма и оптимизма игрока A при выборе им оптимальной стратегии, а общее значение = = 0,5 указывает как бы на его нейтральность. В [7] (см. также [6, 10]) был предложен некоторый формализованный прием выбора коэффициентов , состоящий в следующем. Как уже отмечалось в пункте 2, если P есть чистая стратегия, то строка (2.1) представляет собой строку матрицы A выигрышей игрока A при этой чистой стратегии, а строка (2.2) есть неубывающая перестановка этой строки матрицы A. Таким образом, выигрыши каждой строки матрицы A переставлены в неубывающем порядке. Обозначим элементы полученной матрицы через b ij, а саму матрицу — через B: Пусть , (3.3) — сумма выигрышей, стоящих в j -мстолбце матрицы B; , (3.4) — арифметическое среднее выигрышей b ij, стоящих в j-м столбце матрицы B; (3.5) — сумма всех выигрышей матрицы B,или, что то же, сумма всех выигрышей матрицы A. Поскольку каждая строка матрицы B является неубывающей последовательностью, то(см. (3.3)) и следовательно, см. (3.4)) (3.6) В случае, когда игрок A оценивает ситуацию, в которой он выбирает стратегию, как опасную, то коэффициенты должны быть выбраны, как отмечалось выше, так, чтобы показатель пессимизма был больше показателя оптимизма . Это может быть достигнуто, например, выбором невозрастающей последовательности коэффициентов — в частности, по принципу невозрастания средних выигрышей, т.е. обратно пропорциональных средним выигрышам (3.4) (см. (3.6)): (см. [7], а также [6, 10]). В этом случае можнодоказать (см. [7], а также [6, 10]), что , (3.7) где bn-j+1 и b определяются соответственно по формулам (3.3) и(3.5). Если же игрок A при выборе стратегии преисполнен оптимизма был больше показателя оптимизма, то показатель оптимизма должен быть больше показателя пессимизма , что может быть реализовано выбором неубывающей последовательности коэффициентов — например, по принципу неубывания средних выигрышей (см. [7], а также [6, 10]), т. е. прямо пропорционально средним выигрышам (3.4): В этом случае (см. [7], а также [6, 10])справедлива формула , где bj и b определяютсясоответственно по формулам (3.3) и (3.5). Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.007 сек.) |