АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Обобщенный критерий пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами для смешанных стратегий

Читайте также:
  1. T - критерий Стьюдента
  2. Автокорреляция в остатках. Критерий Дарбина-Уотсона
  3. Автокорреляция в остатках. Критерий Дарбина-Уотсона
  4. Автокорреляция в остатках. Критерий Дарбина-Уотсона
  5. Автокорреляция в остатках. Критерий Дарбина-Уотсона в оценке качества уравнений, построенных по временным рядам.
  6. Автокорреляция остатков. Критерий Дарбина- Уотсона
  7. В. Пространство и время в общей теории относительности (ОТО)
  8. Величины относительно ее математического ожидания.
  9. Вероятностная интерпретация коэффициентов критерия Гурвица.
  10. Виды стратегий осуществления изменений.
  11. Все относительно. Александра Агеева
  12. Выводы относительно коллективного поведения

Пусть числа удовлетворяют условиям (1.1).

Если игрок A придерживается смешанной стратегии P=(p1,.., pm), то при состоянии природы Пj вероятность выигрыша aij совпадает с вероятностью pi выбора чистой стратегии Ai в этой смешанной стратегии. Таким образом, выигрыш игрока A при выборе им смешанной стратегии P=(p1,.., pm) и при состоянии природы Пj представляет собой дискретную случайную величину, принимающую значения aij соответственно с вероятностями pi, i=1,.., m, Тогда средневзвешенные выигрыши игрока A при смешанной стратегии P=(p1,.., pm) и при каждом состоянии природы Пj, j=1,.., n, вычисляемые как математические ожидания соответствующих случайных величин, образуют следующую строку:

(2.1)

Переставляя выигрыши строки (2.1) внеубывающем порядке, получим строку

(2.2)

где — перестановка чисел 1,2,..., n, зависящая, очевидно, от смешанной стратегии P=(p1,.., pm). Вообще говоря, для некоторых номеров j { 1,..,n } возможно равенство , т.е.

Поставив каждой смешанной стратегии P=(p1,.., pm) в соответствие (единственное) число

(2.3)

мы получим числовую функцию векторного аргумента, определенную формулой (2.3) на множестве SAвсех смешанных стратегий игрока A. Числа в формуле (2.3) являются параметрами. Функцию (2.3) назовем функцией эффективности смешанных стратегий G(P), а значение этой функции на смешанной стратегии Pпоказателем эффективности смешанной стратегии P.

Рассмотрим сужение G | функции G на множество = {A1, A2,...Am } чистых стратегий игрока A. Для чистой стратегии

имеем

и строка (2.1) превращается в k -юстроку матрицы A

,

строка (2.2) — в неубывающуюперестановку k -й строки матрицы A

,

а (2.3) — в показатель эффективности стратегии Ak по обобщенному критерию Гурвица с коэффициентами ([7], см. также [6, 10]). Таким образом, сужение G | функции G на множество

Пусть S — произвольное непустое подмножество множества S A смешанных стратегий игрока A.

Функция G(P) ограничена сверху намножестве S A. Действительно, если

— наибольший элемент матрицы A, то для любого P SA, в силу (2.3), (2.2), (1.2) и (1.1), будем иметь

Аналогичным образом устанавливаетсяограниченность функции G(P) и снизу намножестве S Aнаименьшим элементомматрицы A.

Поскольку функция G(P) ограниченасверху на всем множестве S A, то онаограничена сверху и на любом его подмножестве S. Следовательно, на каждом подмножестве S существует конечный супремум

(2.4)

который мы назовем ценой игры в стратегиях множества S. В частности, если множество S есть множество чистых стратегий игрока A, то G S представляет собой цену игры в чистых стратегиях. Если S совпадает с множеством S A всех смешанных стратегий, то G S есть цена игры в смешанных стратегиях.

Обобщенным критерием пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами назовем критерий, по которому оптимальной стратегией в множестве S считается стратегия PО, обладающая следующими двумя свойствами:

1) стратегия PО принадлежит множеству S: PО S;

2) показатель эффективности G(PО ) стратегии PО совпадает с ценой игры G S в стратегиях множества S:

G(PО)=GS (2.5)

Решением игры в стратегиях множества S назовемдвухэлементное множество {S0,G S}, вкотором элемент S0 — множество всехоптимальных стратегий в множестве S, а G S— цена игры в стратегиях множества S (см. (2.4)).

Частным решением игры в стратегияхмножества S назовем двухэлементное множество {P0,G S},элементами которого являются какая-нибудьоптимальная стратегия P0 в множестве S ицена игры GS в стратегиях множества S.

решение игры. Если множество S конечно, в частности если S есть множество чистых стратегий, то в нем всегда существует стратегия P0, удовлетворяющая равенству (2.5), т.е. стратегия, на которой функция эффективности G (P) достигает своего супремума G Sна множестве S (см. (2.4)). Таким образом, в конечном множестве S всегда существует оптимальная стратегия.

Если же множество S бесконечно, тосуществование в нем оптимальной стратегиитребует доказательства.

35. Выбор коэффициентов

Коэффициенты определенного в предыдущем пункте обобщенного критерия Гурвица предназначены для приближенного количественного выражения представления лица, принимающего решение, — игрока A о различной степени опасности, благоприятности или нейтральности обстановки, в которой он должен выбрать оптимальную стратегию.

Показателем пессимизма игрока A при выборе им оптимальной стратегии назовемчисло

(3.1)

где [ n/2 ] — целая часть числа n/2.

Показателем оптимизма игроканазовем число

(3.2)

Очевидно, что

Коэффициенты , удовлетворяющие условиям (1.1), выбираются игроком A субъективно из следующих соображений. Если он оценивает ситуацию, в которой предстоит принять решение, как опасную, то его поведение при выборе стратегии должно быть осторожным, осмотрительным, не претендующим на большие выигрыши. В этой ситуации игрок A проявляет больше пессимизма, чем оптимизма. Поэтому коэффициенты естественно выбирать таким образом, чтобы показатель пессимизма был больше показателя оптимизма. Если же игрок A считает ситуацию благоприятной, то целесообразный выбор коэффициентов должен быть таким, чтобы показатель оптимизма был больше показателя пессимизма . В случае, если игрок A не может определенно отдать предпочтение ни опасности, ни благоприятности ситуации, т.е. считает ее нейтральной, то естественно выбрать коэффициенты так, чтобы показатели пессимизма и оптимизма были бы равными, т.е. = = 0,5.

Таким образом, показатели пессимизма и оптимизма можно трактовать как количественные меры соответственно пессимизма и оптимизма игрока A при выборе им оптимальной стратегии, а общее значение = = 0,5 указывает как бы на его нейтральность.

В [7] (см. также [6, 10]) был предложен некоторый формализованный прием выбора коэффициентов , состоящий в следующем.

Как уже отмечалось в пункте 2, если P есть чистая стратегия, то строка (2.1) представляет собой строку матрицы A выигрышей игрока A при этой чистой стратегии, а строка (2.2) есть неубывающая перестановка этой строки матрицы A. Таким образом, выигрыши каждой строки матрицы A переставлены в неубывающем порядке. Обозначим элементы полученной матрицы через b ij, а саму матрицу — через B:

Пусть

, (3.3)

— сумма выигрышей, стоящих в j -мстолбце матрицы B;

, (3.4)

— арифметическое среднее выигрышей b ij, стоящих в j-м столбце матрицы B;

(3.5)

— сумма всех выигрышей матрицы B,или, что то же, сумма всех выигрышей матрицы A.

Поскольку каждая строка матрицы B является неубывающей последовательностью, то(см. (3.3))

и следовательно, см. (3.4))

(3.6)

В случае, когда игрок A оценивает ситуацию, в которой он выбирает стратегию, как опасную, то коэффициенты должны быть выбраны, как отмечалось выше, так, чтобы показатель пессимизма был больше показателя оптимизма . Это может быть достигнуто, например, выбором невозрастающей последовательности коэффициентов — в частности, по принципу невозрастания средних выигрышей, т.е. обратно пропорциональных средним выигрышам (3.4) (см. (3.6)):

(см. [7], а также [6, 10]). В этом случае можнодоказать (см. [7], а также [6, 10]), что

, (3.7)

где bn-j+1 и b определяются соответственно по формулам (3.3) и(3.5).

Если же игрок A при выборе стратегии преисполнен оптимизма был больше показателя оптимизма, то показатель оптимизма должен быть больше показателя пессимизма , что может быть реализовано выбором неубывающей последовательности коэффициентов — например, по принципу неубывания средних выигрышей (см. [7], а также [6, 10]), т. е. прямо пропорционально средним выигрышам (3.4):

В этом случае (см. [7], а также [6, 10])справедлива формула

,

где bj и b определяютсясоответственно по формулам (3.3) и (3.5).


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.007 сек.)