|
||||||||||||||||||||||||||
|
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Конечные игры и их решение как задачи линейного программирования
Пусть имеется игра m x n без седловой точки с матрицей (aij):
Допустим, что все выигрыши aij положительны (этого всегда можно добиться, прибавляя ко всем членам матрицы достаточно большое число М. От этого цена игры увеличится на М, а решение SA и SB не изменится). Если все aij положительны, то и цена игры, т.е. средний выигрыш при оптимальной стратегии, тоже положителен: v>0. Мы хотим найти решение игры, т. е. две оптимальные смешанные стратегии SA = (p1, p2, …, pm) и SB = (q1, q2, …, qn) дающие каждой стороне максимально возможный для нее средний выигрыш (минимальный проигрыш). Найдем сначала SA. Мы знаем, что если один из игроков (в данном случае это А)применяет свою оптимальную стратегию, то другой (B) не может улучшить свое положение, отступая от своей. Заставим противника (В)отступать от своей оптимальной стратегии, пользуясь чистыми стратегиями В1, В2,..., Вп (а мы тем временем упорно держимся стратегии SA). В любом случае наш выигрыш будет не меньше, чем v:
Разделим неравенства на положительную величину v и введем обозначения:
Тогда условия примут вид:
где
Таким образом, задача решения игры тХп свелась к задаче линейного программирования с п ограничениями-неравенствами и т переменными. Зная Оптимальная стратегия игрока В находится совершенно аналогично, с той разницей, что В стремится минизировать, а не максимизировать выигрыш, а значит, обратить не в минимум, а в максимум величину Пара задач линейного программирования, по которой находятся оптимальные стратегии SA и SВ, называется парой двойственных задач линейного программирования (доказано, что максимум линейной функции в одной из них равен минимуму линейной функции в другой, так что все в порядке — разных значений цены игры мы не получим). Таким образом, решение игры тХп эквивалентно решению задачи линейного программирования. Нужно заметить, что и наоборот,— для любой задачи линейного программирования может быть построена эквивалентная ей задача теории игр. Эта связь задач теории игр с задачами линейного программирования оказывается полезной не только для теории игр, но и для линейного программирования. Дело в том, что существуют приближенные численные методы решения игр, которые в некоторых случаях (при большой размерности задачи) оказываются проще, чем «классические» методы линейного программирования. Поиск по сайту: |
|||||||||||||||||||||||||
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.149 сек.) |