АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Формализация принципов оптимального поведения в моделях принятия решения

Читайте также:
  1. F60-F69 Расстройства зрелой личности и поведения у взрослых
  2. I. Правила поведения в условиях вынужденного автономного существования.
  3. II Съезд Советов, его основные решения. Первые шаги новой государственной власти в России (октябрь 1917 - первая половина 1918 гг.)
  4. II. Правила безопасного поведения в ситуациях криминального характера.
  5. II. СВЕТСКИЙ УРОВЕНЬ МЕЖКУЛЬТУРНОЙ КОММУНИКАЦИИ ОТНОСИТЕЛЬНО ПРИНЦИПОВ ПОЛИТИЧЕСКОЙ СПРАВЕДЛИВОСТИ
  6. III. Определение оптимального уровня денежных средств.
  7. IV.2.2. Причины и факторы девиантного поведения школьников
  8. YIII.4.3.Формализация. Язык науки
  9. А) совокупность предусмотренных законодательством видов и ставок налога, принципов, форм и методов их установления.
  10. Авторитаризм — источник отклоняющегося поведения
  11. Аддиктивный тип девиантного поведения
  12. Алгоритм решения.

Под принципом оптимальности понимается та совокупность правил, при помощи которых ЛПР определяет свое действие (решение, альтернативу, стратегию, управленческое решение), наилучшим образом способствующее достижению поставленной им цели. Принцип оптимальности выбирается исходя из учета конкретных условий принятия решения: количества участников, их возможностей и целей, характера столкновения интересов (антагонизм, неантагонизм, кооперация и т.п.).

В моделях принятия решения, особенно в теории игр, разработано большое число формальных принципов оптимального поведения. Мы здесь остановимся лишь на некоторых из них.

Принцип максимизации (минимизации). Такой принцип применяется, восновном, в задачах математического программирования (см. (2) - (4)).

Принцип свертки критериев. Применяется при "оптимизации"' многих критериев одним координирующим центром (задача многокритериальной оптимизации (5)). Для каждого из критериев (целевых функций)

f1(u),...,fn(u)

экспертным путем назначаются "веса" (числа)

причем αi показывает "важность или значимость" критерия f. Далее решение x* из множества допустимых решений Х выбирается так, чтобы максимизировать (или минимизировать) свертку критериев:

Принцип лексикографического предпочтения. Это еще один принцип оптимальности в задачах многокритериальной оптимизации. Сначала критерии ранжируются по "важности". Пусть такая ранжировка составлена:

f1(x), f2(x),...,fn(x)

Решение х*ÎХ "лучше" решения хÎХ в смысле лексикографического предпочтения, если выполнено одно из n+1 условий:

1) f1(x*)>f1(x);

2) f1(x*)=f1(x), f2(x*)>f2(x);

3) f1(x*)=f1(x), f2(x*)=f2(x), f3(x*)>f3(x);

………………

n) fi(x*)=fi(x) для i=1,…,n-1, fn(x*)>fn(x);

n+1) fi(x*)=fi(x) для i=1,…,n.

Принцип минимакса. Применяется при столкновении интересов двух противоборствующих сторон (антагонистический конфликт). Каждое ЛПР сначала для каждой своей стратегии (альтернативы) вычисляет "гарантированный" результат, затем окончательно выбирает ту стратегию, для которой этот результат наибольший по сравнению с другими его стратегиями. Такое действие не дает ЛПР "максимальный выигрыш", однако является единственным разумным принципом оптимальности в условиях антагонистического конфликта. В частности, исключен всякий риск.

Принцип равновесия. Это обобщение принципа минимакса, когда во взаимодействии участвуют много сторон, преследующих каждыйсвою цель (прямого противостояния нет). Пусть число ЛПР (участников неантагонистического конфликта) есть n. Набор выбранных стратегий (ситуация) x1*, x2*,…, xn* называется равновесным, еслиодностороннее отклонение любого ЛПР от этой ситуации может привести разве лишь к уменьшению его же "выигрыша". В ситуации равновесия участники не получают «максимального» выигрыша, но они вынуждены придерживаться ее.

Принцип оптимальности по Парето. Данный принцип предполагает в качестве оптимальных те ситуации (наборы стратегий х1,…,xn), в которых улучшение «выигрыша» отдельного участника невозможно без ухудшения «выигрышей» остальных участников. Этот принцип предъявляет слабые требования к понятию оптимальности, чем принцип равновесия. Поэтому Парето-оптимальные ситуации существуют почти всегда.

Принцип недоминируемых исходов. Этот принцип является представителем многих принципов оптимальности в кооперативных играх (коллективное принятие решений) и приводит к понятию "ядра" решений. Все участники объединяются и совместными согласованными действиями максимизируют «общий выигрыш». Принцип недоминируемости - один из принципов ''справедливого'' дележа между участниками. Это та ситуация, когда ни один из участников не может аргументировано возразить против предлагаемого дележа (элемента "ядра"). Существуют и другие принципы «оптимального» дележа общего суммарного выигрыша.

Принципы устойчивости (угрозы и контругрозы). Идея всех принципов устойчивости на основе угроз и контругроз заключается в следующем. Каждая коалиция участников выдвигает свое предложение, сопровождая его реальной угрозой: если предложение не будет принято остальными участниками, то будут предприняты такие действия, которые ухудшают положение остальных участни­ков и не ухудшают (возможно улучшают) положение угрожающей коалиции. Оптимальным считается то решение, в условиях которого против всякой угрозы любой коалиции найдется контругроза со стороны какой-то коалиции.

Арбитражные схемы. Экономические конфликты наводят на мысль об "общественном арбитре". Нежелательно, чтобы столкновения интересов переходили, например, в открытые угрозы и контругрозы. Должны существовать социальные механизмы, которые позволяли бы учитывать предпочтения и стратегические возможности каждого участника и обеспечили бы "справедливое" решение конфликта. Такой предварительный механизм, будь то отдельное лицо или система голосования, называется арбитром. В теории игр оптимальное, в смысле арбитражной схемы, решение строится при помощи системы аксиом, включающих такие понятия, как статус-кво, оптимальность по Парето, линейность альтернатив, независимость от "рангов" и т.д.

Рассмотрим далее вопросы оптимального принятия решения в условиях неопределенности. Для выработки оптимального поведения ЛПР такую ситуацию полезно моделировать, как антагонистическую игру двух лиц, где в качестве противника ЛПР рассматривается природа. Последняя наделяется всеми мыслимыми в данных условиях возможностями.

В "играх с природой" существуют свои специфические (хотя и напоминающие принцип минимакса) принципы оптимального выбора решения.

Принцип крайнего пессимизма (критерий Вальда). Согласно этому принципу игра с природой (принятие решения в условиях неопределенности) ведется как игра с разумным, агрессивным противником, делающим все для того, чтобы помешать нам достигнуть успеха. Оптимальной считается стратегия ЛПР, при которой гарантируется выигрыш, не меньший, чем "разрешенный природой".

Принцип минимаксного риска (критерий Сэвиджа). Этот принцип также пессимистический, но при выборе оптимальной стратегии советует ориентироваться не на "выигрыш", а на риск. Риск определяется как разность между максимальным выигрышем ЛПР (при условии полной информации о состоянии природы) и реальным выигрышем (при незнании состояния природы). В качестве оптимальной выбирается та стратегия, при которой величина риска минимальна.

Принцип пессимизма - оптимизма (критерии Гурвица). Этот критерий рекомендует при выборе решения не руководствоваться ни крайним пессимизмом («всегда рассчитывай на худшее!»), ни крайним оптимизмом ("авось кривая вывезет!"). Согласно этому критерию максимизируется взвешенное среднее между выигрышами крайнего пессимизма и крайнего оптимизма. Причем «вес» выбирается из субъективных соображений об опасности ситуаций.

Концепция динамической устойчивости. Все изложенные выше принципы оптимальности сформулированы относительно статических задач принятия решения. Попытка применения их в динамических задачах может сопровождаться всевозможными осложнениями.

Главное - это особенности динамических процессов. Нужно, чтобы тот или иной принцип оптимальности, выбранный в начальном состоянии процесса (в начальный момент времени), оставался оптимальным в любом текущем состоянии (в любой момент времени) до конца динамического процесса. Этот принцип называется динамической устойчивостью.

 


1 | 2 | 3 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.005 сек.)