АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Определение управляемого полумарковского случайного процесса

Читайте также:
  1. Access. Базы данных. Определение ключей и составление запросов.
  2. I. Дифракция Фраунгофера на одной щели и определение ширины щели.
  3. I. Определение
  4. I. Определение
  5. I. Определение основной и дополнительной зарплаты работников ведется с учетом рабочих, предусмотренных технологической картой.
  6. I. Определение пероксида водорода (перекиси водорода)
  7. I. Определение проблемы и целей исследования
  8. I. Определение ранга матрицы
  9. I. Пограничное состояние у новорожденных детей. Определение, характеристика, тактика медицинского работника.
  10. I. Сестринский процесс при гипертонической болезни: определение, этиология, клиника. Принципы лечения и уход за пациентами, профилактика.
  11. I. Сестринский процесс при диффузном токсическом зобе: определение, этиология, патогенез, клиника. Принципы лечения и ухода за пациентами
  12. I. Сестринский процесс при остром инфаркте миокарда: определение, клиника, неотложная помощь, транспортировка пациента.

Управляемый полумарковский процесс определяется однородной трехмерной марковской цепью или однородным управляемым процессом марковского восстановления

(5.22)

Во введенных обозначениях (5.22) считаем:

· - конечное множество состояний (в дальнейшем часто множество Е будем отождествлять с множеством первая компонента xn однородного управляемого процесса марковского восстановления принимает дискретные значения из этого множества;

· – множество положительных действительных чисел, поэтому вторую компоненту однородного управляемого процесса марковского восстановления отождествляем со временем, на пространстве задаем борелевскую s- алгебру[12];

· U - есть пространство управлений с s- алгеброй A подмножеств этого пространства.

Однородная марковская цепь определяется переходными вероятностями A,

и начальным распределением

В рассматриваемом случае предполагаем, что марковская цепь задается переходными вероятностями специального вида

в которых нет зависимости от параметров t и u – значений второй и третьей компоненты на предыдущем шаге и номера шага n. Следовательно, будущее поведение однородного управляемого процесса марковского восстановления зависит только от значения первой компоненты и имеет место однородность этого управляемого марковского процесса восстановления. При этих дополнительных ограничениях в качестве начального распределения можно задавать константы

(5.23)

поскольку событие являются достоверным и по определению будущее от этих событий не зависит.

В дальнейшем будем использовать следующие обозначения

(5.24)

Так как будущее течение процесса зависит только от первой компоненты, то можно модель усложнить и считать, что область определения функции по переменной B зависит от состояния i. Это значит для каждого iОE задано множество управлений Ui и s- алгебра A i подмножеств этого пространства Ui. Функция , определяемая равенством (5.24), задана для i,jÎE, tÎR+, BО A i.

Исследуем свойства функции , вытекающие из определения.

Нетрудно заметить, что при t®Ґ и B=Ui мы получаем переходную вероятность

(5.25)

для вложенной цепи Маркова, характеризующей эволюцию первой компоненты введенной трехмерной цепи Маркова.

Функции (5.24) обладают следующими свойствами при любых i,jОE, x>0 и A i:

·

· - неубывающие по t, непрерывные слева функции;

·

Далее нетрудно заметить, что при B=Ui имеем равенство

(5.26)

где функция определяется равенством (5.2).

Из определения (5.24) следует

Следовательно, семейство функций порождает на измеримом пространстве (Ui, A i) семейство вероятностных мер при iÎE, BÎ A i

(5.27)

Так как для любого jÎE, tÎR+, A i справедливо неравенство то мера абсолютно непрерывна относительно меры и на основании теоремы Радона-Никодима [12] существуют измеримые функции такие, для которых имеет место равенство

(5.28)

Функции есть условные вероятности

(5.29)

Таким образом, однородный управляемый процесс марковского восстановления может быть задан семейством матриц , множеством вероятностных мер и начальным распределением вероятностей состояний pi, i,jÎE, tÎR+, uОUi, BО A i.

Семейство матриц будем называть полумарковским ядром управляемого полумарковского процесса, а семейство вероятностных мер будем называть семейством управляющих мер.

Если использовать равенства (5.26) и (5.28), то легко установить связь между полумарковским ядром и полумарковским ядром управляемого полумарковского процесса Qij(t,u) и семейством вероятностных управляющих мер

(5.30)

Равенство (5.29) позволяет выписать условное распределение

(5.31)

Далее определим управляемый полумарковский процесс X(t) как пару

(5.32)

где а считающий процесс определяется равенством (5.17).

Нетрудно заметить, что процесс совпадает со стандартным полумарковским процессом (определение (5.16)). Вторая компонента управляемого полумарковского процесса определяет траекторию принимаемых решений.

Отметим одно важное обстоятельство: компоненты полумарковского процесса , и введенный выше считающий процесс имеют ступенчатые траектории, для которых совпадают моменты разрывов (разрывы происходят в моменты nі1). Значения считающего процесса целые положительные числа и траектории его неубывающие, компонента принимает значения из конечного множества компонента принимает значения из множеств Ui, причем в зависимости от значения, принимаемого первой компонентой (это свидетельствует о зависимости процессов и ).

Равенство (5.26) увязывает характеристики управляемого полумарковского процесса и характеристики его первой компоненты – стандартного полумарковского процесса. По свойствам первой компоненты управляемого полумарковского процесса можно провести классификацию его состояний и свойств траекторий, как это было сделано в параграфе 5.1. для стандартного полумарковского процесса.


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.005 сек.)