|
||||||||||||||||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Типы неточного выводаPROSPECTOR. Вероятностные методы принятия решений основаны на байесовском подходе. Для задач вывода в ИС этот подход был развит при работе над системой PROSPECTOR JDuda et al., 1976]. В системе PROSPEC-106 TOR в качестве весов, приписанных высказываниям, выступают вероятности соответствующих событий. Множества событий организованы в сети вывода, по которым производится пересчет априорных вероятностен высказываний в апостериорные. Правила в системе имеют вид «если Е, то Я» и «если Е, то #>, причем в сети вывода для каждой пары высказываний {£, Н} эти правила присутствуют или отсутствуют одновременно. Вид функции пересчета /(•) постулируется, т. е. для конъюнкции и дизъюнкции используются формулы нечеткой логики: Р(А\/В)=т&х(Р(А), Р{В)), Р(А&В)=тЩР(А), Р{В)). Попытки формального обоснования функций h(-) и g(-) связаны с принятием предположений о независимости: а) Р(Н\Е&Е')=Р(И\Е) и Р(Н\Е&Е') = в=Р(Н\Е), где £'— свидетельство, «опосредованно» (через Е) связанное правилами с Я;_ б) Р{ЕХ&Е2\Н)=Р{Е1\Н)Р(Е2\Н) и Р(Е1&Е2\Я) = =P{Ei\H)P(E2\H). Однако предположения б) [Хачатрян, 1987] являются слишком сильными, фактически сводя объединение свидетельств к выбору одного из них. Таким образом, механизм неточного вывода в системе PROSPECTOR несмотря на свой вероятностный характер является, по сути, эвристическим. Схема Пиэрла. Байесовские методы, неточного вывода получили более глубокое и формально обоснованное развитие в [Kim et al., 1983; Pearl, 1986]. Согласно этим работам знания людей о проблемной области (проблеме) можно представить в виде совместного распределения вероятностей Р(хи~-..,хп) на множестве пропозиционных переменных (т. е. переменных, значениями которых являются высказывания) х\,...,xn- Интерес представляет вычисление условных вероятностей Р(Н\Е), где Я(гипотеза) и £ (свидетельство)—некоторые композиционные высказывания, составленные из элементарных (т. е. типа {значение xt есть Vj'}). Все условные вероятности такого типа можно получить из совместного распределения вероятностей Р{х\,..., хп), однако такое направление преобразования информации не соответствует поведению человека, который не оперирует полным совместным распределением или маргинальными вероятностями высокого порядка (например, Р(хи...,хп~}))- Элементарными блоками, из которых строится общее знание человека, являются маргинальные вероятности низкого порядка (например, P(xi), P(xi, Xj)) и условные вероятности, определенные на небольших множествах высказываний. Пусть фиксирован некоторый произвольный порядок d переменных Х\,......,*«, каждой из которых соответствует вершина в графе. Тогда Р(хи..., хп) = = P{Xn\xn-\,:.,X\)...P(x2\xi)P(xi}. Пусть Si^{xu..., Xi-i) —минимальное подмножество вершин множества {х\,..., xi-i), удовлетворяющее условию P(xi\Si) =P(Xi\xi~u..., xi}. Можно показать, что такое подмножество единственно. Проведем от вершин множества S, направленные дуги к вершине хи Осуществив эту операцию для всех вершин xt, получим ориентированный ациклический граф, в котором отражены многие соотношения независимости, неявно содержащиеся в P(xi,...,xn). Наоборот, порядок d переменных и ориентированный ациклический граф с совокупностью условных распределений вероятностей однозначно определяют распределение Р(хи...,хп)- Такой «локальный» способ определения Р(хи..., хп) соответствует заданию системы вероятностных суждений, которыми наиболее естественно оперируют эксперты. Графы (а точнее, гиперграфы), построенные описанным способом, носят название сетей доверия или байесовских сетей. Процесс рассуждения (вывода) в системе знаний сопровождается распространением по сети влияния вновь поступивших свидетельств. Введение в систему знаний новых данных приводит к возникновению переходного процесса распространения по сети влияния вновь поступившего свидетельства. После завершения переходного процесса каждому высказыванию (ассоциированному с вершинами графа) оказывается приписана апостериорная вероятность Bel (Vjl) = P(Vjl | D), где D — объединение всех поступивших на данный -момент в систему данных. Механизм пересчета вероятностей имеет следующую структуру. С каждой вершиной в сети ассоциирован процессор, который получает сообщение от соседних (связанных с ним дугами) процессоров, осущест- вляет пересчет апостериорных вероятностей ВЕЦК/) для всех возможных значений Vj' данной переменной xi и посылает соседним вершинам ответные сообщения. Деятельность процессора инициируется нарушением условий согласованности с состояниями соседних процессоров и продолжается до восстановления этих условий. Правомочность данной процедуры строго обоснована для односвязных сетей, т. е. сетей, в которых от одной вершины к другой ведет не более одного ненаправленного пути. Обобщение метода пересчета на многосвязные сети осуществляется преобразованием их структуры в древовидную и требует выполнения ряда ограничительных условий [Pearl, J986J. MYCIN (EMYCIN). К байесовским методам неточного вывода примыкают механизмы пересчета весов, разработанные в системах MYCIN и EMYCIN [Shortliffe et al., 1975; Buchanan et a]., 1984]. Любое высказывание (а не только правило) в этих системах полагается условным по форме, причем в качестве условия высказывания, не являющегося правилом, принимается вся имеющаяся на данный момент в базе данных информация. Высказываниям приписываются веса, называемые факторами уверенности. Фактор уверенности (CF) определяется в виде разности CF[H, Е]—МВ[Н, Е] — MD[H, E], где МВ[Н, E](MD[H, E]) —мера возросшей веры (возросшего неверия) в гипотезу Н на основе свидетельства Е. Меры MB и MD определяются через вероятности Р{Н\Е) и Р(Н), причем 0<MB,MD<\. — l^CF^l. В зависимости от того, является ли вновь поступившее свидетельство подтверждающим или опровергающим гипотезу, производится пересчет приписанной гипотезе меры MB или MD. Вид функции пересчета /(•) для конъюнкции и дизъюнкции аналогичен используемой в системе PROSPECTOR, а вера в отрицание гипотезы определяется из соотношения МВ[Й, E]=MD[H, E]. Функция п(-) определяется произведением фактора уверенности, приписанного правила и веры в истинность свидетельства. Объединение свидетельств посредством функции g(-) осуществляется по формулам, неявно опирающимся на предположения условной независимости свидетельств либо по гипотезе, либо по ее отрицанию [Ха-чатрян, 1987]. В системе EMYCIN разделение фактора уверенности на две меры MB и MD устранено, что приводит к изменению функций пересчета. Механизмы неточных рассуждений систем MYCIN и EMYCIN не требуют: 1) априорной жесткой фиксации сетей вывода: правила вместе с приписанными им факторами уверенности можно модифицировать, удалять или добавлять в базу знаний, не заботясь об обеспечении необходимой для пересчета информации; 2) задания априорных вероятностей, так как меры CF, MB и MD аккумулируют как априорную, так и апостериорную информацию; однако отказ от явного использования в процессе пересчета априорных вероятностей может приводить к таким нежелательным последствиям, как принятие гипотезы с меньшей апостериорной вероятностью. Теория Демпстера—-Шефера (ТДШ). Эта теория [Shafer, I976] была разработана с целью обобщения вероятностного подхода к описанию неопределенности и связана с попыткой освободиться от догмата аксиом теории вероятностей при описании субъективной веры людей.
Рассмотрим конечное множество 0 взаимно исключающих друг друга возможностей, именуемое в ТДШ фреймом различения. На множестве всех подмножеств 8 как на множестве элементарных событий зададим базисное распределение вероятностей m: 2Р->[0 1] m(0)O J (Л) Лее понимается как мера доверия, приписанная А. Мера общего доверия* приписанная Л, определяется соотношением Ве1(Л) = ^т(В), где Bel: 2 -*-[0, I]— B(ZA функция доверия, характеризующая веру субъекта в истинность события Ле8. Наряду с величиной Bel (А) существенную информацию о событии А несет значение 1—Ве1(Л"), определяющее его меру правдоподобия (Р1(Л). Меры Bel (Л) и Р1(Л) называют соответственно нижними и верхними вероятностями, 108 что оправдано, в частности, неравенством ВеЦА) <Р1(Л). Таким образом, неопределенность (неточность) знаний субъекта об А выражается интервалом [Bel(Л). Р1(А)]. Важнейшим элементом ТДШ является операция объединения свидетельств (т. е. функция £(■)). задаваемая правилом Демпстера [Dempster, 1967]. Правило является эвристическим и основывается на интуитивных соображениях о разумном способе объединения не связанных друг с другом (независимых) свидетельств. Несмотря на интуитивную привлекательность многих аспектов ТДШ, она до последнего времени не- находила широкого применения в процедурах неточного вывода из-за вычислительной сложности операции объединения, экспоненциальной по мощности 8. Наметившиеся в последнее время возможности по преодолению этих трудностей [Barnett, 1981; Gordon et al., 1985; Shenoy et al., 1986] позволяют рассчитывать на более широкое использование ТДШ в рассуждающих системах. INFERNO. Механизм неточного вывода INFERNO [Quinlon, 1983] разрабатывался исходя из следующих критериев: 1) система вывода не должна зависеть от каких-либо предположений о вероятностном распределении на множестве высказываний; 2) имеющаяся об этом раеттрдрлении информация (например, данные о независимости событий) должна быть легко вводима в систему; 3) высказывания не должны быть жестко разделены на свидетельства и гипотезы — должна иметься возможность гибкого изменения направления вывода; 4) при наличии противоречий в исходных данных система должна их обнаруживать и предлагать пути устранения. В INFERNO каждому высказыванию Л ставится в соответствие вероятностный интервал [/(Л), 1—/(Л)], где /(Л)—оценка снизу вероятности Р(А), а }{А) —оценка вероятности Р(А). Таким образом, /(Л)<Р(Л)<1—/(Л). В процессе пересчета оценка t(A) аккумулирует подтверждающую Л информацию, a f{A) —опровергающую. Релевантные высказыванию Л данные считаются противоречивыми, если /(Л)4-/(Л)>1. Изначально каждому высказыванию Л приписаны значения /(Л)=/(Л) =0. Процессом пересчета управляют ограничения на t(A) и f(A) типа неравенства О», полученные хотя и из слабого, но справедливого во всех случаях неравенства maxP (S*)=CP (Si Х/^гУ ■•• V-Sn)^ <.PZjP(Si). Например, с отношением «Л влечет В с силой S* (P(B\A) = S) связано два ограничения: t(B)^t(A)S и ДЛ)>1—(1— f(B))/S, которые приводят к увеличению t{B) и /(Л) с ростом t(A) и f(B) соответственно. Пересчет продолжается до тех пор, пока все ограничения не будут удовлетворены. Если по окончании пересчета для каких-либо высказываний At имеют место неравенства t(Ai)+f(Ai)>l, т. е. исходные условия противоречивы, то INFERNO с помощью специальных ограничений осуществляет обратный пересчет и формирует множества возможных исправлений, внесение которых в исходные данные делает их совместными. Выбор конкретного из этих множеств осуществляет пользователь, обращаясь при необходимости к интегральному показателю «существенности» вносимых исправлений. Исчисление инцидентов. В данном случае [Bundy, 1985; 1986] каждому высказыванию А ставится в соответствие подмножество i(A) множества w; 1(А) называется инцидентом Л и интерпретируется как соответствующее высказыванию Л событие из вероятностного пространства элементарных событий w. Инцидент ЦА) принимается в качестве меры неопределенности, приписанной Л. При таком введении меры неопределенности логические связки оказываются функционально-истинностными по отношению к инцидентам, например i(A&B) = =i(A)(]i(B). Если для всех высказываний Л известны их инциденты, то, как следствие, известны не только вероятности всех Л (элементарные высказывания из w обычно полагают равновероятными), но и зависимости между ними. При этом инциденты (а значит, и вероятности) сложных высказываний могут быть вычислены по инцидентам высказываний, их составляющих. Процессом вывода в исчислении инцидентов управляет механизм обнаружения допустимых присвоений (МОДП). На вход ЛЮДП поступает специфицированное пользователем исходное присвоение F, т. е. совокупность пар оценок сверху и снизу {sup?(A), infF(A)\ инцидентов высказываний А. Пользуясь специальными правилами вывода, МОДП строит все допустимые сужения {Ск} присвоения F (\niF(Aj) с infG/f (А,-), &лра (A,) csupF(Af)), определенные на всем множестве интересующих пользователя высказываний. Если допустимых суждений присвоения / не существует, т. е. исходное присвоение содержит противоречия, то результатом МОДП является установление факта наличия противоречия. Основные трудности применения исчисления инцидентов сводятся к спецификации исходного присвоения (в частности, по вероятностям высказываний). Возможный подход к решению этой проблемы предлагается в [Corlett et al., 1986]. Проблематика неточного вывода вместе с теорией возможностей и приближенными рассуждениями объединены в направлении «Рассуждения в условиях неопределенности», которое интенсивно развивается [Cohen, 1985- Gupta et al 1985; Konolige, 1985; Nguyen et al., 1985; Kanal et al., 1986]. Однако на сегодняшний день имеется набор (постоянно пополняющийся) взаимовлияющих методов и опыт их применения в ряде задач [Gordon et al., 1985; Shenoy et al., 1986], причем в одних задачах наблюдается объединение механизмов неточных и приближенных рассуждений fPrade, 1985L я в других —прстпБоборстьи [Hisdai, 1986; Zadeh, i98bj. В перспективе можно надеяться на сближение подходов [Kyburg, 1987] и разработку теории рассуждений в условиях неопределенности при участии когнитивных психологов [Shafer, 1985]. Вторым перспективным" направлением является разработка методики выбора (синтеза) механизмов вывода в условиях неопределенности исходя из специфики задачи и характера мышления эксперта [Tong et al., 1985]. По-видимому, весьма плодотворным окажется сближение методов немонотонного и индуктивного (правдоподобного) вывода [Bobrow, 1980J (см. § 2.6) с методами рассуждения в условиях неопределенности. Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.005 сек.) |