|
|||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
ЭНТРОПИЯПОНЯТИЕ НЕОПРЕДЕЛЕННОСТИ Первым специфическим понятием теории информации является понятие неопределенности случайного объекта, для которой удалось ввести количественную меру, названную энтропией. Начнем с простейшего варианта — со случайного события. Пусть, например, некоторое событие может произойти с вероятностью 0,99 и не произойти с вероятностью 0,01, а другое событие имеет вероятности соответственно 0,5 и 0,5. Очевидно, что в первом случае результатом опыта "почти наверняка" является наступление события, во втором же случае неопределенность исхода так велика, что от прогноза разумнее воздержаться. Для характеристики размытости распределений широко используется второй центральный момент (дисперсия) или доверительный интервал. Однако эти величины имеют смысл лишь для случайных числовых величин и не могут применяться к случайным объектам, состояния которых различаются качественно, хотя и в этом случае можно говорить о большей или меньшей неопределенности исхода опыта. Следовательно, мера неопределенности, связанной с распределением, должна быть некоторой его числовой характеристикой, функционалом от распределения, никак не связанным с тем, в какой шкале измеряются реализации случайного объекта.
ЭНТРОПИЯ И ЕЕ СВОЙСТВА Примем в качестве меры неопределенности случайного объекта А с конечным множеством возможных состояний А ,..., A с соответствующими вероятностями р ,..., р величину , (1) которую и называют энтропией случайного объекта А (или распределения ). Убедимся, что этот функционал обладает свойствами, которые вполне естественны для меры неопределенности. 1 . H(p ,..., р ) = 0 в том и только в том случае, когда какое-нибудь одно из равно единице (а остальные — нули). Это соответствует случаю, когда исход опыта может быть предсказан с полной достоверностью, т.е. когда отсутствует всякая неопределенность. Во всех других случаях энтропия положительна. Это свойство проверяется непосредственно. 2 . H(p ,..., р ) достигает наибольшего значения при p = p =... = =p = 1/n, т.е. в случае максимальной неопределенности. Действительно, вариация H по р при условии = 1 дает р = = const = 1/n. 3 . Если А и В — независимые случайные объекты, то Н (А В) = =H({p }) +H({q }) =H(A) +Н(В). 4 . Если А и В — зависимые случайные объекты, то Н(А В)=Н(А)+Н(В|А)=Н(В)+Н(А|В), (2) где условная энтропия Н(В|А) определяется как математическое ожидание энтропии условного распределения. 5 . Имеет место неравенство Н(А) Н(А |В), что согласуется с интуитивным представлением о том, что знание состояния объекта В может только уменьшить неопределенность объекта А, а если они независимы, то оставит ее неизменной. Как видим, свойства функционала Н позволяют использовать его в качестве меры неопределенности. Интересно отметить, что если пойти в обратном направлении, т.е. задать желаемые свойства меры неопределенности и искать обладающий указанными свойствами функционал, то уже только условия 2 и 4 позволяют найти этот функционал, и притом е д и н с т в е н н ы м образом (с точностью до постоянного множителя).
ДИФФЕРЕНЦИАЛЬНАЯ ЭНТРОПИЯ Обобщение столь полезной меры неопределенности на непрерывные случайные величины наталкивается на ряд сложностей. Можно по-разному преодолеть эти сложности: выберем кратчайший путь. Прямая аналогия p(x) log p(x) dx не приводит к нужному результату; плотность р(х) является размерной величиной, а логарифм размерной величины не имеет смысла. Однако положение можно исправить, умножив р(х) под знаком логарифма на величину , имеющую ту же размерность, что и х: p(x) log [ p(x)] dx Теперь величину можно принять равной единице измерения x, что приводит к функционалу , (3) который получил название дифференциальной энтропии. Это аналог энтропии дискретной величины, но аналог условный, относительный: ведь единица измерения произвольна. Запись (3) означает, что мы как бы сравниваем неопределенность случайной величины, имеющей плотность p(x), с неопределенностью случайной величины, равномерно распределенной в единичном интервале. Поэтому величина h(X) в отличие от Н(Х) может быть не только положительной. Кроме того, h(Х) изменяется при нелинейных преобразованиях шкалы х, что в дискретном случае не играет роли. Остальные свойства h(X) аналогичны свойствам Н(Х), что делает дифференциальную энтропию очень полезной мерой. Пусть, например, задача состоит в том, чтобы, зная лишь некоторые ограничения на случайную величину (типа моментов, пределов сверху и снизу области возможных значений и т.п.), задать для дальнейшего (каких-то расчетов или моделирования) конкретное распределение. Одним из подходов к решению этой задачи дает принцип максимума энтропии: из всех распределений, отвечающих данным ограничениям, следует выбирать то, которое обладает максимальной дифференциальной энтропией. Смысл этого критерия состоит в том, что, выбирая экстремальное по энтропии распределение, мы гарантируем наибольшую неопределенность, связанную с ним, т.е. имеем дело с наихудшим случаем при данных условиях.
ФУНДАМЕНТАЛЬНОЕ СВОЙСТВО ЭНТРОПИИ СЛУЧАЙНОГО ПРОЦЕССА Назовем каждое такое состояние символом, множество возможных состояний — алфавитом, их число m — объемом алфавита. Число всевозможных последовательностей длины n, очевидно, равно m . Появление конкретной последовательности можно рассматривать как реализацию одного из m возможных событий. Зная вероятности символов и условные вероятности появления следующего символа, если известен предыдущий (в случае их зависимости), можно вычислить вероятность Р(С) для каждой последовательности С. Тогда энтропия множества {С}, по определению равна (4) Определим энтропию процесса Н (среднюю неопределенность, приходящуюся на один символ) следующим образом: (5) На множестве {C} можно задать любую числовую функцию (C), которая, очевидно, является случайной величиной. Определим (C) с помощью соотношения (C) = - . Математическое ожидание этой функции , откуда следует, что , и . (6) Это соотношение является одним из проявлений гораздо более общего свойства дискретных эргодических процессов. Оказывается, что не только математическое ожидание величины (C) при n имеет своим пределом Н, но сама эта величина (C) стремится к Н при n . Другими словами, как бы малы ни были > 0 и > 0, при достаточно большом n справедливо неравенство. , (7) т.е. близость (C) к Н при больших n является почти достоверным событием. Для большей наглядности сформулированное фундаментальное свойство случайных процессов обычно излагают следующим образом. Для любых заданных > 0 и > 0 можно найти такое n , что реализации любой длины n > n распадаются на два класса: группа реализаций, вероятности Р(С) которых удовлетворяют неравенству ; (8) группа реализаций, вероятности которых этому неравенству не удовлетворяют. Так как согласно неравенству (7) суммарные вероятности этих групп равны соответственно 1 — и , то первая группа называется высоковероятной, а вторая — маловероятной. Это свойство эргодических процессов приводит к ряду важных следствий, из которых три заслуживают особого внимания. 1 . Независимо от того, каковы вероятности символов и каковы статистические связи между ними, все реализации высоковероятной группы приблизительно равновероятны (см. формулу (8)). В связи с этим фундаментальное свойство иногда называют "свойством асимптотической равнораспределенности". Это следствие, в частности, означает, что по известной вероятности Р(С) одной из реализаций высоковероятной группы можно оценить число N1 реализаций в этой группе: 2 . Энтропия H с высокой точностью равна логарифму числа реализаций в высоковероятной группе: H = nH=logN 3 . При больших и высоковероятная группа обычно охватывает лишь ничтожную долю всех возможных реализаций (за исключением случая равновероятных и независимых символов, когда все реализации равновероятны и H = log m). В результате можно сказать, что, связав понятие неопределенности дискретной величины с распределением вероятности по возможным состояниям и свойств от количественной меры неопределенности, мы приходим к выводу, что такой мерой может служить только функционал (1), названный энтропией. С некоторыми трудностями энтропийный подход удалось обобщить на непрерывные случайные величины (введением дифференциальной энтропии (3)) и на дискретные случайные процессы.
Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.006 сек.) |