|
|||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Лабораторная работа № 4. Исследование статистики и энтропии источников текстовой (дискретной) информацииИсследование статистики и энтропии источников текстовой (дискретной) информации
1. Как задается в программе №1 имя анализируемого текстового файла? В каком формате должен быть записан исходный текст? Найти цикл, в котором считывается исходный текст. Что служит условием окончания выполнения этого цикла? 2. Пояснить процедуру вычисления одномерной функции распределения (ОФР). В каком формате и в каком массиве хранятся значения ОФР? 3. Найти цикл, в котором осуществляется построение гистограммы ОФР. Каким образом осуществляется нормировка при построении гистограммы ОФР? Объяснить, каким образом можно на гистограмме подписать численные значения вероятностей появления отдельных символов. 4. Объяснить фрагмент программы № 1, в котором рассчитывается энтропия и избыточность сообщения. Что позволяет при вычислении энтропии игнорировать символами, вероятность которых меньше 10-16? 5. Предложить свой вариант программы №1, в котором обеспечивается оперативная смена алфавита. В этом случае алфавит языка (прописные и строчные буквы) должен полностью задаваться в виде двух строковых констант типа string. Сравнить между собой компактность, быстродействие и удобство использования исходной и переделанной программ. 6. Предложить свой вариант программы №1, в котором на гистограмме символы отображаются в порядке убывания вероятностей их появления (см. рис.3). 7. В чем причина различий энтропии, определенной по одномерной и двумерной статистике текстовой информации?
Лабораторная работа № 5 Изучение принципов кодирования информации неравномерными кодами 1. В чем заключается сущность используемой в работе процедуры неравномерного кодирования? 2. Как в программе реализуется процедура отбрасывания незначащих нулей в старших разрядах кодов? 3. Как в программе определяется длина каждого неравномерного кода? 4. Как вычисляется средневзвешенное значение неравномерных кодов? Предложить вариант реализации алгоритма вычисления среднеарифметического значения длины кода в расчете на один символ сообщения. 5. В чем принципиальная разница в нахождении средневзвешенных и среднеарифметических значений количества бит на символ для неравномерных кодов? 6. При каких условиях и почему средневзвешенные значения случайной величины по ансамблю реализаций будут равны среднеарифметическому (среднему) значению случайной величины? Ответ пояснить конкретным примером. Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.003 сек.) |