АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Лабораторная работа № 4. Исследование статистики и энтропии источников текстовой (дискретной) информации

Читайте также:
  1. T-FACTORY HRM - управление персоналом и работами
  2. V. САМОСТОЯТЕЛЬНАЯ РАБОТА
  3. V. Самостоятельная работа студентов с больными.
  4. V2: Работа и энергия
  5. Window - работа с окнами.
  6. Аналитическая работа при выборе и обосновании стратегии развития предприятии
  7. Б) работа врачей поликлиники (амбулатории), диспансера, консультации
  8. В 72-х дневном цикле подвиг длится 8 суток, из которых 2 суток – голод, а 6 – очистительные процедуры и работа над собой. В 12-ти летнем цикле подвиг длится 1 год.
  9. В работах В. Джеймса
  10. В) профилактическая работа
  11. Виртуальная работа силы. Идеальные связи
  12. Власть и норма в работах Фуко

Исследование статистики и энтропии источников текстовой (дискретной) информации

 

1. Как задается в программе №1 имя анализируемого текстового файла? В каком формате должен быть записан исходный текст? Найти цикл, в котором считывается исходный текст. Что служит условием окончания выполнения этого цикла?

2. Пояснить процедуру вычисления одномерной функции распределения (ОФР). В каком формате и в каком массиве хранятся значения ОФР?

3. Найти цикл, в котором осуществляется построение гистограммы ОФР. Каким образом осуществляется нормировка при построении гистограммы ОФР? Объяснить, каким образом можно на гистограмме подписать численные значения вероятностей появления отдельных символов.

4. Объяснить фрагмент программы № 1, в котором рассчитывается энтропия и избыточность сообщения. Что позволяет при вычислении энтропии игнорировать символами, вероятность которых меньше 10-16?

5. Предложить свой вариант программы №1, в котором обеспечивается оперативная смена алфавита. В этом случае алфавит языка (прописные и строчные буквы) должен полностью задаваться в виде двух строковых констант типа string. Сравнить между собой компактность, быстродействие и удобство использования исходной и переделанной программ.

6. Предложить свой вариант программы №1, в котором на гистограмме символы отображаются в порядке убывания вероятностей их появления (см. рис.3).

7. В чем причина различий энтропии, определенной по одномерной и двумерной статистике текстовой информации?

 

Лабораторная работа № 5

Изучение принципов кодирования информации неравномерными кодами

1. В чем заключается сущность используемой в работе процедуры неравномерного кодирования?

2. Как в программе реализуется процедура отбрасывания незначащих нулей в старших разрядах кодов?

3. Как в программе определяется длина каждого неравномерного кода?

4. Как вычисляется средневзвешенное значение неравномерных кодов? Предложить вариант реализации алгоритма вычисления среднеарифметического значения длины кода в расчете на один символ сообщения.

5. В чем принципиальная разница в нахождении средневзвешенных и среднеарифметических значений количества бит на символ для неравномерных кодов?

6. При каких условиях и почему средневзвешенные значения случайной величины по ансамблю реализаций будут равны среднеарифметическому (среднему) значению случайной величины? Ответ пояснить конкретным примером.


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.004 сек.)