Авто Автоматизация Архитектура Астрономия Аудит Биология Бухгалтерия Военное дело Генетика География Геология Государство Дом Другое Журналистика и СМИ Изобретательство Иностранные языки Информатика Искусство История Компьютеры Кулинария Культура Лексикология Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлы и Сварка Механика Музыка Население Образование Охрана безопасности жизни Охрана Труда Педагогика Политика Право Приборостроение Программирование Производство Промышленность Психология Радио Регилия Связь Социология Спорт Стандартизация Строительство Технологии Торговля Туризм Физика Физиология Философия Финансы Химия Хозяйство Ценнообразование Черчение Экология Эконометрика Экономика Электроника Юриспунденкция

Лабораторная работа № 4. Исследование статистики и энтропии источников текстовой (дискретной) информации

Читайте также:

Исследование статистики и энтропии источников текстовой (дискретной) информации

1. Как задается в программе №1 имя анализируемого текстового файла? В каком формате должен быть записан исходный текст? Найти цикл, в котором считывается исходный текст. Что служит условием окончания выполнения этого цикла?

2. Пояснить процедуру вычисления одномерной функции распределения (ОФР). В каком формате и в каком массиве хранятся значения ОФР?

3. Найти цикл, в котором осуществляется построение гистограммы ОФР. Каким образом осуществляется нормировка при построении гистограммы ОФР? Объяснить, каким образом можно на гистограмме подписать численные значения вероятностей появления отдельных символов.

4. Объяснить фрагмент программы № 1, в котором рассчитывается энтропия и избыточность сообщения. Что позволяет при вычислении энтропии игнорировать символами, вероятность которых меньше 10^-16?

5. Предложить свой вариант программы №1, в котором обеспечивается оперативная смена алфавита. В этом случае алфавит языка (прописные и строчные буквы) должен полностью задаваться в виде двух строковых констант типа string. Сравнить между собой компактность, быстродействие и удобство использования исходной и переделанной программ.

6. Предложить свой вариант программы №1, в котором на гистограмме символы отображаются в порядке убывания вероятностей их появления (см. рис.3).

7. В чем причина различий энтропии, определенной по одномерной и двумерной статистике текстовой информации?

Лабораторная работа № 5

Изучение принципов кодирования информации неравномерными кодами

1. В чем заключается сущность используемой в работе процедуры неравномерного кодирования?

2. Как в программе реализуется процедура отбрасывания незначащих нулей в старших разрядах кодов?

3. Как в программе определяется длина каждого неравномерного кода?

4. Как вычисляется средневзвешенное значение неравномерных кодов? Предложить вариант реализации алгоритма вычисления среднеарифметического значения длины кода в расчете на один символ сообщения.

5. В чем принципиальная разница в нахождении средневзвешенных и среднеарифметических значений количества бит на символ для неравномерных кодов?

6. При каких условиях и почему средневзвешенные значения случайной величины по ансамблю реализаций будут равны среднеарифметическому (среднему) значению случайной величины? Ответ пояснить конкретным примером.

1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |

Поиск по сайту:

Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.124 сек.)

Главная | О проекте | Полезные cсылки | Контакты | Случайная страница