АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Реалізація порогового кодування

Читайте также:
  1. Арифметичне кодування
  2. Визначення розміру страхового відшкодування по КАСКО
  3. ВІДШКОДУВАННЯ ЗБИТКІВ У СФЕРІ ГОСПОДАРЮВАННЯ
  4. Відшкодування збитків у сфері господарювання
  5. Відшкодування збитків у сфері господарювання.
  6. Відшкодування шкоди працівникам у разі ушкодження їх здоров’я.
  7. Вопрос Поняття відшкодування збитків.
  8. Двовимірне кодування довжин серій
  9. Джерела комунікації та процес кодування
  10. Кодування без втрат з передбаченням
  11. Кодування областей сталості
  12. Кодування програми

При зональному кодуванні, для всіх блоків зазвичай використовується одна фіксована маска. Порогове кодування, навпаки, є по суті адаптивним, оскільки позиції зберігаються коефіціента перетворення залежать від конкретного блоку. Фактично, порогове кодування є адаптивним підходом до трансформаційного кодування, яке завдяки своїй обчислювальної простоті, найчастіше і використовується на практиці. В його основі лежит той принцип, що в будь-якому блоці коефіцієнти перетворення, які мають найбільшу амплітуду, дають найзначніший внесок у інформаційний зміст відновлюваного блоку, що і було продемонстровано на останньому прикладі. Оскільки положення найбільших коефіцієнтів від блоку до блоку міняються, елементи упорядковуються (попередньо заданим методом) в одномірну послідовність, згодом кодованих кодом довжин серій. На Рис. 1.36 (в) представлений приклад типової порогової маски для одного блоку деякого гіпотетичного зображення. Ця маска дозволяє проілюструвати процес порогового кодування, математично описуваного формулою (1.5-38). Після маскування, двовимірний масив з коефіцієнтів перебудовується за допомогою зигзаг упорядкування (названого також Z-упорядкуванням). Зигзаг упорядкування очевидно з Рис. 1.34 (г), де показана черговість, в якій вибираються коефіцієнти. Сформований одновимірний масив з коефіцієнтів містить довгі серії постійних кодів, у другій половині - нулів, які добре стискуються кодуванням довжин серій. Одержувана кодова послідовність піддається ще одному етапу кодування, вже із застосуванням одного з алгоритмів нерівномірного кодування, розглянутих в Розділі 1.4.

Існує три основних способи поділу коефіцієнтів перетворення в блоці по порогу, або, інакше кажучи, побудови порогової маскуючої функції у формі, заданої формулою (1.5-37): (1) використання єдиного глобального порога, однакового для всіх блоків; (2) використання індивідуальних порогів для кожного блока; (3) змінний поріг, який може змінюватися як функція розташування коефіцієнта в блоці. У першому випадку рівень стиснення може змінюватися від зображення до зображення в залежності від того, скільки коефіцієнтів виявляються вище або нижче порога. Другий варіант, названий кодуванням N-найбільших, залишає одинакову кількість коефіцієнтів у кожному блоці. Як результат, швидкість коду є постійною і заздалегідь відомою. Третій метод, як і перший, призводить до коду непостійною швидкості, але зате має ту перевагу, що дозволяє об'єднати етапи квантування і розділення по порогу, замінюючи в (1.5-38) на

де - результат квантування та поділу по порогу значення , а - елемент масиву коефіцієнтів нормалізації перетворення:

Перед тим, як нормалізовані (квантовані і розділені по порогу) коефіцієнти перетворення можуть бути піддані зворотному перетворенню для відновлення блоку зображення , вони повинні бути помножені на . Одержуваний в результаті масив є наближенням :

Тим самим, зворотне перетворення отриманих значень дасть в результаті наближення відновлюваного блоку зображення.

На Рис. 1.37 графічно зображена формула (1.5-40) для випадку . Зауважимо, що приймає ціле значення до при умові

Якщо , то і коефіцієнт перетворення виявляється усіченим або викресленим. Коли коефіцієнт видається нерівномірним кодом, довжина якого зростає із збільшенням , то число бітів, що відводяться на уявлення , управляється зміною значення с. Тобто елемент матриці Z може масштабуватись, забезпечуючи тим самим різноманіття рівнів стиску. На Рис. 1.37 (6) показані значення типового масиву коефіцієнта нормалізації. Цей масив значень, які є ваговими множниками для коефіцієнтів перетворення в блоці, складений на основі оцінок візуального сприйняття, широко використовується в стандарті JPEG.

а) б)

Рис. 1.37. (а) Крива квантування порогового кодування (див. формулу (1.5-40)). (б) Типова матриця коефіцієнтів нормалізації

 

Приклад 1.22. Ілюстрація граничного кодування.

На Рис. 1.38 (а) і (б) показані два варіанти наближення напівтонового зображення на Рис. 1.23 методом порогового кодування. Обидва зображення отримані при використанні ДКП по блокам 8x8 і масиву коефіцієнтів нормалізації, наведеного на Рис. 1.37 (6). Перший варіант, що забезпечує коефіцієнт стиснення 34:1, був отриманий прямим застосуванням коефіцієнтів нормалізації. Другий, на якому зображення стисло з коефіцієнтом 67:1, отриманий за допомогою масштабування (попереднього множення масиву коефіцієнтів нормалізації на 4). Для порівняння: середнє значення коефіцієнтів стиску по всім методам стиснення без втрат, розглянутих в Розділі 1.4, склало лише 2,62:1.

Відмінності між вихідним зображенням на Рис. 1.23 і відновленими зображеннями на Рис. 1.38 (а) і (6), наведені на Рис. 1.38 (в) і (г). Відповідні стандартні відхилення помилок (див. (1.1-8)) склали 3,42 і 6,33 рівнів яскравостей. Характер помилок добре видно на Рис. 1.38 (д) і (е), які є збільшеними фрагментами зображень на Рис. 1.38 (а) і (6). Вони дозволяють оцінити в деталях різницю між відновленими зображеннями.

 

Вейвлет-кодування

Як і всі методи трансформаційного кодування, розглянуті в попередньому розділі, вейвлет-кодування засноване на тій же ідеї, що коефіцієнти перетворення, що здійснюють декорреляцію значень елементів на зображенні, можуть бути стиснуті більш ефективно, ніж вихідні значення пікселів. Якщо базисні функції перетворення - в даному випадку вейвлети - упаковують більшу частину візуальної важливої ​​інформації в невелике число коефіцієнтів, то залишилися коефіцієнти можуть бути грубо квантовані або обнулені з мінімальними спотвореннями зображення.

На Рис. 1.39 показана типова система вейвлет-кодування. Щоб закодувати зображення розмірами , вибираються вейвлет аналізу і мінімальний рівень розкладання , які використовуються для обчислення дискретного вейвлет-перетворення. Якщо вейвлет має відповідну масштабовану функцію , то може застосовуватися швидке вейвлет-перетворення.

Рис. 1.38. Ліва колонка: Наближення зображення на Рис. 1.23 при використанні ДКП та масиву коефіцієнтів нормалізації на Рис. 1.37 (6). Правая колонка: Аналогічні результати для масштабованих в 4 рази коефіцієнтів нормалізації.

а)

б)

Рис. 8.39. Система вейвлет-кодування: (а) кодер, (б) декодер.

У будь-якому випадку, що обчислюється перетворення трансформує значну частину вихідного зображення в горизонтальні, вертикальні і діагональні коефіцієнти розміщення з нульовим середнім і розподілом, близьким розподілу Лапласа. Оскільки багато з обчислених коефіцієнтів несуть малу візуальну інформацію, то вони можуть бути квантованими і стиснуті для зменшення міжкоефіцієнтної і кодової надмірності. Більш того, при квантуванні може враховуватися кореляція позиціонування на Р рівнях розкладання (міжрівневі зв'язки). На останньому кроці кодування символів може використовуватися один або декілька методів кодування без втрат, з числа розглянутих в Розділі 1.4, таких як кодування довжин серій, коди Хаффмана, арифметичне кодування, або кодування бітових площин. Декодування здійснюється інвертуванням операцій кодування - за винятком квантування, яке не є оборотньою операцією.

Принципова відмінність системи вейвлет-кодування на Рис. 1.39 від системи трансформаційного кодування на Рис. 1.28 полягає у відсутності етапу формування окремих блоків. Оскільки вейвлет-перетворення ефективно з точки зору обчислень, і одночасно з цим по суті локально (тобто його базисні функції є просторово обмежені), то не потрібно додаткового розбиття початкового зображення. Як буде видно на наступному прикладі, відсутність такого кроку дозволяє позбутися від блокових спотворень, характерних для методів, заснованих на ДКП, при високих коефіцієнтах стиснення.

 

Приклад 1.23. Порівняння способів кодування, заснованих на вейвлет-перетворенні та ДКП.

На Рис. 1.40 представлені два наближення напівтонового зображення Рис. 1.23, отримані за допомогою вейвлет-перетворення. Зображення на Рис. 1.40 (а) було відновлено після стиснення 34:1, а 1.40 (6) - після стиснення 67:1. Оскільки ці значення збігаються з коефіцієнтами стиснення в Прикладі 1.22, то зображення на Рис. 1.40 (а) - (е) ​​можуть порівнюватися як якісно, ​​так і кількісно із зображеннями на Рис. 1.38 (а) - (е). Візуальне порівняння показує значне скорочення помилок при вейвлет-кодуванні. Кількісне порівняння показує, що для зображення на Рис. 1.40 (а) стандартне відхилення помилки становить 2,29 рівнів яскравості, в порівнянні з 3,42 рівнів яскравості для зображення на Рис. 1.38 (а). Аналогічні оцінки для зображень на Рис. 1.40 (6) і Рис. 1.38 (6) становлять, відповідно, 6,33 і 2,96. Ці оцінки показують перевагу результатів, заснованих на вейвлет-кодуванні, для обох рівнів стиснення.

Крім зменшення помилок відновлення при використаних рівнях стиснення, вейвлет-кодування - див. Рис. 1.40 (д) і (е) - відмінно покращує (у суб'єктивному змісті) візуальну якість зображення. Це добре видно на Рис. 1.40 (е). Зауважимо повну відсутність блокових спотворень, що домінують на аналогічному фрагменті на Рис. 1.38 (е), стисненим блоковим варіантом трансформаційного кодування.

При збільшенні ступеня стиснення більш ніж 67:1, максимального з використаних в попередніх прикладах, помітним стає пропажа фактури на плаття жінки і розмивання контурів очей. Обидва ефекти видно на Рис. 1.41 (а) і (б), що є результатами відновлення зображення на Рис. 1.23, стисненого вейвлет-кодуванням з коефіцієнтами 108:1 і 167:1. Збільшення розмитості особливо помітно на фрагментах, наведених на Рис. 1.41 (д) і (е). Стандартні відхилення помилок склали 3,72 і 4,73 рівнів яскравості. Суб'єктивна оцінка обох зображень показує їх очевидну перевагу перед результатом стиснення 67:1 на Рис. 1.38 (6), виконаного за допомогою ДКП, стандартне відхилення помилки якого 6,33 рівнів яскравості. Таким чином, при коефіцієнті стиснення більш ніж удвічі вище, рівень помилки у зображенні, стисненого вейвлет-кодуванням, на 25% нижче, ніж у зображення, стиснутого з ДКП; до того ж, перше з них має безсумнівну перевагу в якості. Закінчуючи обговорення стиснення на основі вейвлет-кодування, зробимо короткий огляд основних факторів, що впливають на кодову складність, продуктивність і помилки відновлення.

а) б)

в) г)

д) е)

Рис. 1.40. (а), (в), (д) ​​Результати вейвлет-кодування - порівняйте з результатами кодування із застосуванням ДКП на Рис. 1.38 (а), (в), (д); та (б), (г), (е) аналогічні результати для порівняння з Рис. 1.38 (6), (г), (е).

а) б)

в) г)

д) е)

Рис. 1.41. (а), (в) (д) Результати вейвлет-кодування з стисненням 108:1; та (б), (г), (е) аналогічні результати при стисненні 167:1.

 

Вибір вейвлета

Вейвлети, обрані в якості базису прямого і зворотного перетворень (див. Рис. 1.39), впливають на всі аспекти системи вейвлет-кодування, включаючи як структурну схему, так і ефективність. Від них прямо залежить обчислювальна складність перетворень, і, непрямим чином, можливості системи в відповідність стиснення і відновлення зображень при прийнятному рівні спотворень. Якщо вейвлет-функція, що задає перетворення, має супутню масштабується функцію, то перетворення може бути реалізовано як послідовність операцій цифрової фільтрації. При цьому довжини фільтрів дорівнюють довжинам послідовностей для вейвлет-функції і масштабованої функції. Характеристики стиснення і відновлення зображень з допомогою вейвлет-перетворення визначаються можливостями останнього упаковувати інформацію в мале число коефіцієнтів перетворення.

Найбільш широко використовуваними системами функцій розподілу для стиснення на основі вейвлет-перетворення є системи вейвлетів Добеши і біортогональних вейвлетів. Цифрові фільтри, що відповідають останній системі, володіють рядом корисних властивостей, таких як гладкість, відносно мала довжина і деяке число нульових моментів, які важливі для розкладання та наступного відновлення.

Приклад 1.24. Вейвлет-базис в вейвлет-кодуванні.

Рис. 1.42 містить чотири дискретних вейвлет-перетворення зображення жінки на Рис. 1.23. Зображення на Рис. 1.42 (а) отриманого з використанням вейвлетів Хаара в якості функцій розподілу (базисних функцій), які є єдиними розривними вейвлетами з розглянутих тут. Зображення на Рис. 1.42 (6) отримано з використанням вейвлетів Добеши, що відносяться до числа вейвлетів, найбільш популярних в обробці зображення. Зображення на Рис. 1.42 (в) - з використанням сімлетов (симетричних вейвлетів), що є розширенням вейвлетів Добеши з додатковою симетрією. Для зображення на Рис. 1.42 (г) застосовувалися вейвлети Коена-Добеши-Фово, включені сюди для ілюстрації можливостей біортогональних вейвлетів. Як і раніше на аналогічних прикладах, щоб підвищити наочність виникаючих структур, всі зображення коефіцієнтів були піддані масштабованому градаційному перетворенню, при якому значення 0 відповідає рівень яскравості 128.

а) б)

в) г)

Рис. 1.42. Вейвлет-перетворення зображення на Рис. 1.23 з використанням: (а) вейвлетів Хаара, (б) вейвлетів Добеши, (в) сімлетов, і (г) біортогональних вейвлетів Коена-Добеши-Фово.

 

Як можна бачити з Таблиці 1.12, для перетворень, поданих на Рис. 1.42, число необхідних операцій множення і склалося на коефіцієнт (для кожного рівня розкладання) збільшується з 4 (для зображення на Рис. 1.42 (а)) до 28 (для зображення на Рис. 1.42 (г)). Всі чотири перетворення виконувалися з використанням швидкого вейвлет-перетворення (тобто блоку фільтрів). Відмітим, що здатність до упаковки інформації зростає зі збільшенням обчислювальної складності (тобто числа ненульових коефіцієнтів фільтрів). При використанні вейвлетів Хаара і усіканням коефіцієнтів деталей на рівні значення 1,5, обнуляються 46% коефіцієнтів перетворення. При використанні більш складних біортогональних вейвлетів, число обнуляємих коефіцієнтів виростає до 55%, збільшуючи при цьому потенціал стиснення на 10%.

 

Таблиця 1.12. Довжини (кількість ненульових коефіцієнтів) фільтрів вейвлет-перетворення і частка обнуляємих коефіцієнтів при усіканні перетворений на Рис. 1.42 на рівні 1.5.

 


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.008 сек.)