|
|||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Кодирование аудиообъектовКодирование звуковой информации также может осуществляться разными способами, дающими различные объемы передаваемых данных и различное качество звука на выходе системы.
1). Кодирование всех видов звука с обеспечением высокого и среднего качества выполняется методом, основанным на методе ААС стандарта MPEG-2. При этом обеспечивается передача до 8 каналов звука при скорости передачи двоичных символов 16...64 кбит/с на канал.
2). Кодирование музыки и других звуков с более низкими скоростями выходного потока по методу TwinVQ (Transform-domain Weighted Interleave Vector Quantization - Взевешенное векторное квантование с перемежением в области преобразования). Как и в методе ААС, в этом методе выполняются разложение на частотные поддиапазоны и МДКП в каждом поддиапазоне. Отличие TwinVQ от ААС состоит в векторном квантовании спектральных составляющих звукового сигнала. В результате скорость передачи двоичных символов в выходном потоке данных составляет от 6 до 24 кбит/с.
3). Для передачи речи с высоким и средним качеством используется метод кодирования CELP (Code Excited Linear Predictive - кодирование возбуждений с линейным предсказанием), который обеспечивает скорости передачи 6...24 кбит/с при частотах дискретизации 8 кГц или 16 кГц.
4). Параметрическое кодирование речи по методу HVXC (Harmonic Vector eXitation Coding - кодирование возбуждений гармоническими векторами), которое обеспечивает сжатие при сохранении разборчивости до скоростей 2...4 кбит/с и даже до 1,2 кбит/с при частоте дискретизации 8 кГц.
5). Самые низкие скорости передачи 0,2...1,2 кбит/с достигаются для искусственно синтезированной речи. Для этого в MPEG-4 имеется интерфейс преобразования текста в речь TTSI (Text-to-Speech Interface), который позволяет передавать описание речи в виде последовательности фонем (звукосочетаний) с указаниями особенностей их произнесения (ударения, длительности и т.д.). По этим данным в декодере синтезируется речь, которая синхронизируется с анимацией изображения лица.
6). Музыка также может передаваться в виде описания и синтезироваться в декодере. Для описания звучания музыкальных инструментов в MPEG-4 дан специальный язык SAOL (Structured Audio Orchestra Language - язык структурированного звукового оркестра). Каждый инструмент представляется как небольшой набор средств обработки сигналов, позволяющий создавать специфический для данного инструмента звук. Описания музыкальных инструментов загружаются в декодер из принимаемого потока данных и могут храниться в нем для последующего использования.
Для описания собственно музыки передается описание оркестровки, т.е. команды и данные, по которым осуществляется синтез звуков, соответствующих разным инструментам. Оркестровка описывается с помощью особого языка SASL (Structured Audio Score Language - язык структурированной звуковой оркестровки). Допускается также использование широко известного протокола описания синтезируемой музыки MIDI.
Отметим, что для синтезированных речи и музыки в MPEG-4 задаются именно языки их описания, а не сами алгоритмы синтеза, которые могут быть различными.
Кодирование аудиообъектов также обладает свойством масштабируемости. Например, на базовом уровне может использоваться метод кодирования CELP, а дополнительный уровень обеспечивает качество звука, соответствующее кодированию по MPEG-2 ААС.
Более сложный и дорогой декодер может декодировать базовый и дополнительные слои потока данных и позволяет получать более высокое качество воспроизводимого звука, чем более простой и дешевый декодер, воспринимающий только базовый слой. [5.3]
5.1 http://marklv.narod.ru/book/codir.htm 5.2 http://www.eparh-chb.ru/kodirovanie-videoobektov.html 5.3 http://www.eparh-chb.ru/kodirovanie-audioobektov.html
Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.003 сек.) |