Авто Автоматизация Архитектура Астрономия Аудит Биология Бухгалтерия Военное дело Генетика География Геология Государство Дом Другое Журналистика и СМИ Изобретательство Иностранные языки Информатика Искусство История Компьютеры Кулинария Культура Лексикология Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлы и Сварка Механика Музыка Население Образование Охрана безопасности жизни Охрана Труда Педагогика Политика Право Приборостроение Программирование Производство Промышленность Психология Радио Регилия Связь Социология Спорт Стандартизация Строительство Технологии Торговля Туризм Физика Физиология Философия Финансы Химия Хозяйство Ценнообразование Черчение Экология Эконометрика Экономика Электроника Юриспунденкция

Кодирование аудиообъектов

Читайте также:

Кодирование звуковой информации также может осуществляться разными способами, дающими различные объемы передаваемых данных и различное качество звука на выходе системы.

1). Кодирование всех видов звука с обеспечением высокого и среднего качества выполняется методом, основанным на методе ААС стандарта MPEG-2. При этом обеспечивается передача до 8 каналов звука при скорости передачи двоичных символов 16...64 кбит/с на канал.

2). Кодирование музыки и других звуков с более низкими скоростями выходного потока по методу TwinVQ (Transform-domain Weighted Interleave Vector Quantization - Взевешенное векторное квантование с перемежением в области преобразования). Как и в методе ААС, в этом методе выполняются разложение на частотные поддиапазоны и МДКП в каждом поддиапазоне. Отличие TwinVQ от ААС состоит в векторном квантовании спектральных составляющих звукового сигнала. В результате скорость передачи двоичных символов в выходном потоке данных составляет от 6 до 24 кбит/с.

3). Для передачи речи с высоким и средним качеством используется метод кодирования CELP (Code Excited Linear Predictive - кодирование возбуждений с линейным предсказанием), который обеспечивает скорости передачи 6...24 кбит/с при частотах дискретизации 8 кГц или 16 кГц.

4). Параметрическое кодирование речи по методу HVXC (Harmonic Vector eXitation Coding - кодирование возбуждений гармоническими векторами), которое обеспечивает сжатие при сохранении разборчивости до скоростей 2...4 кбит/с и даже до 1,2 кбит/с при частоте дискретизации 8 кГц.

5). Самые низкие скорости передачи 0,2...1,2 кбит/с достигаются для искусственно синтезированной речи. Для этого в MPEG-4 имеется интерфейс преобразования текста в речь TTSI (Text-to-Speech Interface), который позволяет передавать описание речи в виде последовательности фонем (звукосочетаний) с указаниями особенностей их произнесения (ударения, длительности и т.д.). По этим данным в декодере синтезируется речь, которая синхронизируется с анимацией изображения лица.

6). Музыка также может передаваться в виде описания и синтезироваться в декодере. Для описания звучания музыкальных инструментов в MPEG-4 дан специальный язык SAOL (Structured Audio Orchestra Language - язык структурированного звукового оркестра). Каждый инструмент представляется как небольшой набор средств обработки сигналов, позволяющий создавать специфический для данного инструмента звук. Описания музыкальных инструментов загружаются в декодер из принимаемого потока данных и могут храниться в нем для последующего использования.

Для описания собственно музыки передается описание оркестровки, т.е. команды и данные, по которым осуществляется синтез звуков, соответствующих разным инструментам. Оркестровка описывается с помощью особого языка SASL (Structured Audio Score Language - язык структурированной звуковой оркестровки). Допускается также использование широко известного протокола описания синтезируемой музыки MIDI.

Отметим, что для синтезированных речи и музыки в MPEG-4 задаются именно языки их описания, а не сами алгоритмы синтеза, которые могут быть различными.

Кодирование аудиообъектов также обладает свойством масштабируемости. Например, на базовом уровне может использоваться метод кодирования CELP, а дополнительный уровень обеспечивает качество звука, соответствующее кодированию по MPEG-2 ААС.

Более сложный и дорогой декодер может декодировать базовый и дополнительные слои потока данных и позволяет получать более высокое качество воспроизводимого звука, чем более простой и дешевый декодер, воспринимающий только базовый слой. [5.3]

5.1 http://marklv.narod.ru/book/codir.htm

5.2 http://www.eparh-chb.ru/kodirovanie-videoobektov.html

5.3 http://www.eparh-chb.ru/kodirovanie-audioobektov.html

1 | 2 |

Поиск по сайту:

Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.024 сек.)

Главная | О проекте | Полезные cсылки | Контакты | Случайная страница