2648945 - Декодирующее устройство, способ декодирования, кодирующее устройство, способ кодирования и программа

Декодирующее устройство, способ декодирования, кодирующее устройство, способ кодирования и программа

Иллюстрации

Показать все

Изобретение относится к кодированию и аудиоданных. Технический результат изобретения заключается в получении высококачественного реалистичного звучания при понижающем микшировании многоканальных аудиоданных. Декодирующее устройство содержит модуль декодирования для декодирования аудиоданных множества каналов, модуль считывания информации, указывающей, использовать ли аудиоданные определенного канала для понижающего микширования и информации о понижающем микшировании, указывающей какой-либо из множества способов понижающего микширования. При этом каждый из способов выполнен с возможностью вычисления аудиоданных второго числа каналов на основе аудиоданных первого числа каналов в соответствии с различными математическими выражениями. 6 н. и 3 з.п. ф-лы, 40 ил.

Реферат

Область техники, к которой относится изобретение

Настоящее изобретение относится к декодирующему устройству, способу декодирования, кодирующему устройству, способу кодирования и программе и, более конкретно, к декодирующему устройству, способу декодирования, кодирующему устройству, способу кодирования и программе, позволяющим получить высококачественное реалистичное звучание.

Уровень техники

В последние годы во всех странах мира появились сервисы распространения кинофильмов, цифровое телевизионное вещание и архивирование следующего поколения. В дополнение к известному стереофоническому вещанию началось внедрение звукового вещания, соответствующего множеству каналов, таких как каналы стандарта 5.1.

Для дальнейшего усовершенствования качества изображения проводятся исследования в области телевидения высокой четкости с увеличенным числом пикселей. На основе результатов исследований телевидения высокой четкости следующего поколения можно ожидать, что совокупность каналов может быть расширена до множества каналов сверх каналов 5.1 в горизонтальном направлении и в вертикальном направлении в поле обработки звука для достижения реалистичного звучания.

Для кодирования аудиоданных предложен способ, группирующий несколько окон из разных каналов в некоторое число ячеек - "плиток" с повышенной эффективностью кодирования (например, см. Патентный документ 1).

Список литературы

Патентная литература

Патентный документ 1: JP 2010-217900 А

Раскрытие изобретения

Проблемы, решаемые изобретением

Однако при использовании упомянутого выше способа трудно получить высококачественное реалистичное звучание.

Например, при многоканальном кодировании на основе стандарта Усовершенствованного аудиокодирования Группы экспертов по кинематографии (Moving Picture Experts Group-2 Advanced Audio Coding (MPEG-2AAC)) и на основе стандарта MPEG-4AAC, являющихся международными стандартами, определены только расположение громкоговорителей в горизонтальном направлении и информация о понижающем микшировании с уменьшением числа каналов для преобразования от стандарта 5.1 каналов в стереоканалы. Поэтому трудно реагировать в достаточной степени на протяженность каналов в плоскости и в вертикальном направлении.

Предлагаемый способ разработан с учетом упомянутых выше проблем и позволяет получить высококачественное реалистичное звучание.

Решение проблем

Декодирующее устройство согласно первому аспекту настоящего изобретения содержит декодирующий модуль для декодирования аудиоданных от множества каналов, входящих в состав кодированного потока битов данных, модуль считывания для считывания информации о понижающем микшировании, указывающую на какой-либо из способов понижающего микширования, из кодированного потока битов данных, и устройство понижающего микширования для осуществления понижающего микширования декодированных аудиоданных с использованием способа понижающего микширования, указанного информацией о понижающем микшировании.

Модуль считывания может также считывать информацию, указывающую, нужно ли использовать аудиоданные какого-либо конкретного канала для понижающего микширования, из кодированного потока битов данных, а устройство понижающего микширования может осуществлять понижающее микширование декодированных аудиоданных на основе указанной информации и информации о понижающем микшировании.

Устройство понижающего микширования может осуществлять понижающее микширование применительно к аудиоданным от заданного числа каналов и может далее осуществлять понижающее микширование аудиоданных из заданного числа каналов на основе информации о понижающем микшировании.

Устройство понижающего микширования может регулировать коэффициент усиления аудиоданных, получаемых в результате понижающего микширования к числу каналов, и осуществляет понижающее микширование с уменьшением числа каналов на основе информации о понижающем микшировании и в соответствии с величиной коэффициента усиления, вычисленной на основе величины коэффициента усиления для регулировки усиления при понижающем микшировании к заданному числу каналов и величины коэффициента усиления для регулировки усиления при понижающем микшировании в соответствии с информацией о понижающем микшировании.

Способ декодирования или программа согласно первому аспекту настоящего изобретения содержит этап декодирования аудиоданных из множества каналов, входящих в состав кодированного потока битов данных, этап считывания информации о понижающем микшировании, указывающей на какой-либо из множества способов понижающего микширования, из кодированного потока битов данных, и этап понижающего микширования декодированных аудиоданных с уменьшением числа каналов с использованием способа понижающего микширования, указанного информацией о понижающем микшировании.

Согласно первому аспекту настоящего изобретения декодируют аудиоданные из множества каналов кодированного потока битов данных. Из кодированного потока битов данных считывают информацию о понижающем микшировании, указывающую какой-либо из множества способов понижающего микширования с уменьшением числа каналов. После этого выполняют микширование декодированных аудиоданных посредством способа понижающего микширования, указанного информацией о понижающем микшировании.

Кодирующее устройство согласно второму аспекту настоящего изобретения содержит кодирующий модуль для кодирования аудиоданных из множества каналов и информацию о понижающем микшировании, указывающую какой-либо из множества способов понижающего микширования, и модуль упаковки для хранения кодированных аудиоданных и кодированной информации о понижающем микшировании в заданной области и генерирования кодированного потока битов данных.

Указанный кодированный поток битов данных может дополнительно содержать информацию, указывающую, нужно ли использовать аудиоданные какого-либо конкретного канала для понижающего микширования с уменьшением числа каналов, так что микширование аудиоданных с уменьшением числа каналов может осуществляться на основе этой информации и информации о понижающем микшировании.

Информация о понижающем микшировании может представлять собой информацию о понижающем микшировании с уменьшением числа каналов применительно к аудиоданным заданного числа каналов, а кодированный поток битов данных может дополнительно содержать информацию о понижающем микшировании декодированных аудиоданных для преобразования в аудиоданные заданного числа каналов.

Способ или программа кодирования согласно второму аспекту настоящего изобретения содержит этап кодирования аудиоданных из множества каналов и информации о понижающем микшировании, указывающей какой-либо из множества способов понижающего микширования с уменьшением числа каналов, и этап сохранения кодированных аудиоданных и кодированной информации о понижающем микшировании в заданной области и генерировании кодированного потока битов данных.

Согласно второму аспекту настоящего изобретения кодируют аудиоданные из множества каналов и информацию о понижающем микшировании, указывающую какой-либо из нескольких способов понижающего микширования с уменьшением числа каналов. Кодированные аудиоданные и кодированную информацию о понижающем микшировании сохраняют в заданной области и генерируют кодированный поток битов данных.

Преимущества изобретения

Согласно первому и второму аспектам настоящего изобретения можно получить высококачественное реалистичное звучание.

Краткое описание чертежей

Фиг.1 представляет схему, иллюстрирующую расположение громкоговорителей.

Фиг.2 представляет таблицу, иллюстрирующую пример расшифровки обозначений громкоговорителей.

Фиг.3 представляет схему, иллюстрирующую кодированный поток битов данных.

Фиг.4 представляет таблицу, иллюстрирующую синтаксис элемента height_extension_element.

Фиг.5 представляет таблицу, иллюстрирующую высоты расположения громкоговорителей.

Фиг.6 представляет таблицу, иллюстрирующую синтаксис вспомогательных данных согласно стандарту MPEG4.

Фиг.7 представляет таблицу, иллюстрирующую синтаксис параметра bs_info().

Фиг.8 представляет таблицу, иллюстрирующую синтаксис параметра ancillary_data_status().

Фиг.9 представляет таблицу, иллюстрирующую синтаксис параметра downmixing_levels_MPEG4().

Фиг.10 представляет таблицу, иллюстрирующую синтаксис параметра audio_coding_mode().

Фиг.11 представляет таблицу, иллюстрирующую синтаксис параметра MPEG4_ext_anci 11 ary_data().

Фиг.12 представляет таблицу, иллюстрирующую синтаксис параметра ext_ancillary_data_status().

Фиг.13 представляет таблицу, иллюстрирующую синтаксис параметра ext_downmixing_levels().

Фиг.14 представляет таблицу, иллюстрирующую целевые объекты, к которым применяется каждый коэффициент.

Фиг.15 представляет таблицу, иллюстрирующую синтаксис параметра ext_downmixing_global_gains().

Фиг.16 представляет таблицу, иллюстрирующую синтаксис параметра ext_downmixing_lfe_level().

Фиг.17 представляет таблицу, иллюстрирующую понижающее микширование.

Фиг.18 представляет таблицу, иллюстрирующую коэффициент, определяемый для параметра dmix_lfe_idx.

Фиг.19 представляет таблицу, иллюстрирующую коэффициенты, определяемые для параметров dmix_a_idx и dmix_b_idx.

Фиг.20 представляет таблицу, иллюстрирующую синтаксис параметра drc_presentation_mode.

Фиг.21 представляет таблицу, иллюстрирующую параметр drc_presentation_mode.

Фиг.22 представляет схему, показывающую пример структуры кодирующего устройства.

Фиг.23 представляет логическую схему, иллюстрирующую процесс кодирования.

Фиг.24 представляет схему, показывающую пример структуры декодирующего устройства.

Фиг.25 представляет логическую схему, иллюстрирующую процесс декодирования.

Фиг.26 представляет схему, показывающую пример структуры кодирующего устройства.

Фиг.27 представляет логическую схему, иллюстрирующую процесс кодирования.

Фиг.28 представляет схему, показывающую пример декодирующего устройства.

Фиг.29 представляет схему, показывающую пример структуры устройства понижающего микширования.

Фиг.30 представляет схему, показывающую пример структуры модуля понижающего микширования.

Фиг.31 представляет схему, показывающую пример структуры модуля понижающего микширования.

Фиг.32 представляет схему, показывающую пример структуры модуля понижающего микширования.

Фиг.33 представляет схему, показывающую пример структуры модуля понижающего микширования.

Фиг.34 представляет схему, показывающую пример структуры модуля понижающего микширования.

Фиг.35 представляет схему, показывающую пример структуры модуля понижающего микширования.

Фиг.36 представляет логическую схему, иллюстрирующую процесс декодирования.

Фиг.37 представляет логическую схему, иллюстрирующую процесс реорганизации данных.

Фиг.38 представляет логическую схему, иллюстрирующую процесс реорганизации данных.

Фиг.39 представляет логическую схему, иллюстрирующую процесс понижающего микширования.

Фиг.40 представляет схему, показывающую пример структуры компьютера.

Осуществление изобретения

Далее, варианты предлагаемой технологии будут описаны со ссылками на перечисленные чертежи.

Первый вариант

Краткое описание предлагаемой технологии

Сначала будет дано общее краткое описание предлагаемой технологии.

Настоящее изобретение относится к кодированию и декодированию аудиоданных.

Например, при многоканальном кодировании на основе стандарта MPEG-2AAC или MPEG-4AAC трудно получить информацию о протяженности каналов в горизонтальной плоскости и в вертикальном направлении.

При многоканальном кодировании отсутствует информация о понижающем микшировании применительно к содержанию расширенных каналов и не известен подходящий коэффициент смешивания каналов. Поэтому портативному устройству с небольшим числом воспроизводимых каналов трудно воспроизводить звук.

Предлагаемая технология позволяет получать высококачественное реалистичное звучание с использованием следующих характеристик с (1) по (4),

(1) Информация о расположении громкоговорителей в вертикальном направлении записана в области комментариев в элементе конфигурации РСЕ (Program_config_element), определенном в существующем стандарте ААС.

(2) В случае характеристики (1), чтобы отличать открытые комментарии от информации о расположении громкоговорителей в вертикальном направлении, используют два кодируемых на стороне кодирующего устройства элемента идентификационной информации, а именно слово синхронизации и циклически избыточный контрольный код (CRC), а декодирующее устройство сравнивает эти два элемента идентификационной информации. Когда эти два элемента идентификационной информации идентичны один другому, декодирующее устройство принимает информацию о расположении громкоговорителей.

(3) Информацию о понижающем микшировании аудиоданных записывают в области вспомогательных данных (DSE (data_stream_element)).

(4) Процедура понижающего микширования для преобразования сигналов от стандарта 6.1 каналов или 7.1 каналов к стандарту 2 каналов представляет собой двухступенчатую процедуру обработки данных, содержащую этап понижающего микширования от стандарта 6.1 каналов или 7.1 каналов к стандарту 5.1 каналов и этап понижающего микширования от стандарта 5.1 каналов к стандарту 2 каналов.

В такой ситуации использование информации о расположении громкоговорителей в вертикальном направлении делает возможным воспроизведение звукового изображения в вертикальном направлении, в дополнение к изображению в плоскости, и воспроизведение более реалистичного звучания, чем это возможно при использовании множества каналов в плоскости в соответствии с известными способами.

Кроме того, при передаче информации о понижающем микшировании от стандарта 6.1 каналов или стандарта 7.1 каналов к стандарту 5.1 каналов или 2 каналов использование одного кодирующего элемента данных делает возможным воспроизведение звука с числом каналов, наиболее подходящим для каждой среды, где происходит воспроизведение. В декодирующем устройстве в известных системах, не соответствующих предлагаемой технологии, информацию в вертикальном направлении игнорируют, как открытые комментарии, и декодируют аудиоданные. Таким образом, совместимость не пострадала.

О расположении громкоговорителей

Далее будет описано расположение громкоговорителей при воспроизведении аудиоданных.

Например, предположим, что, как показано на фиг.1, пользователь смотрит на экран отображения TVS устройства, такого как телевизор, спереди. Иными словами, предположим, что пользователь находится перед экраном отображения TVS, показанным на фиг.1.

В этой ситуации, предположим, что вокруг пользователя расположены 13 громкоговорителей, а именно Lvh, Rvh, Lrs, Ls, L, Lc, C, Rc, R, Rs, Rrs, Cs и LFE.

В дальнейшем каналы аудиоданных (звуки), воспроизводимые громкоговорителями Lvh, Rvh, Lrs, Ls, L, Lc, C, Rc, R, Rs, Rrs, Cs и LFE, будут именоваться Lvh, Rvh, Lrs, Ls, L, Lc, C, Rc, R, Rs, Rrs, Cs и LFE, соответственно.

Как показано на фиг.2, канал L представляет собой "Передний левый" ("Front Left"), канал R представляет собой "Передний правый" ("Front Right") и канал С представляет собой "Передний центральный" ("Front Center").

Кроме того, канал Ls представляет собой "Левый окружной" ("Left Surround"), канал Rs представляет собой "Правый окружной" ("Right Surround"), канал Lrs представляет собой "Левый задний" ("Left Rear"), канал Rrs представляет собой "Правый задний" ("Right Rear") и канал Cs представляет собой "Центральный задний" ("Center Back").

Канал Lvh представляет собой "Левый верхний передний" ("Left High Front"), канал Rvh представляет собой "Правый верхний передний" ("Right High Front") и канал LFE представляет собой канал "Канал низкочастотных эффектов" ("Low-Frequency-Effect").

Возвращаясь к фиг.1, громкоговоритель Lvh и громкоговоритель Rvh расположены на левой и правой сторонах, соответственно, спереди от пользователя. Уровень, на котором расположены громкоговорители Rvh и Lvh, называется "верхний уровень".

Громкоговорители L, С и R расположены соответственно слева, в центре и справа от пользователя. Громкоговорители Lc и Rc расположены между громкоговорителями L и С и между громкоговорителями R и С, соответственно. Кроме того, громкоговорители Ls и Rs расположены на левой и правой сторонах от пользователя, соответственно, а громкоговорители Lrs, Rrs и Cs расположены сзади слева, сзади справа и сзади от пользователя, соответственно.

Громкоговорители Lrs, Ls, L, Lc, С, Rc, R, Rs, Rrs и Cs расположены в плоскости, лежащей по существу на высоте ушей пользователя так, чтобы окружать пользователя. Уровень, на котором расположены эти громкоговорители, называется "средний уровень".

Громкоговоритель LFE канала низкочастотных эффектов находится с передней нижней стороны от пользователя, а уровень, на котором расположен этот громкоговоритель LFE, так и называется "уровень LFE" ("LFE layer").

О кодированном потоке битов данных

Когда кодируют аудиоданные в каждом канале, получают кодированный поток битов данных, показанный, например, на фиг.3. Иными словами, фиг.3 иллюстрирует синтаксис кодированного потока битов данных для кадра по стандарту ААС.

Кодированный поток битов данных, показанный на фиг.3, содержит поля и элементы "Header/sideinfo", "РСЕ", "SCE", "СРЕ", "LFE", "DSE", "FIL(DRC)" и "FIL(END)". В этом примере кодированный поток битов данных содержит три элемента "СРЕ".

Например, элемент "РСЕ" содержит информацию о каждом канале аудиоданных. В этом примере элемент "РСЕ" содержит параметр "Matrix-mixdown", представляющий собой информацию о понижающем микшировании аудиоданных, и элемент "Информация о высоте" ("Height Infomation"), представляющий собой информацию о расположении громкоговорителей. Кроме того, элемент "РСЕ" содержит параметр "comment_field_data", представляющий собой область комментариев (поле комментариев), которое может сохранять произвольные комментарии, причем параметр "comment_field_data" содержит элемент "height_extension_element", представляющий расширенную область. Область комментариев может иметь произвольные данные, такие как открытые комментарии. Указанный элемент "height_extension_element" содержит элемент "Height Infomation", представляющий собой информацию о высоте, на которой расположены громкоговорители.

Элемент "SCE" содержит аудиоданные единственного канала, элемент"СРЕ" содержит аудиоданные пары, т.е. двух, каналов и элемент "LFE" содержит аудиоданные, например, канала LFE. Например, элемент "SCE" сохраняет аудиоданные канала С или Cs и элемент "СРЕ" содержит аудиоданные канала L или R, либо канала Lvh или Rvh.

Кроме того, элемент "DSE" представляет собой область вспомогательных данных. Элемент "DSE" сохраняет произвольные данные. В этом примере, элемент "DSE" содержит в качестве информации о понижающем микшировании аудиоданных поля «Понижающее микширование от 5.1 к 2» ("Downmix 5.1ch to 2ch"), «Управление динамическим диапазоном» ("Dynamic Range Control"), «Режим представления DRC» ("DRC Presentation Mode"), «Понижающее микширование от 6.1 и 7.1 к 5.1» ("Downmix 6.1ch and 7.1ch to 5.1ch"), «Понижающее микширование с глобальным коэффициентом усиления» ("global gain downmixing") и «Понижающее микширование LFE»" ("LFE downmixing").

Кроме того, элемент "FIL(DRC)" содержит информацию об управлении динамическим диапазоном звуков. Например, элемент "FIL(DRC)" содержит параметры «Опорный уровень программы» ("Program Reference Level") и «Управление динамическим диапазоном» ("Dynamic Range Control").

О поле комментариев

Как описано выше, поле "comment_field_data" элемента "РСЕ" содержит элемент "height_extension_element". Поэтому многоканальное воспроизведение обеспечивается с применением информации о расположении громкоговорителей в вертикальном направлении. Иными словами, громкоговорители, расположенные на каждом уровне, таком как «Верхний уровень» или «Средний уровень», воспроизводят высококачественный реалистичный звук.

Например, как показано на фиг.4, элемент "height_extension_element" содержит слово синхронизации, чтобы отличать эту информацию от других открытых комментариев. Иными словами, фиг.4 представляет таблицу, иллюстрирующую синтаксис элемента height_extension_element.

На фиг.4 параметр "PCE_HEIGHT_EXTENSION_SYNC" обозначает слово синхронизации.

Кроме того, параметры "front_element_height_info [i]", "side_element_height_info [i]" и "back_element_height_info [i]" указывают высоты расположения громкоговорителей, находящихся спереди, сбоку и сзади от наблюдателя, т.е. уровни.

Далее, параметр "byte_alignment()" обозначает выравнивание байтов, а параметр "height_info_crc_check" указывает циклически избыточный контрольный код CRC, используемый в качестве идентификационной информации. Кроме того, контрольный код CRC вычисляют на основе информации, считываемой между параметрами "PCE_HEIGHT_EXTENSION_SYNC" и Mbyte_alignment()", иными словами в последовательности, содержащей слово синхронизации, информацию о расположении каждого громкоговорителя (информацию о каждом канале) и данные о выравнивании байтов. Затем определяют, идентичен ли вычисленный контрольный код CRC контрольному коду CRC, указанному в параметре "height_info_crc_check". Когда указанные контрольные коды CRC идентичны один другому, определяют, что информация о расположении каждого громкоговорителя прочитана правильно. Кроме того, параметр "crc_cal()!=height_info_crc_check" обозначает результат сравнения контрольных кодов CRC.

Кроме того, параметры "front_element_height_info [i]" и "back_element_height_info [i]", представляющие собой информацию о позициях источников звука, иными словами, о расположении (высоте) громкоговорителей, задают, как показано на фиг.5.

Иными словами, когда информация о параметрах "front_element_height_info [i]", "side_element_height_info [i]" и "back_element_height_info [i]" равна "0", "1" и "2", высоты расположения громкоговорителей соответствуют «Нормальной высоте», «Верхнему громкоговорителю» и «Нижнему громкоговорителю». Иными словами, уровни, на которых расположены громкоговорители, являются «Средним уровнем», «Верхним уровнем» и «Уровнем LFE». Об элементе DSE

Далее будет описана область «Вспомогательные данные MPEG4», представляющая собой область вспомогательных данных, входящую в элемент "DSE", иными словами, "data_stream_byte []" из состава элемента "data_stream_element()". Эта область «Вспомогательные данные MPEG4» ("MPEG4 ancillary data") может обеспечивать управление динамическим диапазоном (DRC) при понижающем микшировании от стандарта 6.1 каналов или 7.1 каналов к стандарту 5.1 каналов или 2 канала.

Фиг.6 представляет таблицу, иллюстрирующую синтаксис этой области вспомогательных данных согласно стандарту MPEG4. Указанная область «Вспомогательные данные MPEG4» содержит параметры "bs_info()", "ancillary_data_status()", "downmixing_levels_MPEG4()", "audio_coding_mode()", "Compression_value" и "MPEG4_ext_ancillary_data()".

Здесь параметр "Compression_value" соответствует полю "Управление динамическим диапазоном" ("Dynamic Range Control"), показанному на фиг.3. Кроме того, синтаксис параметров "bs_info()", "ancillary_data_status()", "downmixing_levels_MPEG4()", "audio_coding_mode()" и "MPEG4_ext_ancillary_data()" показан на фиг.7-11, соответственно.

Например, как показано на фиг.7, параметр "bs_info()" содержит параметры "mpeg_audio_type", "dolby_surround_mode", "drc_presentation_mode" и "pseudo_surround_enable".

Кроме того, параметр "drc_presentation_mode" соответствует параметру «Режим представления управления динамическим диапазоном» ("DRC Presentation Mode"), показанному на фиг.3. Далее, параметр "pseudo_surround_enable" содержит информацию, указывающую процедуру понижающего микширования от стандарта 5.1 каналов к стандарту 2 канала, иными словами, информацию, указывающую один из множества способов микширования с уменьшением числа каналов, который нужно использовать для понижающего микширования.

Например, процедура зависит от того, равен ли параметр "ancillary_data_extension_status", входящий в состав параметра "ancillary_data_status()", изображенного на фиг.8, 0 или 1. Когда napaMeTp"ancillary_data_extension_status" равен 1, осуществляется доступ к параметру "MPEG4_ext_ancillary_data()" в области «Вспомогательных данных MPEG4», показанной на фиг.6, и выполняется управление динамическим диапазоном DRC при понижающем микшировании. С другой стороны, когда параметр "ancillary_data_extension_status" равен 0, осуществляется процедура согласно известным технологиям. Такой подход позволяет обеспечить совместимость с существующими стандартами.

Кроме того, параметр "downmixing_levels_MPEG4_status", входящий в состав параметра "ancillary_data_status()", показанного на фиг.8, представляет собой информацию для назначения коэффициента (пропорции понижающего микширования), используемого при понижающем микшировании от стандарта 5.1 каналов к 2 каналам. Иными словами, когда параметр "downmixing_levels_MPEG4_status" равен 1, для понижающего микширования используется коэффициент, определенный информацией, записанной в параметре "downmixing_levels_MPEG4()", показанном на фиг.9.

Кроме того, параметр "downmixing_levels_MPEG4()", показанный на фиг.9, содержит параметры "center_mix_level_value" и "surround_mix_level_value" в качестве информации, задающей коэффициент понижающего микширования. Например, значения коэффициентов, соответствующих параметрам "center_mix_level_value" и "surround_mix_level_value", определены в показанной на фиг.19 таблице, которая будет рассмотрена ниже.

Кроме того, параметр "dovvnmixing_levels_MPEG4()", показанный на фиг.9, соответствует полю «Понижающего микширования от 5.1 к 2», изображенному на фиг.3.

Далее, параметр "MPEG4_ext_ancillary_data()", показанный на фиг.11, содержит параметры "ext_ancillary_data_status()", "ext_downmixing_levels()",

"ext_downmixing_global_gains()" и "ext_downmixing_lfe_level()".

Информация, необходимая для увеличения числа каналов, чтобы аудиоданные стандарта 5.1 каналов расширить до аудиоданных стандартов 7.1 каналов или 6.1 каналов, сохранена в параметре "MPEG4_ext_ancillary_data()".

В частности, параметр "ext_ancillary_data_status()" содержит информацию (флаг), указывающую, следует ли осуществлять понижающее микширование каналов от стандарта более 5.1 каналов к стандарту 5,1 канала, информацию, нужно ли производить регулировку коэффициента усиления в процессе понижающего микширования, и информацию, указывающую, следует ли использовать канал LFE при понижающем микшировании.

Информацию, задающую коэффициент (пропорцию понижающего микширования), используемый при понижающем микшировании, сохраняют в параметре "ext_downmixing_levels()", а информацию, относящуюся к коэффициенту усиления в процессе регулировки усиления, сохраняют в параметре "ext_downmixing_global_gains()". Информацию, задающую коэффициент (пропорцию понижающего микширования) для сигнала канала LEF, используемый при понижающем микшировании, сохраняют в параметре "ext_dovvnmixing_lfe_level()".

В частности, например, синтаксис параметра "ext_ancillary_data_status()" показан на фиг.12. Параметры "ext_ancillary_data_status()", "ext_downmixing_levels_status" указывают, нужно ли выполнять понижающее микширование от стандарта 6.1 каналов или стандарта 7.1 каналов к стандарту 5.1 каналов. Иными словами, параметр "ext_dovvnmixing_levels_status" указывает, присутствует ли параметр "ext_dovvnmixing_levels()". Параметр "ext_downmixing_levels_status" соответствует параметру «Микширование от 6.1 и 7.1 к 5.1», показанному на фиг.3.

Кроме того, параметр "ext_dovvnmixing_global_gains_status" указывает, нужно ли осуществлять глобальную регулировку усиления, и соответствует параметру «понижающее микширование с глобальным коэффициентом усиления», показанному на фиг.3. Иными словами, параметр "ext_downmixing_global_gains_status" обозначает, присутствует ли параметр "ext_downmixing_global_gains()". Кроме того, параметр "ext_downmixing_lfe_level_status" указывает, нужно ли использовать канал LFE во время понижающего микширования от стандарта 5.1 каналов к стандарту 2 каналов, и соответствует параметру «Микширование с использованием канала LFE», показанному на фиг.3.

Синтаксис параметра "ext_downmixing_levels()" в составе параметра "MPEG4_ext_ancillary_data()", показанного на фиг.11, соответствует тому, что представлено на фиг.13, а параметры "dmix_a_idx" и "dmix_b_idx", изображенные на фиг.13, представляют собой информацию, указывающую пропорцию понижающего микширования (коэффициент) во время понижающего микширования для уменьшения числа каналов.

Фиг.14 иллюстрирует соответствие между параметрами "dmix_a_idx" и "dmix_b_idx", определяемое параметром "ext_dovvnmixing_levels()", и компоненты, к которым применяются параметры "dmix_a_idx" и "dmix_b_idx", когда происходит понижающее микширование аудиоданных от стандарта 7.1.

Синтаксис параметров "ext_downmixing_global_gains()" и "ext_downmixing_lfe_level()" в составе параметра "MPEG4_ext_ancillary_data()", показанного на фиг.11, изображен на фиг.15 и 16.

Например, параметр "ext_downmixing_global_gains()", показанный на фиг.15, содержит параметр "dmx_gain_5_sign", указывающий знак коэффициента усиления при понижающем микшировании к стандарту 5.1. каналов, параметр "dmx_gain_5_idx", указывающий величину коэффициента усиления при понижающем микшировании, параметр "dmx_gain_2_sign", указывающий знак коэффициента усиления при понижающем микшировании к стандарту 2 каналов, и параметр dmx_gain_2_idx", указывающий величину коэффициента усиления при понижающем микшировании.

Кроме того, параметр "ext_downmixing_lfe_level()", показанный на фиг.16, содержит параметры "dmix_lfe_idx" и "dmix_lfe_idx" в качестве информации, задающей пропорцию понижающего микширования (коэффициент) для канала LFE в процессе понижающего микширования с уменьшением числа каналом.

О понижающем микшировании

Кроме того, параметр "pseudo_surround_enable" в составе синтаксиса параметра "bs_info()", изображенного на фиг.7, обозначает процедуру понижающего микширования для уменьшения числа каналов и процедуру, показанную на фиг.17. Здесь фиг.17 иллюстрирует две процедуры - случай, когда параметр "pseudo_surround_enable" равен 0, и случай, когда параметр "pseudo_surround_enable" равен 1

Далее будет описана процедура понижающего микширования аудиоданных для уменьшения числа каналов.

Сначала будет рассмотрена процедура понижающего микширования от стандарта 5.1 каналов к стандарту 2 каналов. В этом случае, когда канал L и канал R превращаются после понижающего микширования в канал L' и канал R', соответственно, выполняется следующая процедура.

Другими словами, когда параметр "pseudo_surround_enable" равен 0, аудиоданные в канале L' и в канале R' вычисляют с использованием следующего Выражения (1).

Другими словами, когда параметр "pseudo_surround_enable" равен 1, аудиоданные в канале L' и в канале R' вычисляют с использованием следующего Выражения (2).

В Выражении (1) и Выражении (2) L, R, С, Ls, Rs и LFE представляют собой каналы, составляющие совокупность каналов стандарта 5.1, и являются каналами L, R, С, Ls, Rs и LFE, которые были описаны со ссылками на фиг.1 и 2, соответственно.

В Выражении (1) и Выражении (2), "с" представляет собой константу, определяемую величиной параметра "dmix_lfe_idx" в составе параметра "ext_downmixing_lfe_level()", изображенного на фиг.16. Например, величины этой константы "с", соответствующие каждому значению параметра "dmix_lfe_idx", приведены на фиг.18. В частности, когда параметр "ext_downmixing_lfe_level_status" в составе параметра "ext_ancillary_data_status()", изображенного на фиг.12, равен 0, канал LFE не используется для вычисления Выражения (1) и Выражения (2). Когда параметр "ext_downmixing_lfe_level_status" равен 1, величину константы "с", умножаемой на данные канала LFE, определяют на основе таблицы, показанной на фиг.18.

В Выражении (1) и Выражении (2), "а" и "b" представляют собой константы, определяемые величинами параметров "dmix_a_idx" и "dmix_b_idx" в составе параметра "ext_dovvnmixing_levels()", показанного на фиг.13. Кроме того, в Выражении (1) и Выражении (2), "а" и "b" могут быть константами, определяемыми величинами параметров "center_mix_level_value" и "surround_mix_level_value" в составе параметра "downmixing_levels_MPEG4()", показанного на фиг.9.

Например, величины констант "а" и "b" относительно величин параметров "dmix_a_idx" H"dmix_b_idx" или величин параметров "center_mix_level_value" и "surround_mix_level_value", показаны на фиг.19. В этом примере, поскольку одна и та же таблица относится и к паре параметров "dmix_a_idx" и "dmix_b_idx", и к паре параметров "center_mix_level_value" и "surround_mix_level_value", константы (коэффициенты) "а" и "b" для понижающего микширования с уменьшением числа каналов имеют одинаковую величину.

Затем, будет рассмотрена процедура понижающего микширования от стандарта 7.1 каналов или стандарта 6.1 каналов к стандарту 5,1 каналов.

Когда аудиоданные совокупности каналов С, L, R, Ls, Rs, Lrs, Rrs и LFE, содержащей каналы Lrs и Rrs, громкоговорители которых расположены сзади пользователя, преобразуют в аудиоданные стандарта 5.1. каналов, содержащие данные каналов С, L', R', Ls', Rs' и LFE', вычисления производят в соответствии со следующим Выражением (3). Здесь, каналы С, L',R', Ls', Rs' и LFE' обозначает каналы С, L, R, Ls, Rs и LFE, соответственно, после понижающего микширования с уменьшением числа каналов. Кроме того, в Выражении (3), С, L, R, Ls, Rs, Lrs, Rrs и LFE обозначают аудиоданные каналов С, L, R, Ls, Rs, Lrs, Rrs и LFE.

В Выражении (3) d1 и d2 являются константами. Например, величины этих констант d1 и d2 определены для значений параметров "dmix_a_idx" и "dmix_b_idx", приведенных на фиг.19.

Когда аудиоданные совокупности каналов С, L, R, Lc, Rc, Ls, Rs и LFE, содержащей каналы Lc и Rc, громкоговорители которых расположены спереди от пользователя, преобразуют в аудиоданные стандарта 5.1. каналов, содержащие данные каналов С, L', R', Ls', Rs' и LFE', вычисления производят в соответствии со следующим Выражением (4). Здесь, каналы С, L',R', Ls', Rs' и LFE' обозначает каналы С, L, R, Ls, Rs и LFE, соответственно, после понижающего микширования. Кроме того, в Выражении (4), С, L, R, Lc, Rc, Ls, Rs и LFE обозначают аудиоданные каналов С, L, R, Lc, Rc, Ls, Rs и LFE.

В Выражении (4) e1 и e2 являются константами. Например, величины этих констант e1 и е2 определены для значений параметров "dmix_a_idx" и "dmix_b_idx", приведенных на фиг.19.

Когда аудиоданные совокупности каналов С, L, R, Lvh, Rvh, Ls, Rs и LFE, содержащей каналы Rvh и Lvh, громкоговорители которых расположены спереди сверху от пользователя, преобразуют в аудиоданные стандарта 5.1 каналов, содержащие данные каналов С, L', R', Ls', Rs' и LFE', вычисления производят в соответствии со следующим Выражением (5). Здесь, каналы С, L',R', Ls', Rs' и LFE' обозначает каналы С, L, R, Ls, Rs и LFE, соответственно, после понижающего микширования. Кроме того, в Выражении (5), С, L, R, Lvh, Rvh, Ls, Rs и LFE обозначают аудиоданные каналов С, L, R, Lvh, Rvh, Ls, Rs и LFE.

В Выражении (5) f1 и f2 являются константами. Например, величины этих констант f1 и f2 определены для значений параметров "dmix_a_idx" и "dmix_b_idx", приведенных на фиг.19.

При осуществлении понижающего микширования от стандарта 6.1 каналов к стандарту 5,1 каналов выполняется следующая процедура. Иными словами, когда аудиоданные совокупности каналов С, L, R, Ls, Rs, Cs и LFE преобразуют в аудиоданные стандарта 5.1 каналов, содержащие данные каналов С, L', R', Ls', Rs' и LFE', вычисления производят в соответствии со следующим Выражением (6). Здесь, каналы С, L',R', Ls', Rs' и LFE' обозначает каналы С, L, R, Ls, Rs и LFE, соответственно, после понижающего микширования. Кроме того, в Выражении (6) С, L, R, Ls, Rs, Cs и LFE обозначают аудиоданные каналов С, L, R, Ls, Rs, Cs и LFE.

В Выражении (6) g1 и g2 являются константами. Например, величины этих констант g1 и g2 определены для значений параметров "dmix_a_idx" и "dmix_b_idx", приведенных на фиг.19.

Далее будет описан глобальный коэффициент усиления для коррекции громкости во время понижающего микширования с уменьшением числа каналов.

Глобальный коэффициент усиления во время понижающего микширования с уменьшением числа каналов используется для коррекции громкости звучания, которая увеличивается или уменьшается в ходе понижающего микширования. Здесь параметр dmx_gain5 обозначает величину коррекции при понижающем микшировании от стандарта 7.1 каналов или стандарта 6.1 каналов к стандарту 5,1 каналов, а параметр dmx_gain2 обозначает величину коррекции при понижающем микшировании от стандарта 5.1 каналов к стандарту 2 каналов. Кроме того, параметр dmx_gain2 относится к декодирующему устройству или потоку битов данных, не соответствующему стандарту 7.1 каналов.

Применение этого подхода и его действие аналогичны сильному сжатию с управлением динамическим диапазоном (DRC). Кроме того, кодирующее устройство может должным образом выполнять избирательную оценку за период, для которого аудиокадр слишком длинен, или за период, для которого аудиокадр слишком короток, чтобы определить глобальный коэффициент усиления при понижающем микшировании с уменьшением числа каналов.

При осуществлении понижающего микширования от стандарта 7.1 каналов к стандарту 2 каналов применяется суммарный коэффициент усиления (dmx_gain5+dmx_gain2). Например, в качестве параметров dmx_gain5 и dmx_gain2 используются 6-битовые целые числа без знака, а сами эти параметры dmx_gain5 и dmx_gain2 квантованы с шагом 0,25 дБ.

Поэтому, когда параметры dmx_gain5 и dmx_gain2 суммируют один с другим, суммарный коэффициент усиления находится в диапазоне ±15.75 дБ. Этот коэффициент усиления применяется к отсчету ау

Декодирующее устройство, способ декодирования, кодирующее устройство, способ кодирования и программа

Патент 2648945