Защита от ограничения сигнала с использованием заранее существующих метаданных коэффициента усиления аудиосигнала

Иллюстрации

Показать все

Изобретение относится к способу и устройству для предотвращения ограничения аудиосигнала, когда защита от ограничения сигнала на основе принятых аудиометаданных не гарантируется. Способ используется для предотвращения ограничения сигнала в случае смешения с уменьшением количества каналов многоканального сигнала до стереофонического аудиосигнала. В соответствии со способом определяют, достаточно ли первое значение (4) усиления на основе принятых аудиометаданных для защиты от ограничения аудиосигнала. Аудиометаданные внедряют в первый поток (1) аудиоданных. В случае когда первое значение (4) усиления не достаточно для защиты, соответствующее первое значение (4) усиления заменяют значением усиления, достаточным для защиты от ограничения аудиосигнала. Предпочтительно, в случае когда метаданные, относящиеся к управлению динамическим диапазоном, отсутствуют в первом потоке (1) аудиоданных, способ может добавлять значения усиления, достаточные для защиты от ограничения сигнала. Технический результат - обеспечение предотвращения ограничения сигнала на основе принятых аудиометаданных в случае смешения с уменьшением количества каналов многоканального аудиосигнала. 4 н. и 16 з.п. ф-лы, 10 ил., 1 табл.

Реферат

Перекрестная ссылка на родственные заявки

В данной заявке заявлен приоритет в соответствии с Предварительной заявкой № 61/109,433 на патент США, поданный 29 октября 2008 г., приведенный здесь полностью по ссылке.

Область техники, к которой относится изобретение

Заявка на патент относится к защите от ограничения сигнала аудиосигнала с использованием заранее существующих аудиометаданных, внедренных в поток цифровых аудиоданных. В частности, заявка относится к защите от ограничения сигнала в случае смешения с уменьшением количества каналов многоканального аудиосигнала.

Уровень техники

Обычно используется концепция, состоящая во внедрении аудиометаданных в цифровой поток аудиоданных, например, в цифровой среде широковещательной передачи. Такие метаданные представляют собой "данные о данных", то есть данные о цифровых аудиоданных в потоке. Метаданные могут предоставлять информацию для аудиодекодера о том, как воспроизводить звук. Один тип метаданных представляет собой информацию управления динамическим диапазоном, которая представляет изменяющуюся по времени огибающую коэффициента усиления. Такие метаданные управления динамическим диапазоном могут использоваться для ряда назначений.

(1) Управление динамическим диапазоном воспроизводимого звука: цифровая передача позволяет получить расширенный динамический диапазон, но условия прослушивания не всегда позволяют использовать преимущества этого. Хотя расширенный динамический диапазон является желательным в условиях тихой гостиной комнаты, он может не соответствовать другим условиям, например в автомобильном радиоприемнике, из-за высокого уровня фонового шума. Для того чтобы соответствовать широкому разнообразию условий прослушивания, метаданные, с которыми передают инструкции в приемник о том, как следует уменьшить динамический диапазон воспроизводимых аудиоданных, могут быть вставлены в цифровой поток аудиоданных, вместо уменьшения динамического диапазона аудиоданных перед передачей. Последний подход не является предпочтительным, поскольку он лишает возможности приемник воспроизводить аудиоданные с полным динамическим диапазоном. Вместо этого первый подход является предпочтительным, поскольку он позволяет для слушателя принять решение в отношении управления динамическим диапазоном, которое должно быть применено или нет, в зависимости от окружающей среды при прослушивании. Такие метаданные управления динамическим диапазоном делают доступным для слушателей высококачественное художественное сжатие динамического диапазона декодированного сигнала по их усмотрению.

(2) Предотвращение ограничения сигнала в случае операции смешения с понижением частоты: когда многоканальный сигнал (например, аудиосигнал 5.1 каналов) смешивают с уменьшением каналов, количество каналов уменьшается, типично до двух каналов. В случае воспроизведения многоканального аудиосигнала, содержащего больше чем два канала (например, аудиосигнала 5.1 каналов, сигнала, имеющего 5 основных каналов и 1 канал эффекта низкой частоты), через стереогромкоговорители обычно на стороне приемника выполняют операцию смешения с уменьшением количества каналов, где многоканальный сигнал смешивают в два канала. Операция смешения может быть описана по матрице смешения с уменьшением количества каналов, например матрице 2-5, имеющей два ряда по 5 столбцов в случае смешения с уменьшением количества каналов 5-канального сигнала в 2 канальный (стереофонический) сигнал (канал с эффектом низкой частоты типично не учитывают во время смешения с уменьшением количества каналов).

Различные схемы смешения с уменьшением количества каналов для схемы смешивания 5 основных каналов сигнала 5.1 каналов в два канала известны, например Lo/Ro (только левый, только правый) или Lt/Rt (весь левый, весь правый).

Этап смешения с уменьшением количества каналов связан с риском случайной перегрузки цифрового стереосигнала, в результате чего генерируются нежелательные искажения, связанные с ограничениями сигнала. Такое ограничение сигнала может возникать, когда амплитуда цифрового сигнала, подвергаемого смешению с уменьшением количества каналов, которая может превысить максимальное (или минимальное) представительное значение, ограничена максимальным (или минимальным) представительным значением. Например, в случае простого двоичного представления без знака с фиксированной запятой возникает ограничение сигнала, когда рассчитанная амплитуда при смешении с уменьшением количества каналов ограничена словом максимального значения, в котором все биты соответствуют 1. В случае представления со знаком в 16-битном формате, максимальное значение может, например, соответствовать слову "0111111111111111".

Поскольку известно использование матриц для различных схем смешения с уменьшением количества каналов в блоке предварительной обработки, отправитель или сторона генерирования содержания может добавлять к аудиопотоку для сигналов, которые могут привести к ограничению сигнала при смешении с уменьшением количества каналов, метаданные управления динамическим диапазоном, которые передают инструкции в приемник о том, что требуется ослабить сигналы, предназначенные для смешения с уменьшением количества каналов перед смешением, для динамического предотвращения ограничения сигнала.

(3) Предотвращение ограничения сигнала в случае усиленного выхода: для повторной передачи по динамически очень ограниченным каналам (например, из телевизионной приставки через аналоговое RF соединение на RF вход телевизора) сигнал усиливают, обычно на 11 дБ, для достижения лучшего соотношения сигнал-шум на этом пути. При таком применении для сигналов, которые могут привести к ограничению сигнала при усилении на 11 дБ, метаданные управления динамическим диапазоном, которые передают инструкции в приемник о необходимости ослабить сигналы перед усилением на 11 дБ, могут быть добавлены к аудиопотоку, для динамического предотвращения ограничения сигнала.

С точки зрения устройства, принимающего аудиопоток, непонятно, используются ли входящие метаданные управления динамическим диапазоном с целью, соответствующей пункту (1), то есть управление динамическим диапазоном, с целью в соответствии с пунктом (2), то есть защита от ограничения сигнала при смешении с уменьшением количества каналов, или с целью, соответствующей обоим пунктам (1) и (2). Часто метаданные выполняют обе задачи, но это происходит не всегда, поэтому в некоторых случаях метаданные могут не включать в себя защиту от ограничения сигнала при смешении с уменьшением количества каналов. Кроме того, в случае когда метаданные (типично, другой параметр усиления используют для режима RF) ассоциированы с режимом RF по пункту (3), метаданные могут использоваться для предотвращения ограничения сигнала в случае дополнительного усиления (как в случае смешения с уменьшением количества каналов, так и в случае, когда смешение с уменьшением количества каналов не используется).

Кроме того, входящий аудиопоток может вообще не включать в себя метаданные управления динамическим диапазоном, вследствие того что для некоторых форматов кодирования аудиоданных метаданные не обязательны.

Если метаданные управления динамическим диапазоном не включены в сжатый аудиопоток или включены, но не включают в себя защиту от ограничения сигнала при смешении с уменьшением количества каналов, нежелательные искажения в результате ограничения сигнала могут присутствовать в декодированном сигнале, если многоканальный сигнал будет смешан с уменьшением количества каналов.

В WO 2008/1000098 описан способ кодирования/декодирования аудиоданных и устройство для обработки аудиосигналов на основе объектов.

Сущность изобретения

В настоящем изобретении описаны способ и устройство для предотвращения ограничения аудиосигнала в случае, когда защита от ограничения сигнала с помощью аудиометаданных не гарантируется.

Первый аспект изобретения относится к способу предоставления защиты от ограничения сигнала для аудиосигнала, например цифрового аудиосигнала, смешанного с уменьшением количества каналов, который был получен из цифровых аудиоданных. В соответствии с этим способом определяют, являются ли значения первого усиления на основе принятых аудиометаданных достаточными для защиты от ограничения аудиосигнала. Аудиометаданные внедряют в первый аудиопоток. Например, определяют, достаточны или нет метаданные огибающей изменяющегося по времени усиления, включенные в поток сжатых аудиоданных, для предотвращения ограничения сигнала при смешении с уменьшением количества каналов. В случае когда первое значение усиления не достаточно для защиты, соответствующее первое значение усиления заменяют значением усиления, достаточным для защиты от ограничения аудиосигнала. Предпочтительно, в случае когда метаданные, относящиеся к управлению динамическим диапазоном, отсутствуют в первом аудиопотоке, способ может добавлять значения усиления, достаточные для защиты от ограничения сигнала. Например, в случае когда метаданные огибающей изменяющегося по времени усиления не обеспечивают достаточную защиту от ограничения сигнала при смешении с уменьшением количества каналов или отсутствуют вообще, метаданные огибающей изменяющегося по времени усиления модифицируют или добавляют таким образом, чтобы они обеспечивали достаточную защиту от ограничения сигнала при смешении с уменьшением количества каналов.

Способ обеспечивает защиту от ограничения сигнала, в частности защиту от ограничения сигнала в случае смешения с уменьшением количества каналов, независимо от того, были ли приняты значения усиления, достаточные для защиты от ограничения сигнала, или нет.

В соответствии со способом принятые слова, содержащие значения усиления аудиоданных (если они предусмотрены), могут использоваться настолько правильно, насколько это возможно, но они могут быть отменены, когда входящие слова, содержащие значения усиления, не обеспечивают достаточного уменьшения уровня для предотвращения ограничения сигнала, например, при смешении с уменьшением количества каналов.

Поскольку данные управления динамическим диапазоном, используемые для назначения в соответствии с пунктом (1), содержат артистические аспекты, типично приемное устройство (например, телевизионная приставка) не имеет задачи ввода их в случае, когда входящие метаданные не обеспечивают динамический диапазон. Свойства по пункту (2), однако, могут и поэтому должны быть предусмотрены принимающей стороной. Это означает, что приемное устройство должно пытаться сохранить данные управления динамическим диапазоном, предназначенные для управления динамическим диапазоном в соответствии с пунктом (1), в максимально возможной степени, в то время как одновременно с этим добавляется защита от ограничения сигнала.

Существуют различные способы определения, достаточно ли первых значений усиления на основе принимаемых аудиометаданных для защиты от ограничения сигнала.

В соответствии с предпочтительным подходом вторые значения усиления рассчитывают на основе цифровых аудиоданных, в случае когда вторые значения усиления достаточны для защиты от ограничения аудиосигнала. Вторые значения усиления могут представлять собой максимально допустимые значения усиления, которые не приводят к ограничению сигнала.

Предпочтительно, способ определяет, являются ли достаточными первые значения усиления таким образом, что выполняют сравнение первых значений усиления на основе принятых аудиометаданных и рассчитанных вторых значений усиления. Способ может сравнивать одно из первого значения, ассоциированного с сегментом аудиоданных, с соответствующим вторым значением усиления, ассоциированным с тем же сегментом аудиоданных.

В зависимости от этого поток значений усиления, соответствующих защите от ограничений сигнала, может быть сгенерирован из первого и второго значений усиления. Предпочтительно, такие значения усиления выбирают из первых значений усиления и рассчитанных вторых значений усиления, в зависимости от операций сравнения. В результате выбора второго рассчитанного значения усиления вместо первого значения усиления первое значение усиления заменяют выбранным вторым значением усиления.

Предпочтительно, выбирают минимальное из пары из первого и второго значений усиления. Если первое значение усиления больше, чем рассчитанное второе значение усиления, достаточное для защиты, это обозначает, что существует риск того, что первое значение усиления будет недостаточным для защиты от ограничения сигнала и, таким образом, должно быть заменено соответствующим вторым значением усиления. В противном случае, если первое значение усиления будет меньше, чем рассчитанное второе значение усиления, достаточное для защиты, это обозначает, что отсутствует какой-либо риск ограничения сигнала, и первое значение усиления должно быть сохранено.

Выбор значений усиления из первого и второго значений усиления может осуществляться, как поясняется ниже.

В случае когда как первое значение усиления, так и второе значение усиления обеспечивают усиление, меньшее или равное 1, выбирают минимальное из них. Это означает, что либо первое значение усиления уже гарантирует защиту от ограничения сигнала, или, в противном случае, оно будет заменено вторым значением усиления.

В случае когда усиление для второго значения усиления больше 1 и первое значение усиления предусматривает усиление, меньшее или равное 1, сигнал может быть усилен и все еще не будет ограничен. Однако входящий аудиопоток запрашивает ослабление, например, с целью выполнения ограничения динамического диапазона, и, таким образом, его сохраняют.

В случае когда первое значение усиления обеспечивает усиление, большее 1, и второе значение усиления обеспечивает усиление, меньшее или равное 1, входящее первое значение усиления может нарушить защиту от ограничения сигнала, и, таким образом, выбирают второе значение усиления.

В случае когда как первое значение усиления, так и второе значение усиления обеспечивают усиление, большее 1, входной сигнал должен быть усилен. Такое усиление разрешено, если только все еще не возникает ограничение сигнала, и, таким образом, используется меньшее из первого значения усиления и второго значения усиления.

Альтернативный подход для определения, является ли первое значения усиления достаточным для защиты, состоит в применении первого значения усиления к аудиоданным, для определения, получится ли в результате цифровой аудиосигнал (например, сигнал, полученный в результате смешения с уменьшением количества каналов) ограничения.

В случае когда первые значения усиления не достаточны для защиты, возможно итерационно определить значения усиления, которые достаточны для защиты от ограничения сигнала, начиная с первых значений усиления, в качестве исходных значений усиления. Например, можно определить, происходит ли ограничение аудиосигнала со значением усиления, которое представляет собой ближайшее значение усиления, меньшим, чем первое усиление, в соответствии с разрешающей способностью значений усиления (например, в случае когда первое значение усиления равно 0,8 и разрешение значения усиления составляет 0,1, наименьшее ближайшее значение усиления будет 0,7). Если все еще происходит ограничение сигнала, можно определить, произойдет ли ограничение аудиосигнала со следующим меньшим значением усиления (например, со значением усиления 0,6). Это повторяют до тех пор, пока не найдут значение усиления, которое не приводит к ограничению сигнала.

Предпочтительно, способ выполняют как часть процесса транскодирования, в случае когда первый аудиопоток, который находится в первом формате аудиокодирования (например, формате AAC ПЗК (перспективное звуковое кодирование) или в формате высокоэффективного AAC (HE-AAC, ВЭ-ПЗК), также известном, как aacPlus), транскодируют во второй аудиопоток, кодированный во втором формате кодирования аудиоданных (например, в формате Dolby Digital или в формате Dolby Digital Plus). Второй поток аудиоданных содержит замененные значения усиления, достаточные для ограничения, или имеет значения усиления, полученные из них.

Часто требуется выполнять транскодирование аудиоданных, поскольку цифровой формат сжатия для передачи аудиоданных не может поддерживаться по всей цепи передачи до конечного аудиодекодера в цепи передачи (например, до декодера AVR - приемника аудио/видеоданных). В случае широковещательной передачи это связано с тем, что, например, разные схемы кодирования можно использовать для широковещательной передачи через радиоканал (или широковещательной передачи потребителю по кабелю) и передачи аудиоданных между приемным устройством (например, телевизионной приставкой - STB (ТВП)) и конечным декодером в цепи передачи (например, декодером в AVR или аудиодекодером в телевизионном приемнике). Например, аудиоданные могут быть переданы в режиме широковещательной передачи по радиоканалу через формат AAC или формат HE-AAC, и затем аудиоданные могут быть транскодированы в формат Dolby Digital или в формат Dolby Digital Plus для передачи из STB в AVR. Вследствие этого этап транскодирования может быть выполнен, например, в STB, для преобразования из одного формата в другой. Такой этап транскодирования содержит транскодирование самих аудиоданных, но в идеале также транскодирование сопровождающих метаданных, в частности данных управления динамическим диапазоном. В соответствии с предпочтительным вариантом осуществления способ обеспечивает транскодированные метаданные усиления аудиосигналов во втором потоке аудиоданных с метаданными усиления, достаточными для защиты от ограничения сигнала.

Способ может быть очень полезным в любом устройстве, которое транскодирует сигнал из одного сжатого формата аудиопотока в другой, когда заранее не известно, включают ли в себя метаданные управления изменяющимся по времени усилением, если таковые вообще имеются, переносимые с использованием первого формата, защиту от ограничения при смешении с уменьшением количества каналов (например, в транскодере из AAC/HE-AAC в Dolby Digital, в транскодере из Dolby E в AC/HE-AAC или в транскодере из Dolby Digital в AAC/HE-AAC).

Предпочтительно, для определения, достаточны ли первые значения усиления для защиты, цифровые аудиоданные смешивают с уменьшением количества каналов в соответствии с, по меньшей мере, одной схемой смешения с уменьшением количества каналов, например в соответствии со схемой смешения с уменьшением количества каналов Lt/Rt. В результате смешения с уменьшением количества каналов получают один или больше сигналов, например один сигнал, ассоциированный с правым каналом, и один сигнал, ассоциированный с левым каналом. Кроме того, множество схем смешения с уменьшением количества каналов можно рассматривать, и цифровые аудиоданные смешивают с уменьшением количества каналов в соответствии с более чем одной схемой смешения с уменьшением количества каналов.

Предпочтительно, фактическое пиковое значение различных сигналов, полученных из аудиосигнала, постоянно определяют, то есть в заданный момент времени определяют, какой из различных сигналов имеет наибольшее значение сигнала. Для расчета пикового значения способ может определять максимум абсолютных значений двух или больше сигналов в заданный момент времени. Эти два или больше сигнала могут включать в себя один или больше сигналов после смешения с уменьшением количества каналов в соответствии с первой схемой смешения с уменьшением количества каналов, например абсолютное значение выборки сигнала правого канала после смешения с уменьшением количества каналов и абсолютное значение одновременной полученной выборки, смешанного с уменьшением количества каналов сигнала для левого канала. Кроме того, для расчета пикового значения способ также может рассматривать абсолютное значение одного или больше сигналов после смешения с уменьшением количества каналов в соответствии со второй (и даже третьей) схемой смешения с уменьшением количества каналов. Кроме того, определение пикового значения может учитывать абсолютное значение одного или больше аудиосигналов перед смешением с уменьшением количества каналов, например абсолютное значение каждого из 5 основных каналов для сигнала с 5.1 каналами одновременно. Следует отметить, что в случае транскодирования обычно неизвестно, воспроизводится ли впоследствии многоканальный сигнал через дискретные каналы, или выполняют смешение с уменьшением количества каналов в соответствии со схемой смешивания с уменьшением количества каналов.

Пиковое значение соответствует максимуму из этих одновременных значений выборки сигнала, обозначая, таким образом, максимальную амплитуду, которую сигнал может иметь во всех возможных случаях в определенный момент времени, и это представляет наихудший случай, который должен учитывать алгоритм защиты от ограничения сигнала.

Данные управления динамическим диапазоном обычно изменяются по времени с определенной степенью детализации, которая обычно относится к длине сегмента данных (например, блоку) соответствующего формата кодирования аудиоданных или представляет интегральную его часть. Таким образом, также предпочтительно рассчитывают второе значение усиления для сегмента данных.

Поэтому частота выборки пиковых значений или последовательных пиковых значений предпочтительно уменьшается (снижение частоты выборки). Это может быть выполнено путем определения максимального из множества последовательных значений пиков или последовательных отфильтрованных значений пиков. В частности, способ может определять максимальное значение из множества последовательных (отфильтрованных) значений пика, ассоциированных с сегментом данных, например блоком или фреймом. В случае транскодирования способ может определять наивысшие значения пика среди множества последовательных (отфильтрованных) значений пика, ассоциированных с сегментом данных второго (выходящего) потока данных. Следует отметить, что предпочтительно учитывают не только последовательные значения пика, на основе выборок сигналов в нисходящем сегменте для определения максимума, но также и дополнительные (предшествующие и последующие) значения пика, которые могли бы повлиять на декодирование сегмента данных, то есть значения пика, которые относятся к выборкам сигнала в начале и в конце окна декодирования. Эти значения пика также ассоциированы с сегментом данных.

Вместо выбора наибольшего значения пика можно рассчитывать другое значение на сегмент данных, для уменьшения частоты выборки.

Следует отметить, что смешение с уменьшением количества каналов может быть выполнено для выборок, полученных из других аудиоданных, кроме значений пика. Например, аудиоданные могут быть смешаны с уменьшением количества каналов до одного канала (монофонический), и определяют только максимальные среди смешиваемых с уменьшением количества каналов последовательных выборок на сегмент исходящих данных. В соответствии с другим примером первый каждый максимум для каждого сигнала, смешанного с уменьшением количества каналов, рассчитывают на исходящий сегмент данных (снижение частоты выборки) и затем определяют пиковое значение этих максимумов.

На основе определенного максимума величину усиления можно рассчитать путем инвертирования определенного максимума. Если 1 представляет собой максимальное значение сигнала, которое может быть представлено, инвертирование определенного максимума позволяет непосредственно получить коэффициент усиления. Когда коэффициент усиления прикладывают к максимуму (отфильтрованных) значений пика, получаемое значение равно 1, то есть максимальное значение сигнала. Это означает, что каждая аудиовыборка, к которой прикладывают усиление, поддерживается ниже 1 или равна 1, исключая, таким образом, ограничение сигнала для данного сегмента данных. В случае когда 1 представляет собой максимальный уровень сигнала, 1 соответствует 0 dBFS - децибел, относящихся к полной шкале; обычно 0 dBFS назначают для максимального возможного уровня.

Вместо простого инвертирования определенного максимума значение усиления может быть рассчитано путем деления максимального значения сигнала (которое соответствует 0 dBFS) путем определения максимума, ассоциированного с сегментом данных. Однако стоимость расчетов в этом случае будет более высокой по сравнению с простой инверсией.

В случае транскодирования длины сегментов данных (например, блока или фрейма) часто отличаются для первого формата кодирования аудиоданных (формат входного потока) и второго формата кодирования аудиоданных (формат выходного потока). Например, в AAC блок типично содержит 128 выборок (в HE-AAC: 256 выборок на блок), в то время как в случае Dolby Digital блок типично содержит 256 выборок. Таким образом, количество выборок на блок увеличивается при транскодировании с AAC в Dolby Digital. В AAC фрейм типично содержит 1024 выборки (в HE-AAC: 2048 выборок на фрейм), в то время как в Dolby Digital фрейм типично содержит 1536 выборок (6 блоков). Таким образом, количество выборок на фрейм также увеличивается при транскодировании с AAC на Dolby Digital. Степень детализации данных управления динамического диапазона, в основном, составляет либо размер блока, или размер фрейма. Например, степень детализации метаданных "DRC" управления динамическим диапазоном в MPEG для потока HE-AAC и метаданные усиления "dynrng" в Dolby Digital представляют размер блока. В отличие от этого степень детализации метаданных усиления "compr" в Dolby Digital и метаданных усиления "сильная степень сжатия" в DVB (цифровое видео и телевещание) для потока HE-AAC составляет размер фрейма.

Кроме того, частоты выборки могут отличаться для входного потока (например, 32 кГц или 44,1 кГц) и выходного потока (например, 48 кГц), то есть выполняют повторную выборку аудиоданных. Это также изменяет взаимосвязи длины между сегментами входящих данных и сегментами исходящих данных. Кроме того, входящие и исходящие сегменты данных могут не быть выровнены. Кроме того, следует отметить, что метаданные, передаваемые во входном сегменте данных (например, блоке или фрейме), имеют область влияния управления на динамический диапазон (то есть область в потоке, где применение значения усиления имеет эффект), то есть часто имеют не точно такой же размер, как и сегмент данных, но больше. Это связано с наложением характеристик суммирования используемого преобразования и с тем фактом, что управление динамическим диапазоном часто применяют в спектральной области. То же самое часто справедливо для данных управления динамическим диапазоном исходящего аудиопотока. Поэтому для определения, какие входные значения усиления влияют на заданный выходной сегмент данных, следует посмотреть на наложение входной и выходной длин влияния (вместо учета степени наложения входных и выходных сегментов данных), как поясняется подробно ниже.

В соответствии с причинами, описанными выше, транскодирование данных управления динамического диапазона должно учитывать, что на исходящее значение управления динамическим диапазоном может влиять более чем одно входящее значение управления динамическим диапазоном. В этом случае повторная выборка (повторное разделение на фреймы) данных управления динамическим диапазоном может быть выполнена в случае транскодирования потока данных.

Поэтому способ может содержать этап повторной выборки значений усиления, выведенных из принятых аудиометаданных первого аудиопотока. Когда сегмент данных первого аудиопотока охватывает более короткую длительность времени, чем сегмент данных второго аудиопотока, для значений усиления выполняют уменьшение частоты выборки.

Значение усиления после повторной выборки может быть определено путем расчета минимума из множества последовательных значений усиления. Другими словами: из множества входных значений управления динамическим диапазоном (которые относятся для исходящего сегмента данных) выбирают наименьшее. Мотивация этого состоит в том, чтобы сохранить входящие значения в максимально возможной степени (в случае, когда эти значения не приводят к ограничению сигнала). Однако это часто невозможно, поскольку значения усиления должны быть подвергнуты повторной выборке. Поэтому выбирают наименьшее значение усиления, что приводит к уменьшению амплитуды сигнала. Однако такое уменьшение амплитуды сигнала рассматривают как менее значимое или менее раздражающее. Предпочтительно, такой минимум определяют для выходного сегмента данных.

В случае отсутствия метаданных усиления, относящихся к управлению динамическим диапазоном, в первом аудиопотоке способ предпочтительно добавляет значения усиления, достаточные для защиты от ограничения сигнала во втором аудиопотоке (исходящий поток). Такие значения усиления должны быть предпочтительно ограничены так, чтобы они не превышали усиление, равное 1. Причина предотвращения превышения 1 значениями усилениями состоит в том, что сигнал не должен быть излишне усилен и чтобы он не приближался к пределу ограничения сигнала.

Таким образом, в случае когда соответствующим образом рассчитанное второе значение усиления имеет усиление ниже 1, соответствующее добавленное значение усиления соответствует рассчитанному второму значению усиления. В случае когда соответствующее рассчитанное второе значение усиления превышает 1, соответствующее добавленное значение усиления устанавливают как усиление, равное 1.

Во втором аспекте настоящая заявка относится к устройству для предоставления защиты от ограничения сигнала для аудиосигнала, получаемого из цифровых аудиоданных. Устройство выполнено с возможностью осуществления способа, описанного выше. Свойства устройства соответствуют свойствам способа, описанного выше. В соответствии с этим устройство содержит средство для определения, достаточно ли первых значений усиления, основанных на принятых аудиометаданных, для защиты от ограничения аудиосигнала. Кроме того, устройство содержит средство для замены первого значении усиления значением усиления, достаточным для защиты от ограничения аудиосигнала в случае, когда первое значение усиления не достаточно.

Предпочтительно, средство определения содержит средство для расчета вторых значений усиления на основе цифровых аудиоданных, где вторые значения усиления достаточны для защиты от ограничения аудиосигнала. Более предпочтительно, средство определения также содержит средство сравнения, предназначенное для сравнения первого значения усиления на основе принятых аудиометаданных и рассчитанных вторых значений усиления. В зависимости от этого значения усиления выбирают из первых значений усиления и рассчитанных вторых значений усиления.

Представленные выше замечания, относящиеся к первому аспекту заявки, также применимы ко второму аспекту заявки.

Третий аспект заявки относится к транскодеру, в случае когда транскодер выполнен с возможностью транскодировать поток аудиоданных из первого формата кодирования аудиоданных во второй формат кодирования аудиоданных. Транскодер содержит устройство в соответствии со вторым аспектом заявки. Предпочтительно, транскодер представляет собой часть приемного устройства, принимающего первый аудиопоток, где первый аудиопоток представляет собой цифровой сигнал широковещательной передачи, например аудиопоток цифрового телевизионного сигнала (например, DVB-T (цифровое телевидение - наземное, ЦТВ-Н), DVB-S (цифровое телевидение - спутниковое, ЦТВ-С), DVB-C (цифровое телевидение - кабельное, ЦТВ-К)) или цифровой радиосигнал (например, сигнал DAP (протокол доступа к данным, ПДД)). Например, приемное устройство представляет собой телевизионную приставку. Поток аудиоданных также может представлять собой поток широковещательной передачи через Интернет (например, Интернет-TV или интернет-радио). В качестве альтернативы, первый поток аудиоданных может быть считан с носителя для сохранения цифровых данных, например DVD (цифровой универсальный диск, ЦУД) или диск Blu-ray.

Представленные выше комментарии, относящиеся к первому и второму аспектам заявки, также применимы к третьему аспекту заявки.

Краткое описание чертежей

Изобретение поясняется ниже на примере со ссылкой на приложенные чертежи, на которых:

на фиг. 1 иллюстрируется вариант осуществления транскодера, обеспечивающего защиту от ограничения сигнала;

на фиг. 2 иллюстрируется предпочтительный подход для повторного формирования фреймов метаданных;

на фиг. 3 иллюстрируется вариант осуществления, предназначенный для определения пиковых значений на основе принятых аудиоданных;

на фиг. 4 иллюстрируется вариант осуществления для слияния входящих данных управления динамическим диапазоном с рассчитанными значениями усиления, достаточными для защиты от ограничения сигнала;

на фиг. 5 иллюстрируется выбор выходящих значений усиления;

на фиг. 6 иллюстрируется альтернативный вариант осуществления для слияния входящих данных управления динамическим диапазоном с рассчитанными значениями усиления, достаточными для защиты от ограничения сигнала;

на фиг. 7 иллюстрируется вариант осуществления каскада сглаживающего фильтра;

на фиг. 8 иллюстрируются другие варианты осуществления для предоставления защиты от ограничения сигнала;

на фиг. 9 иллюстрируются еще один, другой вариант осуществления, который обеспечивает защиту от ограничения сигнала; и

на фиг. 10 иллюстрируется приемное устройство, принимающее транскодированный поток аудиоданных.

Подробное описание изобретения

AAC/HE-AAC и Dolby Digital/Dolby Digital Plus поддерживают концепцию метаданных, более конкретно слова, содержащие значения усиления, в которых передают изменяющееся по времени значение усиления, с тем чтобы в случае необходимости использовать его для аудиоданных после декодирования. С целью уменьшения объема передаваемых данных такие слова, содержащие усиление, типично передают только один раз на сегмент данных, например на блок или фрейм. В упомянутых аудиоформатах такие слова, содержащие значения усиления, являются необязательными, то есть технически возможно не посылать эти данные. Кодеры Dolby Digital/Dolby и Digital Plus типично передают слова со значением усиления, в то время как кодеры AAC и HE-AAC часто не передают такие слова со значением усиления. Однако количества кодеров AAC и HE-AAC, которые передают слова с усилением, увеличиваются. Приложение позволяет декодерам или транскодерам, принимающим аудиопоток, работать в "правильном режиме" в обеих ситуациях. Если слова со значением усиления будут предоставлены, "правильный режим работы" будет состоять в обработке принимаемых слов со значением усиления аудиоданных настолько достоверно, насколько это возможно, но с отменой этого значения, когда входящие слова со значением усиления не обеспечивают достаточной аттенюации для предотвращения ограничения сигнала, например, в случае смешения с уменьшением количества каналов. Если значения усиления не предоставлены, "правильный режим работы" будет состоять в расчете и предоставлении значений усиления, которые предотвращают ограничение сигнала.

На фиг. 1 показан вариант осуществления транскодера, причем этот транскодер обеспечивает защиту от ограничения сигнала, в частности защиту от ограничения сигнала в случае смешения с уменьшением количества каналов (например, в случае смешения с уменьшением количества каналов от сигнала с 5.1 каналами в сигнал с 2 каналами). Транскодер принимает поток 1 цифровых аудиоданных, содержащий аудиометаданные. Например, поток цифровых аудиоданных представляет собой поток цифровых аудиоданных AAC или HE-AAC (HE-AAC версия 1 или HE-AAC версия 2). Поток цифровых аудиоданных может представлять собой часть видео/аудиопотока DVB, например поток DVB-T, DVB-S или DVB-C. Транскодер транскодирует принимаемый поток 1 аудиоданных и выводит выходной поток 14 аудиоданных, который кодирован в другом формате, например Dolby Digital или Dolby Digital Plus. Как правило, декодеры Dolby Digital поддерживают смешение с уменьшением количества кан