2602988 - Звуковые кодирующее устройство и декодирующее устройство

Звуковые кодирующее устройство и декодирующее устройство

Иллюстрации

Показать все

Изобретение относится к области многоканального звукового кодирования. Техническим результатом является повышение качества кодированного и декодированного звукового сигнала. Способ декодирования в многоканальной системе обработки звуковых сигналов для реконструкции М кодированных каналов, где M>2 включает следующие этапы: прием N сигналов понижающего микширования с кодированием формы, содержащих спектральные коэффициенты, соответствующие частотам между первой и второй частотами разделения каналов, где 1<N<M; прием M сигналов с кодированием формы, содержащих спектральные коэффициенты, соответствующие частотам до первой частоты разделения каналов, при этом каждый из M сигналов с кодированием формы соответствует соответствующему одному из М кодированных каналов; понижающее микширование M сигналов с кодированием формы в N сигналов понижающего микширования, содержащих спектральные коэффициенты, соответствующие частотам до первой частоты разделения каналов; объединение каждого из N сигналов понижающего микширования с кодированием формы, содержащих спектральные коэффициенты, соответствующие частотам между первой и второй частотами разделения каналов, с соответствующим одним из N сигналов понижающего микширования, содержащих спектральные коэффициенты, соответствующие частотам до первой частоты разделения каналов, в N объединенных сигналов понижающего микширования; расширение каждого из N объединенных сигналов понижающего микширования в частотный диапазон выше второй частоты разделения каналов путем выполнения высокочастотной реконструкции, в результате чего каждый расширенный сигнал понижающего микширования содержит спектральные коэффициенты, соответствующие диапазону, проходящему ниже первой частоты разделения каналов и выше второй частоты разделения каналов; выполнение параметрического повышающего микширования N объединенных сигналов понижающего микширования с расширенным диапазоном частоты в M сигналов повышающего микширования, содержащих спектральные коэффициенты, соответствующие частотам выше первой частоты разделения каналов, при этом каждый из M сигналов повышающего микширования соответствует одному из М кодированных каналов; и объединение M сигналов повышающего микширования, содержащих спектральные коэффициенты, соответствующие частотам выше первой частоты разделения каналов, с M сигналами с кодированием формы, содержащими спектральные коэффициенты, соответствующие частотам до первой частоты разделения каналов. 6 н. и 23 з.п. ф-лы, 8 ил.

Реферат

Перекрестная ссылка на родственные заявки

Настоящая заявка притязает на приоритет предварительной заявки на патент США № 61/808680, поданной 5 апреля 2013 года, описание которой полностью включается в настоящее описание посредством ссылки.

Область техники изобретения

Изобретение, описанное в настоящем документе, относится, в общем, к многоканальному звуковому кодированию. В частности, оно относится к кодирующему устройству и декодирующему устройству для гибридного кодирования, включающего параметрическое кодирование и дискретное многоканальное кодирование.

Предпосылки создания изобретения

При обычном многоканальном звуковом кодировании возможные схемы кодирования включают дискретное многоканальное кодирование или параметрическое кодирование, такое как формат MPEG Surround. Используемая схема зависит от полосы частот звуковой системы. Известно, что методы параметрического кодирования являются масштабируемыми и эффективными в части качества прослушивания, что делает их особенно привлекательными в применениях с низким битрейтом. В применениях с высоким битрейтом часто используется дискретное многоканальное кодирование. Существующие форматы распространения или обработки и связанные с ними технологии кодирования могут быть усовершенствованы с точки зрения их эффективности использования частоты пропускания, особенно в случаях применения с битрейтом между низким битрейтом и высоким битрейтом.

Документ US7292901 (Kroon и соавт.) относится к способу гибридного кодирования, в котором гибридный звуковой сигнал формируют по меньшей мере из одной микшированной с понижением спектральной составляющей и по меньшей мере из одной не микшированной спектральной составляющей. Способ, представленный в настоящей заявке, может повысить емкость приложения, имеющего определенный битрейт, но для дополнительного повышения эффективности системы обработки звуковых сигналов могут потребоваться дополнительные усовершенствования.

Краткое описание графических материалов

Далее приводится описание примерных вариантов осуществления со ссылками на прилагаемые графические материалы, на которых:

фиг. 1 представляет собой обобщенную блок-схему декодирующей системы в соответствии с одним примерным вариантом осуществления;

фиг. 2 иллюстрирует первую часть декодирующей системы на фиг. 1;

фиг. 3 иллюстрирует вторую часть декодирующей системы на фиг. 1;

фиг. 4 иллюстрирует третью часть декодирующей системы на фиг. 1;

фиг. 5 представляет собой обобщенную блок-схему кодирующей системы в соответствии с одним примерным вариантом осуществления;

фиг. 6 представляет собой обобщенную блок-схему декодирующей системы в соответствии с одним примерным вариантом осуществления;

фиг. 7 иллюстрирует третью часть декодирующей системы на фиг. 6; и

фиг. 8 представляет собой обобщенную блок-схему декодирующей системы в соответствии с одним примерным вариантом осуществления.

Все фигуры являются схематическими и, как правило, показывают лишь те части, которые необходимы для разъяснения изобретения; другие части могут быть упущены или просто подразумеваться. Если не указано иначе, подобные части на разных фигурах обозначены подобными позициями.

Подробное описание

Обзор: декодирующее устройство

В настоящем описании «звуковой сигнал» может представлять собой чисто звуковой сигнал, звуковую часть аудиовизуального сигнала или мультимедийного сигнала или любое из них в сочетании с метаданными.

В настоящем описании «понижающее микширование нескольких сигналов» означает объединение нескольких сигналов, например путем образования линейных комбинаций, чтобы получить меньшее число сигналов. Операция, обратная понижающему микшированию, называется повышающим микшированием, то есть выполнение операции на меньшем числе сигналов для получения большего числа сигналов.

В соответствии с первым аспектом примерные варианты осуществления предлагают способы, устройства и компьютерные программные продукты для реконструкции многоканального звукового сигнала на основании входного сигнала. Предлагаемые способы, устройства и компьютерные программные продукты могут, как правило, иметь одни и те же признаки и преимущества.

В соответствии с примерными вариантами осуществления предлагается декодирующее устройство для многоканальной системы обработки звуковых сигналов для реконструкции М кодированных каналов, где M > 2. Декодирующее устройство содержит первую приемную стадию, предназначенную для приема N сигналов понижающего микширования с кодированием формы, содержащих спектральные коэффициенты, соответствующие частотам между первой и второй частотами разделения каналов, где 1<N<M.

Декодирующее устройство дополнительно содержит вторую приемную стадию, предназначенную для приема M сигналов с кодированием формы, содержащих спектральные коэффициенты, соответствующие частотам до первой частоты разделения каналов, при этом каждый из M сигналов с кодированием формы соответствует соответствующему одному из М кодированных каналов.

Декодирующее устройство дополнительно содержит стадию понижающего микширования после второй приемной стадии, предназначенную для понижающего микширования M сигналов с кодированием формы в N сигналов понижающего микширования, содержащих спектральные коэффициенты, соответствующие частотам до первой частоты разделения каналов.

Декодирующее устройство дополнительно содержит первую объединительную стадию после первой приемной стадии и стадии понижающего микширования, предназначенную для объединения каждого из N сигналов понижающего микширования, принятых первой приемной стадией, с соответствующим одним из N сигналов понижающего микширования из стадии понижающего микширования в N объединенных сигналов понижающего микширования.

Декодирующее устройство дополнительно содержит стадию высокочастотной реконструкции после первой объединительной стадии, предназначенную для расширения каждого из N объединенных сигналов понижающего микширования из объединительной стадии в частотный диапазон выше второй частоты разделения каналов путем выполнения высокочастотной реконструкции.

Декодирующее устройство дополнительно содержит стадию повышающего микширования после стадии высокочастотной реконструкции, предназначенную для выполнения параметрического повышающего микширования N сигналов с расширенным диапазоном частоты из стадии высокочастотной реконструкции в M сигналов повышающего микширования, содержащих спектральные коэффициенты, соответствующие частотам выше первой частоты разделения каналов, при этом каждый из M сигналов повышающего микширования соответствует одному из М кодированных каналов.

Декодирующее устройство дополнительно содержит вторую объединительную стадию после стадии повышающего микширования и второй приемной стадии, предназначенную для объединения M сигналов повышающего микширования из стадии повышающего микширования с M сигналами с кодированием формы, принятыми второй приемной стадией.

M сигналов с кодированием формы представляют собой чисто сигналы с кодированием формы без подмешанных параметрических сигналов, т. е. они представляют собой не микшированное с понижением дискретное представление обработанного многоканального звукового сигнала. Преимущество наличия более низких частот, представленных в этих сигналах с кодированием формы, может заключаться в том, что человеческое ухо более чувствительно к части звукового сигнала, имеющей низкие частоты. При кодировании этой части с лучшим качеством может улучшиться общее впечатление декодированного звука.

Преимущество наличия по меньшей мере двух сигналов понижающего микширования заключается в том, что этот вариант осуществления обеспечивает повышенную размерность сигналов понижающего микширования по сравнению с системами лишь с одним каналом понижающего микширования. В соответствии с этим вариантом осуществления может, таким образом, обеспечиваться лучшее качество декодированного звука, что может перевесить увеличение битрейта, обеспечиваемое системой с одним сигналом понижающего микширования.

Преимущество использования гибридного кодирования, включающего параметрическое кодирование с понижающим микшированием и дискретное многоканальное кодирование, заключается в том, что оно может повысить качество декодированного звукового сигнала для некоторых битрейтов по сравнению с использованием обычного способа параметрического кодирования, т. е. MPEG Surround с HE-AAC. При битрейтах примерно 72 килобит в секунду (кбит/с) обычная модель параметрического кодирования может насыщаться, т. е. качество декодированного звукового сигнала ограничивается недостатками параметрической модели, а не нехваткой битов для кодирования. Следовательно, для битрейтов от примерно 72 кбит/с может быть преимущественным использовать биты на дискретное кодирование формы сигнала более низких частот. В то же время гибридный подход с использованием параметрического кодирования с понижающим микшированием и дискретного многоканального кодирования может повысить качество декодированного звукового сигнала для некоторых битрейтов, например при 128 кбит/с или ниже, по сравнению с использованием подхода, в котором все биты используются на более низких частотах с кодированием формы сигнала, и использованием репликации спектральной полосы (SBR) для оставшихся частот.

Преимущество наличия N сигналов понижающего микширования с кодированием формы, которые содержат лишь спектральные данные, соответствующие частотам между первой частотой разделения каналов и второй частотой разделения каналов, заключается в том, что требуемая скорость передачи битов для системы обработки звуковых сигналов может уменьшиться. Альтернативно, биты, сэкономленные благодаря наличию отфильтрованного полосовым фильтром сигнала понижающего микширования, могут использоваться на более низких частотах с кодированием формы сигнала, например частоты дискретизации, поскольку эти частоты могут быть выше, или может повыситься первая частота разделения каналов.

Поскольку, как уже отмечалось, человеческое ухо более чувствительно к части звукового сигнала, имеющей низкие частоты, высокие частоты как часть звукового сигнала, имеющего частоты выше второй частоты разделения каналов, могут восстанавливаться высокочастотной реконструкцией без снижения качества воспринимаемого звука декодированного звукового сигнала.

Одно дополнительное преимущество данного варианта осуществления может заключаться в том, что поскольку параметрическое повышающее микширование, выполняемое в стадии повышающего микширования, действует лишь на спектральные коэффициенты, соответствующие частотам выше первой частоты разделения каналов, сложность повышающего микширования снижается.

В соответствии с еще одним вариантом осуществления объединение, выполняемое на первой объединительной стадии, в которой каждый из N сигналов понижающего микширования с кодированием формы, содержащих спектральные коэффициенты, соответствующие частотам между первой и второй частотами разделения каналов, объединяется с соответствующим одним из N сигналов понижающего микширования, содержащих спектральные коэффициенты, соответствующие частотам до первой частоты разделения каналов в N объединенных сигналов понижающего микширования, выполняется в частотной области.

Преимущество этого варианта осуществления может заключаться в том, что M сигналов с кодированием формы и N сигналов понижающего микширования с кодированием формы могут кодироваться кодером формы сигнала с использованием перекрывающихся многооконных преобразований с независимой многооконной работой для M сигналов с кодированием формы и N сигналов понижающего микширования с кодированием формы соответственно и по-прежнему оставаться декодируемым декодирующим устройством.

В соответствии с одним дополнительным вариантом осуществления объединение, выполняемое на второй объединительной стадии, т. е. объединение сигналов повышающего микширования, содержащих спектральные коэффициенты, соответствующие частотам выше первой частоты разделения каналов, с M сигналами с кодированием формы, содержащими спектральные коэффициенты, соответствующие частотам до первой частоты разделения каналов, выполняется в частотной области. Как уже отмечалось, преимущество объединения М сигналов в области QMF заключается в том, что может использоваться независимая многооконная работа перекрывающихся многооконных преобразований, используемая для кодирования сигналом в области MDCT.

В соответствии с еще одним вариантом осуществления выполняемое параметрическое повышающее микширование N объединенных сигналов понижающего микширования с расширенным диапазоном частоты в M сигналов повышающего микширования на стадии повышающего микширования выполняется в частотной области.

В соответствии с еще одним вариантом осуществления понижающее микширование M сигналов с кодированием формы в N сигналов понижающего микширования, содержащих спектральные коэффициенты, соответствующие частотам до первой частоты разделения каналов, выполняется в частотной области.

В соответствии с одним вариантом осуществления частотная область представляет собой область квадратурных зеркальных фильтров (QMF).

В соответствии с еще одним вариантом осуществления понижающее микширование, выполненное на стадии понижающего микширования, на которой M сигналов с кодированием формы микшируются с понижением в N сигналов понижающего микширования, содержащих спектральные коэффициенты, соответствующие частотам до первой частоты разделения каналов, выполняется во временной области.

В соответствии с еще одним вариантом осуществления первая частота разделения каналов зависит от скорости передачи битов многоканальной системы обработки звуковых сигналов. Это может привести к тому, что имеющаяся полоса частот используется для повышения качества декодированного звукового сигнала, поскольку часть звукового сигнала, имеющая частоты ниже первой частоты разделения каналов, имеет полностью кодированную форму.

В соответствии с еще одним вариантом осуществления расширение каждого из N объединенных сигналов понижающего микширования в частотный диапазон выше второй частоты разделения каналов путем выполнения высокочастотной реконструкции на стадии высокочастотной реконструкции выполняется с использованием параметров высокочастотной реконструкции. Параметры высокочастотной реконструкции могут приниматься декодирующим устройством, например на приемной стадии, а затем посылаться на стадию высокочастотной реконструкции. Высокочастотная реконструкция может, например, представлять собой выполнение репликации спектральной полосы (SBR).

В соответствии с еще одним вариантом осуществления параметрическое повышающее микширование на стадии повышающего микширования выполняется с использованием параметров повышающего микширования. Параметры повышающего микширования принимаются кодирующим устройством, например, на приемной стадии, и посылаются на стадию повышающего микширования. Генерируется декоррелированная версия N объединенных сигналов понижающего микширования с расширенным диапазоном частоты, и N объединенных сигналов понижающего микширования с расширенным диапазоном частоты и декоррелированная версия N объединенных сигналов понижающего микширования с расширенным диапазоном частоты подвергаются матричной операции. Параметры матричной операции даются параметрами повышающего микширования.

В соответствии с еще одним вариантом осуществления принятые N сигналов понижающего микширования с кодированием формы на первой приемной стадии и принятые M сигналов с кодированием формы на второй приемной стадии кодируются с использованием перекрывающихся многооконных преобразований с независимой многооконной работой для N сигналов понижающего микширования с кодированием формы и M сигналов с кодированием формы соответственно.

Преимущество этого может заключаться в том, что это обеспечивает повышенное качество кодирования и, таким образом, повышенное качество декодированного многоканального звукового сигнала. Например, если в некоторый момент времени обнаруживается переходное состояние при более высокой частоте, кодер формы сигнала может кодировать этот конкретный временной кадр с более короткой последовательностью в окне, а для полосы более низких частот может сохраняться последовательность в окне по умолчанию.

В соответствии с вариантами осуществления декодирующее устройство может содержать третью приемную стадию, предназначенную для приема дополнительного сигнала с кодированием формы, содержащего спектральные коэффициенты, соответствующие подмножеству частот выше первой частоты разделения каналов. Декодирующее устройство может дополнительно содержать стадию чередования после стадии повышающего микширования. Стадия чередования может предназначаться для чередования дополнительного сигнала с кодированием формы с одним из M сигналов повышающего микширования. Третья приемная стадия может дополнительно предназначаться для приема нескольких дополнительных сигналов с кодированием формы, а стадия чередования может дополнительно предназначаться для чередования нескольких дополнительных сигналов с кодированием формы с несколькими из M сигналов повышающего микширования.

Это является преимущественным в том, что некоторые части частотного диапазона выше первой частоты разделения каналов, которые трудно параметрически реконструировать из сигналов понижающего микширования, могут быть представлены в виде с кодированной формой для чередования с параметрически реконструированными сигналами повышающего микширования.

В одном примерном варианте осуществления чередование выполняется путем добавления дополнительного сигнала с кодированием формы с одним из M сигналов повышающего микширования. В соответствии с еще одним примерным вариантом осуществления стадия чередования дополнительного сигнала с кодированием формы с одним из M сигналов повышающего микширования включает замену одного из M сигналов повышающего микширования дополнительным сигналом с кодированием формы в подмножестве частот выше первой частоты разделения каналов, соответствующих спектральным коэффициентам дополнительного сигнала с кодированием формы.

В соответствии с примерными вариантами осуществления декодирующее устройство может дополнительно предназначаться для приема управляющего сигнала, например, третьей приемной стадией. Управляющий сигнал может указывать как чередовать дополнительный сигнал с кодированием формы с одним из M сигналов повышающего микширования, при этом стадия чередования дополнительного сигнала с кодированием формы с одним из M сигналов повышающего микширования основывается на управляющем сигнале. В частности, управляющий сигнал может указывать частотный диапазон и временной диапазон, такие как один или несколько временных/частотных плиток в области QMF, для которых дополнительный сигнал с кодированием формы должен чередоваться с одним из M сигналов повышающего микширования. Соответственно, чередование может происходить во времени и частоте в одном канале.

Преимуществом этого является то, что можно выбирать временные диапазоны и частотные диапазоны, не страдающие от проблем наложения спектров или запуска/замирания перекрывающегося многооконного преобразования, используемого для кодирования сигналов с кодированием формы.

Обзор: кодирующее устройство

В соответствии со вторым аспектом примерные варианты осуществления предлагают способы, устройства и компьютерные программные продукты для кодирования многоканального звукового сигнала на основании входного сигнала.

Предлагаемые способы, устройства и компьютерные программные продукты могут, как правило, иметь одни и те же признаки и преимущества.

Преимущества, касающиеся признаков и устройств, представленных в обзоре декодирующего устройства выше, могут, как правила, распространяться и на соответствующие признаки и установки для кодирующего устройства.

В соответствии с примерными вариантами осуществления предлагается кодирующее устройство для многоканальной системы обработки звуковых сигналов для кодирования M каналов, где M > 2.

Кодирующее устройство содержит приемную стадию, предназначенную для приема M сигналов, соответствующих M каналам, подлежащих кодированию.

Кодирующее устройство дополнительно содержит первую стадию кодирования формы, предназначенную для приема M сигналов из приемной стадии и для генерирования M сигналов с кодированием формы путем индивидуального кодирования формы M сигналов для частотного диапазона, соответствующего частотам до первой частоты разделения каналов, при этом M сигналов с кодированием формы содержат спектральные коэффициенты, соответствующие частотам до первой частоты разделения каналов.

Кодирующее устройство дополнительно содержит стадию понижающего микширования, предназначенную для приема M сигналов из приемной стадии и для понижающего микширования M сигналов в N сигналов понижающего микширования, где 1<N<M.

Кодирующее устройство дополнительно содержит стадию кодирования высокочастотной реконструкции, предназначенную для приема N сигналов понижающего микширования из стадии понижающего микширования и для подвергания N сигналов понижающего микширования кодированию высокочастотной реконструкции, при этом стадия кодирования высокочастотной реконструкции предназначена для извлечения параметров высокочастотной реконструкции, делающих возможной высокочастотную реконструкцию N сигналов понижающего микширования выше второй частоты разделения каналов.

Кодирующее устройство дополнительно содержит стадию параметрического кодирования, предназначенную для приема M сигналов из приемной стадии и N сигналов понижающего микширования из стадии понижающего микширования и для подвергания M сигналов параметрическому кодированию для частотного диапазона, соответствующего частотам выше первой частоты разделения каналов, при этом стадия параметрического кодирования предназначена для извлечения параметров повышающего микширования, делающих возможным повышающее микширование N сигналов понижающего микширования в M реконструированных сигналов, соответствующих M каналам для частотного диапазона выше первой частоты разделения каналов.

Кодирующее устройство дополнительно содержит вторую стадию кодирования формы, предназначенную для приема N сигналов понижающего микширования из стадии понижающего микширования и для генерирования N сигналов понижающего микширования с кодированием формы путем кодирования формы N сигналов понижающего микширования для частотного диапазона, соответствующего частотам между первой и второй частотами разделения каналов, при этом N сигналов понижающего микширования с кодированием формы содержат спектральные коэффициенты, соответствующие частотам между первой частотой разделения каналов и второй частотой разделения каналов.

В соответствии с одним вариантом осуществления подвергание N сигналов понижающего микширования кодированию высокочастотной реконструкции на стадии кодирования высокочастотной реконструкции выполняется в частотной области, предпочтительно, в области квадратурных зеркальных фильтров (QMF).

В соответствии с одним дополнительным вариантом осуществления подвергание M сигналов параметрическому кодированию на стадии параметрического кодирования выполняется в частотной области, предпочтительно, в области квадратурных зеркальных фильтров (QMF).

В соответствии с еще одним вариантом осуществления генерирование M сигналов с кодированием формы путем индивидуального кодирования формы M сигналов на первой стадии кодирования формы параметрическому кодированию перекрывающегося многооконного преобразования к M сигналам, при этом разные перекрывающиеся последовательности в окне используются по меньшей мере для двух M сигналов.

В соответствии с вариантами осуществления кодирующее устройство может дополнительно содержать третью стадию кодирования формы, предназначенную для генерирования дополнительного сигнала кодированной формы путем кодирования формы одного из M сигналов для частотного диапазона, соответствующего подмножеству частотного диапазона выше первой частоты разделения каналов.

В соответствии с вариантами осуществления кодирующее устройство может содержать стадию генерирования управляющего сигнала. Стадия генерирования управляющего сигнала предназначена для генерирования управляющего сигнала, указывающего, как чередовать дополнительный сигнал с кодированием формы с параметрической реконструкцией одного из M сигналов в декодирующем устройстве. Например, управляющий сигнал может указывать частотный диапазон и временной диапазон, для которых дополнительный сигнал с кодированием формы должен чередоваться с одним из M сигналов повышающего микширования.

Примерные варианты осуществления

Фиг. 1 представляет собой обобщенную блок-схему декодирующего устройства 100 в многоканальной системе обработки звуковых сигналов для реконструкции М кодированных каналов. Декодирующее устройство 100 содержит три концептуальные части 200, 300, 400, которые будут подробнее объяснены ниже со ссылками на фиг. 2-4. В первой концептуальной части 200 кодирующее устройство принимает N сигналов понижающего микширования с кодированием формы и M сигналов с кодированием формы, представляющих многоканальный звуковой сигнал, подлежащий декодированию, где 1<N<M. В проиллюстрированном примере N задано равным 2. Во второй концептуальной части 300 M сигналов с кодированием формы микшируются с понижением и объединяются с N сигналами понижающего микширования с кодированием формы. Затем выполняется высокочастотная реконструкция (HFR) для объединенных сигналов понижающего микширования. В третьей концептуальной части 400 прошедшие высокочастотную реконструкцию сигналы микшируются с повышением, и M сигналов с кодированием формы объединяются с сигналами повышающего микширования для реконструкции М кодированных каналов.

В примерном варианте осуществления, описанном со ссылками на фиг. 2-4, описывается реконструкция закодированного 5.1-канального объемного звука. Можно отметить, что в описанном варианте осуществления или на графических материалах сигнал низкочастотных эффектов не упоминается. Это не означает, что любые низкочастотные эффекты пренебрегаются. Низкочастотные эффекты (Lfe) добавляются к реконструированным 5 каналам любым подходящим путем, хорошо известным специалисту в области техники, к которой относится изобретение. Можно также отметить, что описанное декодирующее устройство в равной мере хорошо подходит для других типов кодированного объемного звука, таких как 7.1- или 9.1-канальный объемный звук.

Фиг. 2 иллюстрирует концептуальную первую часть 200 декодирующего устройства 100 на фиг. 1. Декодирующее устройство содержит две приемные стадии 212, 214. На первой приемной стадии 212 битовый поток 202 декодируется и деквантируется в два сигнала 208a-b понижающего микширования с кодированием формы. Каждый из этих двух сигналов 208a-b понижающего микширования с кодированием формы содержит спектральные коэффициенты, соответствующие частотам между первой частотой ky разделения каналов и второй частотой kx разделения каналов.

На второй приемной стадии 212 битовый поток 202 декодируется и деквантируется в пять сигналов 210a-e с кодированием формы. Каждый из пяти сигналов 208a-e понижающего микширования с кодированием формы содержит спектральные коэффициенты, соответствующие частотам до первой частоты ky разделения каналов.

Как пример, сигналы 210a-e содержат двухканальные парные элементы и один одноканальный элемент для центра. Канальные парные элементы могут, например, представлять собой комбинацию левого переднего и левого объемного сигналов и комбинацию правого переднего и правого объемного сигналов. Один дополнительный пример - это комбинация левого переднего и правого переднего сигналов и комбинация левого объемного и правого объемного сигналов. Эти канальные парные элементы могут, например, кодироваться в формате «сумма и разность». Все пять сигналов 210a-e могут кодироваться с использованием перекрывающихся многооконных преобразований с независимой многооконной работой и по-прежнему оставаться декодируемыми декодирующим устройством. Это может обеспечить повышенное качество кодирования и, таким образом, повышенное качество декодированного сигнала.

Как пример, первая частота ky разделения каналов равна 1,1 кГц. Как пример, вторая частота kх разделения каналов лежит в диапазоне 5,6-8 кГц. Следует отметить, что первая частота ky разделения каналов может варьировать, даже на базе отдельного сигнала, т. е. кодирующее устройство может обнаруживать, что некая составляющая сигнала в конкретном выходном сигнале не может быть точно воспроизведена стерео сигналами 208a-b понижающего микширования, и может - для этого конкретного момента времени - увеличить полосу частот, т. е. первую частоту ky разделения каналов, соответствующего сигнала с кодированием формы, т. е. 210a-e, для выполнения надлежащего кодирования формы этой составляющей сигнала.

Как будет описано позже в настоящем описании, остальные стадии кодирующего устройства 100 типично действуют в области квадратурных зеркальных фильтров (QMF). По этой причине каждый из сигналов 208a-b, 210a-e, принятых первой и второй приемными стадиями 212, 214, которые принимаются в виде модифицированного дискретного косинусного преобразования (MDCT), преобразовывается во временную область с использованием обратного MDCT 216. Затем каждый сигнал преобразуется обратно в частотную область с использованием QMF-преобразования 218.

На фиг. 3 пять сигналов 210 с кодированием формы микшируются с понижением в два сигнала 310, 312 понижающего микширования, содержащие спектральные коэффициенты, соответствующие частотам до первой частоты ky разделения каналов, на стадии 308 понижающего микширования. Эти сигналы 310, 312 понижающего микширования могут формироваться путем выполнения понижающего микширования на низкочастотных многоканальных сигналах 210a-e с использованием той же схемы понижающего микширования, которая использовалась в кодирующем устройстве для создания двух сигналов 208a-b понижающего микширования, показанных на фиг. 2.

Эти два новых сигнала 310, 312 понижающего микширования затем объединяются на первой объединительной стадии 320, 322 с соответствующим сигналом 208a-b понижающего микширования для образования объединенных сигналов 302a-b понижающего микширования. Таким образом, каждый из объединенных сигналов 302a-b понижающего микширования содержит спектральные коэффициенты, соответствующие частотам до первой частоты ky разделения каналов, берущие начало из сигналов 310, 312 понижающего микширования, и спектральные коэффициенты, соответствующие частотам между первой частотой ky разделения каналов и второй частотой kx разделения каналов, берущие начало из двух сигналов 208a-b понижающего микширования с кодированием формы, принятых на первой приемной стадии 212 (показанной на фиг. 2).

Кодирующее устройство дополнительно содержит стадию 314 высокочастотной реконструкции (HFR). Стадия HFR предназначена для расширения каждого из двух объединенных сигналов 302a-b понижающего микширования из объединительной стадии в частотный диапазон выше второй частоты kx разделения каналов путем выполнения высокочастотной реконструкции. В соответствии с некоторыми вариантами осуществления выполненная высокочастотная реконструкция может представлять собой выполнение репликации спектральной полосы (SBR). Высокочастотная реконструкция может выполняться с использованием параметров высокочастотной реконструкции, которые могут приниматься на стадии 314 HFR, любым подходящим путем.

Выходом из стадии 314 высокочастотной реконструкции 314 являются два сигнала 304a-b, представляющие собой сигналы 208a-b понижающего микширования с примененным HFR-расширением 316, 318. Как уже отмечалось, стадия 314 HFR представляет собой выполнение высокочастотной реконструкции, исходя из частот, присутствующих во входном сигнале 210a-e из второй приемной стадии 214 (показанной на фиг. 2), объединенном с двумя сигналами 208a-b понижающего микширования. Несколько упрощенно, диапазон 316, 318 HFR содержит части спектральных коэффициентов из сигналов 310, 312 понижающего микширования, копированные до диапазона 316, 318 HFR. Следовательно, части пяти сигналов 210a-e с кодированием формы появятся в диапазоне 316, 318 HFR выходного сигнала 304 из стадии 314 HFR.

Следует отметить, что понижающее микширование на стадии 308 понижающего микширования и объединение на первой объединительной стадии 320, 322 перед стадией 314 высокочастотной реконструкции 314 может выполняться во временной области, т. е. после того, как каждый сигнал преобразовался во временную область с использованием обратного модифицированного дискретного косинусного преобразования (MDCT) 216 (показанного на фиг. 2). Однако, учитывая, что сигналы 210a-e с кодированием формы и сигналы 208a-b понижающего микширования с кодированием формы могут кодироваться кодером формы сигнала с использованием перекрывающихся многооконных преобразований с независимой многооконной работой, сигналы 210a-e и 208a-b не могут беспроблемно («бесшовно») объединяться во временной области. Таким образом, лучше управляемый сценарий достигается, если, по меньшей мере, объединение на первой объединительной стадии 320, 322 выполняется в области QMF.

Фиг. 4 иллюстрирует третью и последнюю концептуальную часть 400 кодирующего устройства 100. Выход 304 из стадии 314 HFR являет собой вход для стадии 402 повышающего микширования. Стадия 402 повышающего микширования создает пятисигнальный выход 404a-e путем выполнения параметрического повышающего микширования на сигналах 304a-b с расширенным диапазоном частоты. Каждый из пяти сигналов 404a-e повышающего микширования соответствует одному из пяти кодированных каналов в закодированном 5.1-канальном объемном звуке для частот выше первой частоты ky разделения каналов. В соответствии с примерной методикой параметрического повышающего микширования стадия 402 повышающего микширования вначале принимает параметры параметрического микширования. Стадия 402 повышающего микширования дополнительно генерирует декоррелированные версии двух объединенных сигналов 304a-b понижающего микширования с расширенным диапазоном частоты. Стадия 402 повышающего микширования дополнительно подвергает два объединенных сигналов 304a-b понижающего микширования с расширенным диапазоном частоты и декоррелированные версии двух объединенных сигналов 304a-b понижающего микширования с расширенным диапазоном частоты матричной операции, при этом параметры матричной операции даются параметрами повышающего микширования. Альтернативно, может использоваться любая иная методика параметрического повышающего микширования, известная в области техники, к которой относится изобретение. Применимые методики параметрического повышающего микширования описаны, например, в “MPEG Surround- ISO/MPEG Standard for Efficient and Compatible Multichannel Audio Coding'' (Flerre et al., Journal of Audio Engineering Society, Vol. 56, No. 11, 2008 November).

Таким образом, выход 404a-e из стадии 402 повышающего микширования 402 не содержит частот ниже первой частоты ky разделения каналов. Остальные спектральные коэффициенты, соответствующие частотам до первой частоты ky разделения каналов, существуют в пяти сигналах 210a-e с кодированием формы, задержанных на стадии 412 задержки, для синхронизации сигналов 404 повышающего микширования.

Кодирующее устройство 100 дополнительно содержи

Звуковые кодирующее устройство и декодирующее устройство

Патент 2602988