2641463 - Структура декоррелятора для параметрического восстановления звуковых сигналов

Структура декоррелятора для параметрического восстановления звуковых сигналов

Иллюстрации

Показать все

Изобретение относится к области кодирования и декодирования звуковых сигналов. Технический результат – повышение точности восстановления звуковых сигналов. Система кодирования кодирует множественные звуковые сигналы (X) в виде сигнала (Y) понижающего микширования вместе с коэффициентами (P, C) управляемого и прямого повышающего микширования. В системе декодирования блок предварительного умножения вычисляет промежуточный сигнал (W) путем линейного отображения сигнала понижающего микширования в соответствии с первым набором коэффициентов (Q); декорреляционная секция выдает декоррелированный сигнал (Z) на основании промежуточного сигнала; секция управляемого повышающего микширования вычисляет сигнал управляемого повышающего микширования; секция прямого повышающего микширования вычисляет сигнал прямого повышающего микширования; секция суммирования предоставляет многомерный восстановленный сигнал () путем суммирования сигналов управляемого и прямого повышающего микширования; и преобразователь вычисляет первый набор коэффициентов, основываясь на коэффициентах управляемого и прямого повышающего микширования, и подает его на блок предварительного умножения. 5 н. и 13 з.п. ф-лы, 4 ил.

Реферат

ПЕРЕКРЕСТНЫЕ ССЫЛКИ НА РОДСТВЕННЫЕ ЗАЯВКИ

Настоящая заявка испрашивает приоритет по предварительным заявкам на патенты США № 61/973,646, поданной 1 апреля 2014, и № 61/893,770, поданной 21 октября 2013, каждая из которых полностью включается в данный документ путем ссылки.

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Настоящее изобретение, раскрываемое в данном документе, в целом, имеет отношение к кодированию и декодированию звуковых сигналов, а в частности к параметрическому восстановлению множества звуковых сигналов из сигнала понижающего микширования и ассоциированных метаданных.

УРОВЕНЬ ТЕХНИКИ

Системы воспроизведения звука, содержащие несколько громкоговорителей, часто используются для воспроизведения звуковой сцены, представленной множеством звуковых сигналов, при этом соответственные звуковые сигналы воспроизводятся на соответственных громкоговорителях. Звуковые сигналы, например, могли быть записаны при помощи множества акустических преобразователей или могли быть сгенерированы посредством оборудования для проектирования звуковых данных. Во многих ситуациях имеются ограничения полосы пропускания для передачи звуковых сигналов к воспроизводящему оборудованию и/или ограниченное пространство для хранения звуковых сигналов в компьютерном запоминающем устройстве или на переносном устройстве хранения данных. Существуют системы кодирования звука для параметрического кодирования звуковых сигналов, чтобы уменьшить полосу пропускания или необходимую емкость хранилища. На стороне кодера эти системы обычно осуществляют понижающее микширование звуковых сигналов в сигнал понижающего микширования, который обычно является монофоническим (один канал) или стереофоническим (два канала) понижающим микшированием, и выделяют дополнительную информацию, описывающую характеристики звуковых сигналов посредством параметров, таких как разности уровней и взаимная корреляция. Затем понижающее микширование и дополнительная информация кодируются и отправляются на сторону декодера. На стороне декодера множество звуковых сигналов восстанавливают, т.е. аппроксимируют, из понижающего микширования, руководствуясь параметрами из дополнительной информации. Декорреляторы часто используются в рамках параметрического восстановления для повышения размерности звукового содержимого, предоставленного понижающим микшированием, чтобы обеспечить возможность более верного восстановления множества звуковых сигналов. То, каким образом спроектировать и реализовать декорреляторы, может быть ключевыми факторами для повышения точности восстановления.

Ввиду широкого ассортимента разных типов устройств и систем, пригодных для воспроизведения множества звуковых сигналов, представляющих звуковую сцену, включая сюда перспективный сегмент, нацеленный на конечных пользователей в своих домах, существует потребность в новых и альтернативных методах эффективного кодирования множества звуковых сигналов, с тем чтобы уменьшить требования к полосе пропускания и/или требуемую емкость запоминающего устройства для хранения, и/или облегчить восстановление множества звуковых сигналов на стороне декодера.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

В дальнейшем иллюстративные варианты осуществления будут описаны более подробно и со ссылкой на прилагаемые чертежи, на которых:

Фиг. 1 является обобщенной структурной схемой секции параметрического восстановления для восстановления множества звуковых сигналов на основании сигнала понижающего микширования и ассоциированных коэффициентов управляемого (wet) и прямого (dry) повышающего микширования в соответствии с одним из иллюстративных вариантов осуществления;

Фиг. 2 является обобщенной структурной схемой системы декодирования звука, содержащей секцию параметрического восстановления, изображенную на Фиг. 1, в соответствии с одним из иллюстративных вариантов осуществления;

Фиг. 3 является обобщенной структурной схемой секции параметрического кодирования для кодирования множества звуковых сигналов в виде данных, подходящих для параметрического восстановления, в соответствии с одним из иллюстративных вариантов осуществления; и

Фиг. 4 является обобщенной структурной схемой системы кодирования звука, содержащей секцию параметрического кодирования, изображенную на Фиг. 3, в соответствии с одним из иллюстративных вариантов осуществления.

Все эти чертежи являются схематичными и лишь в общих чертах демонстрируют элементы, которые необходимы для того, чтобы пояснить настоящее изобретение, тогда как другие элементы могут быть опущены или просто предполагаться.

ОПИСАНИЕ ИЛЛЮСТРАТИВНЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ

Как используется в данном документе, звуковой сигнал может быть чистым звуковым сигналом, звуковой частью видеозвукового сигнала или мультимедийного сигнала или каждого из них в сочетании с метаданными.

Как используется в данном документе, канал представляет собой звуковой сигнал, ассоциированный с предварительно заданным/фиксированным пространственным положением/ ориентацией или с незаданным пространственным положением, таким как "слева" или "справа".

Как используется в данном документе, звуковой объект или сигнал звукового объекта представляет собой звуковой сигнал, ассоциированный с пространственным положением, допускающим изменяемость со временем, т.е. пространственным положением, значение которого может быть повторно назначено или обновлено с течением времени.

I. Краткий обзор

В соответствии с первым аспектом, иллюстративные варианты осуществления предлагают системы декодирования звука, а также способы и компьютерные программные продукты для восстановления множества звуковых сигналов. Предлагаемые системы, способы и компьютерные программные продукты для декодирования в соответствии с первым аспектом, могут в общем смысле быть связаны одними и теми же признаками и преимуществами.

В соответствии с иллюстративными вариантами осуществления предоставляется способ восстановления множества звуковых сигналов. Способ содержит этапы, на которых: принимают временной/частотный фрагмент сигнала понижающего микширования вместе с ассоциированными коэффициентами управляемого и прямого повышающего микширования, при этом сигнал понижающего микширования содержит меньше каналов, чем количество звуковых сигналов, подлежащих восстановлению; вычисляют первый сигнал с одним или несколькими каналами, называемый промежуточным сигналом, как линейное отображение сигнала понижающего микширования, причем первый набор коэффициентов применяется к каналам сигнала понижающего микширования в рамках вычисления промежуточного сигнала; генерируют второй сигнал с одним или несколькими каналами, называемый декоррелированным сигналом, путем обработки одного или нескольких каналов промежуточного сигнала; вычисляют третий сигнал с множеством каналов, называемый сигналом управляемого повышающего микширования, как линейное отображение декоррелированного сигнала, причем второй набор коэффициентов применяется к одному или нескольким каналам декоррелированного сигнала в рамках вычисления сигнала управляемого повышающего микширования; вычисляют четвертый сигнал с множеством каналов, называемый сигналом прямого повышающего микширования, как линейное отображение сигнала понижающего микширования, причем третий набор коэффициентов применяется к каналам сигнала понижающего микширования в рамках вычисления сигнала прямого повышающего микширования; и суммируют сигналы управляемого и прямого повышающего микширования, чтобы получить многомерный восстановленный сигнал, соответствующий временному/частотному фрагменту множества звуковых сигналов, подлежащих восстановлению. В настоящем иллюстративном варианте осуществления второй и третий наборы коэффициентов соответствуют принятым коэффициентам управляемого и прямого повышающего микширования соответственно; а первый набор коэффициентов вычисляется согласно предварительно заданному правилу на основании коэффициентов управляемого и прямого повышающего микширования.

Добавление декоррелированного сигнала служит для увеличения размерности содержимого многомерного восстановленного сигнала, который воспринимается слушателем, и повышения точности воспроизведения многомерного восстановленного сигнала. Каждый из одного или нескольких каналов декоррелированного сигнала может иметь, по меньшей мере, приблизительно такой же спектр, как соответствующий канал из одного или нескольких каналов промежуточного сигнала, или могут иметь спектры, соответствующие перемасштабированной/нормализованной версии спектра соответствующего канала из одного или нескольких каналов промежуточного сигнала, и один или несколько каналов декоррелированного сигнала могут быть, по меньшей мере, почти взаимно некоррелированными. Один или несколько каналов декоррелированного сигнала, по возможности, могут быть, по меньшей мере, почти некоррелированными относительно одного или нескольких каналов промежуточного сигнала и каналов сигнала понижающего микширования. Хотя и можно синтезировать взаимно некоррелированные сигналы с заданным спектром, например из белого шума, один или несколько каналов декоррелированного сигнала в соответствии с настоящим иллюстративным вариантом осуществления генерируются путем обработки промежуточного сигнала, например, включающей в себя применение соответственных всечастотных фильтров к соответственным одному или нескольким каналам промежуточного сигнала или перекомпоновку частей соответственных одного или нескольких каналов промежуточного сигнала, чтобы сохранить как можно больше характеристик, особенно локально постоянных характеристик, промежуточного сигнала, в том числе относительно менее явные, обусловленные психофизиологией слухового восприятия, характеристики промежуточного сигнала, такие как тембр.

Авторы настоящего изобретения поняли, что выбор промежуточного сигнала, из которого выводится декоррелированный сигнал, может повлиять на точность воспроизведения восстановленных звуковых сигналов, и что если некоторые характеристики подлежащих восстановлению звуковых сигналов изменяются, например, если подлежащие восстановлению звуковые сигналы являются звуковыми объектами с изменяющимися во времени положениями, точность воспроизведения восстановленных звуковых сигналов может быть повышена, если вычисления, с помощью которых получается промежуточный сигнал, соответствующим образом адаптируются. В настоящем иллюстративном варианте осуществления вычисление промежуточного сигнала включает в себя применение первого набора коэффициентов к каналам сигналов понижающего микширования, а следовательно, первый набор коэффициентов обеспечивает возможность, по меньшей мере, некоторого контроля над тем, как вычисляется промежуточный сигнал, что позволяет повысить точность воспроизведения восстановленных звуковых сигналов.

Авторы настоящего изобретения также поняли, что принятые коэффициенты управляемого и прямого повышающего микширования, используемые для вычисления сигналов управляемого и прямого повышающего микширования, соответственно несут информацию, которая может быть использована, чтобы вычислять подходящие значения для первого набора коэффициентов. Благодаря вычислению первого набора коэффициентов, согласно предварительно заданному правилу, на основании коэффициентов управляемого и прямого повышающего микширования объем информации, необходимый для того чтобы обеспечить условия для восстановления множества звуковых сигналов, уменьшается, что позволяет сократить объем метаданных, передаваемых вместе с сигналом понижающего микширования со стороны кодера. За счет уменьшения объема данных, необходимого для параметрического восстановления, требуемая полоса пропускания для передачи параметрического представления множества звуковых сигналов, подлежащих восстановлению, и/или требуемая емкость запоминающего устройства для хранения такого представления могут быть уменьшены.

Под соответствием второго и третьего наборов коэффициентов принятым коэффициентам управляемого и прямого повышающего микширования соответственно подразумевается, что второй и третий наборы коэффициентов совпадают с коэффициентами управляемого и прямого повышающего микширования соответственно, или что второй и третий наборы коэффициентов однозначно регулируются (или выводятся из них) коэффициентами управляемого и прямого повышающего микширования соответственно. Например, второй набор коэффициентов может быть выведен из коэффициентов управляемого повышающего микширования, даже если число коэффициентов управляемого повышающего микширования ниже, чем число коэффициентов во втором наборе коэффициентов, например если предварительно заданные формулы для определения второго набора коэффициентов на основании коэффициентов управляемого повышающего микширования известны на стороне декодера.

Суммирование сигналов управляемого и прямого повышающего микширования может включать в себя добавление звукового содержимого из соответственных каналов сигнала управляемого повышающего микширования к звуковому содержимому соответственных отвечающих каналов сигнала прямого повышающего микширования, например аддитивное микширование по каждому отсчету или по каждому коэффициенту преобразования.

Под тем, что промежуточный сигнал является линейным отображением сигнала понижающего микширования, подразумевается, что промежуточный сигнал получается путем применения первого линейного преобразования к сигналу понижающего микширования. Это первое преобразование берет предварительно заданное число каналов в качестве входа и предоставляет предварительно заданное число из одного или нескольких каналов в качестве выхода, а первый набор коэффициентов включает в себя коэффициенты, задающие количественные характеристики этого первого линейного преобразования.

Под тем, что сигнал управляемого повышающего микширования является линейным отображением декоррелированного сигнала, подразумевается, что сигнал управляемого повышающего микширования получается путем применения второго линейного преобразования к декоррелированному сигналу. Это второе преобразование берет предварительно заданное число из одного или нескольких каналов в качестве входа и предоставляет предварительно заданное (второе) число каналов в качестве выхода, а второй набор коэффициентов включает в себя коэффициенты, задающие количественные характеристики этого второго линейного преобразования.

Под тем, что сигнал прямого повышающего микширования является линейным отображением сигнала понижающего микширования, подразумевается, что сигнал прямого повышающего микширования получается путем применения третьего линейного преобразования к сигналу понижающего микширования. Это третье преобразование берет предварительно заданное (третье) число каналов в качестве входа и предоставляет предварительно заданное число каналов в качестве выхода, а третий набор коэффициентов включает в себя коэффициенты, задающие количественные характеристики этого третьего линейного преобразования.

Системы кодирования/декодирования звука, как правило, разделяют частотно-временное пространство на временные/частотные фрагменты, например, применяя подходящие банки фильтров к входным звуковым сигналам. Под временным/частотным фрагментом в общем случае подразумевается часть частотно-временного пространства, соответствующая временному интервалу и частотному поддиапазону. Временной интервал, как правило, может соответствовать продолжительности временного кадра, используемого в системе кодирования/декодирования звука. Частотный поддиапазон, как правило, может соответствовать одному или нескольким соседним частотным поддиапазонам, задаваемым банком фильтров, использующимся в системе кодирования/ декодирования. В случае когда частотный поддиапазон соответствует нескольким соседним частотным поддиапазонам, задаваемым банком фильтров, это позволяет иметь неоднородные частотные поддиапазоны в процессе декодирования/восстановления звукового сигнала, например более широкие частотные поддиапазоны для более высоких частот звукового сигнала. В широкополосном случае, когда система кодирования/декодирования звука работает во всей полосе частот, частотный поддиапазон временного/частотного фрагмента может соответствовать всей полосе частот. Способ в соответствии с настоящим иллюстративным вариантом осуществления описывается через этапы для восстановления множества звуковых сигналов для одного такого временного/частотного фрагмента. Однако следует понимать, что способ может быть повторен для каждого временного/частотного фрагмента системы кодирования/декодирования звука. Кроме того, следует понимать, что несколько временных/частотных фрагментов могут быть восстановлены одновременно. Как правило, соседние временные/частотные фрагменты могут быть непересекающимися или могут частично перекрываться.

В одном из иллюстративных вариантов осуществления промежуточный сигнал, который должен быть переработан в декоррелированный сигнал, может быть получен путем линейного отображения сигнала прямого повышающего микширования, т.е. промежуточный сигнал может быть получен путем применения линейного преобразования к сигналу прямого повышающего микширования. Благодаря использованию промежуточного сигнала, получаемого путем линейного отображения сигнала прямого повышающего микширования, который вычисляется как линейное отображение сигнала понижающего микширования, сложность вычислений, требуемых для получения декоррелированного сигнала, может быть уменьшена, что обеспечивает возможность более эффективного в вычислительном отношении восстановления звуковых сигналов. По меньшей мере, в некоторых иллюстративных вариантах осуществления коэффициенты прямого повышающего микширования могли быть определены на стороне кодера таким образом, что сигнал прямого повышающего микширования, вычисленный на стороне декодера, аппроксимирует звуковые сигналы, подлежащие восстановлению. Генерирование декоррелированного сигнала на основании промежуточного сигнала, получаемого путем линейного отображения результата такой аппроксимации, может повысить точность воспроизведения восстановленных звуковых сигналов.

В одном из иллюстративных вариантов осуществления промежуточный сигнал может быть получен путем применения к сигналу прямого повышающего микширования набора коэффициентов, представляющих собой абсолютные значения коэффициентов управляемого повышающего микширования. Промежуточный сигнал, например, может быть получен путем формирования одного или нескольких каналов промежуточного сигнала в виде соответственных одной или нескольких линейных комбинаций каналов сигнала прямого повышающего микширования, при этом абсолютные значения коэффициентов управляемого повышающего микширования могут быть применены к соответственным каналам сигнала прямого повышающего микширования в качестве коэффициентов усиления в одной или нескольких линейных комбинациях. Благодаря использованию промежуточного сигнала, получаемого путем отображения сигнала прямого повышающего микширования, в результате применения набора коэффициентов, представляющих собой абсолютные значения коэффициентов управляемого повышающего микширования, может быть снижен риск потери точности, возникающей в промежуточном сигнале между вкладами от соответственных каналов сигнала прямого повышающего микширования, из-за коэффициентов управляемого повышающего микширования, имеющих разные знаки. За счет снижения риска потери точности в промежуточном сигнале энергия/амплитуда декоррелированного сигнала, генерируемого из промежуточного сигнала, согласуется с энергией/амплитудой звуковых сигналов в восстановленном виде, и резкие колебания коэффициентов управляемого повышающего микширования могут быть предотвращены или могут возникать реже.

В одном из иллюстративных вариантов осуществления первый набор коэффициентов может быть вычислен путем обработки коэффициентов управляемого повышающего микширования согласно предварительно заданному правилу и перемножения обработанных коэффициентов управляемого повышающего микширования и коэффициентов прямого повышающего микширования. Например, обработанные коэффициенты управляемого повышающего микширования и коэффициенты прямого повышающего микширования могут быть упорядочены в виде соответственных матриц, и первый набор коэффициентов может соответствовать матрице, вычисленной как матричное произведение этих двух матриц.

В одном из иллюстративных вариантов осуществления предварительно заданное правило для обработки коэффициентов управляемого повышающего микширования может включать в себя операцию поэлементного получения абсолютного значения.

В одном из иллюстративных вариантов осуществления коэффициенты управляемого и прямого повышающего микширования могут быть упорядочены в виде соответственных матриц, и предварительно заданное правило для обработки коэффициентов управляемого повышающего микширования может включать в себя, в любом порядке, поэлементное вычисление абсолютных значений всех элементов и переупорядочивание элементов, чтобы обеспечить возможность непосредственного матричного умножения на матрицу коэффициентов прямого повышающего микширования. В настоящем иллюстративном варианте осуществления подлежащие восстановлению звуковые сигналы вносят вклад в один или несколько каналов декоррелированного сигнала через сигнал понижающего микширования, на котором основывается промежуточный сигнал, и один или несколько каналов декоррелированного сигнала вносят вклад в звуковые сигналы в восстановленном виде через сигнал управляемого повышающего микширования. Авторы настоящего изобретения поняли, что для того чтобы повысить точность воспроизведения звуковых сигналов в восстановленном виде, может быть целесообразно стремиться соблюдать следующий принцип: звуковые сигналы, в которые заданный канал декоррелированного сигнала вносит вклад при параметрическом восстановлении, должны вносить вклад через сигнал понижающего микширования в тот же канал промежуточного звукового сигнала, из которого генерируется этот заданный канал декоррелированного сигнала, и, желательно, в сопоставимом/равном объеме. Предварительно заданное правило в соответствии с настоящим иллюстративным вариантом осуществления можно сказать отражает этот принцип.

Благодаря включению операции поэлементного получения абсолютного значения в предварительно заданное правило для обработки коэффициентов управляемого повышающего микширования может быть снижен риск потери точности, возникающей в промежуточном сигнале между вкладами от соответственных каналов сигнала прямого повышающего микширования, из-за коэффициентов управляемого повышающего микширования, имеющих разные знаки. За счет снижения риска потери точности в промежуточном сигнале энергия/амплитуда декоррелированного сигнала, генерируемого из промежуточного сигнала, согласуется с энергией/амплитудой звуковых сигналов в восстановленном виде, и резкие колебания коэффициентов управляемого повышающего микширования могут быть предотвращены или могут возникать реже.

В одном из иллюстративных вариантов осуществления этапы вычисления и суммирования могут быть выполнены на представлении сигналов в области квадратурного зеркального фильтра (QMF).

В одном из иллюстративных вариантов осуществления может быть принято множество значений коэффициентов управляемого и прямого повышающего микширования, при этом каждое значение ассоциируется с конкретной опорной точкой. В настоящем иллюстративном варианте осуществления способ может дополнительно содержать этапы, на которых: вычисляют, основываясь на значениях коэффициентов управляемого и прямого повышающего микширования, ассоциированных с двумя последовательными опорными точками, соответствующие значения первого набора коэффициентов, затем интерполируют значение первого набора коэффициентов, по меньшей мере, для одного момента времени, заключенного между последовательными опорными точками, основываясь на уже вычисленных значениях первого набора коэффициентов. Другими словами, значения первого набора коэффициентов, вычисленные для двух последовательных опорных точек, используются для интерполяции между этими двумя последовательными опорными точками, чтобы получить значение первого набора коэффициентов, по меньшей мере, для одного момента времени, заключенного между этими двумя последовательными опорными точками. Это предотвращает излишнее повторение относительно более затратного вычисления первого набора коэффициентов на основании коэффициентов управляемого и прямого повышающего микширования.

В соответствии с иллюстративными вариантами осуществления предоставляется система декодирования звука с секцией параметрического восстановления, выполненной с возможностью приема временного/частотного фрагмента сигнала понижающего микширования и ассоциированных коэффициентов управляемого и прямого повышающего микширования, и восстановления множества звуковых сигналов, причем сигнал понижающего микширования имеет меньше каналов, чем количество звуковых сигналов, подлежащих восстановлению. Секция параметрического восстановления содержит: блок предварительного умножения, выполненный с возможностью приема временного/частотного фрагмента сигнала понижающего микширования и выдачи промежуточного сигнала, вычисленного путем линейного отображения сигнала понижающего микширования в соответствии с первым набором коэффициентов, т.е. путем формирования одной или нескольких линейных комбинаций каналов сигнала понижающего микширования с использованием первого набора коэффициентов; декорреляционную секцию, выполненную с возможностью приема промежуточного сигнала и выдачи на его основании декоррелированного сигнала; секцию управляемого повышающего микширования, выполненную с возможностью приема коэффициентов управляемого повышающего микширования, а также декоррелированного сигнала, и вычисления сигнала управляемого повышающего микширования путем линейного отображения декоррелированного сигнала в соответствии с коэффициентами управляемого повышающего микширования, т.е. путем формирования линейных комбинаций одного или нескольких каналов декоррелированного сигнала с использованием коэффициентов управляемого повышающего микширования; секцию прямого повышающего микширования, выполненную с возможностью приема коэффициентов прямого повышающего микширования и параллельно с блоком предварительного умножения временного/частотного фрагмента сигнала понижающего микширования, и выдачи сигнала прямого повышающего микширования, вычисленного путем линейного отображения сигнала понижающего микширования в соответствии с коэффициентами прямого повышающего микширования, т.е. путем формирования линейных комбинаций каналов сигнала понижающего микширования с использованием коэффициентов прямого повышающего микширования; и секцию суммирования, выполненную с возможностью приема сигнала управляемого повышающего микширования и сигнала прямого повышающего микширования и суммирования этих сигналов для получения многомерного восстановленного сигнала, соответствующего временному/частотному фрагменту множества звуковых сигналов, подлежащих восстановлению. Секция параметрического восстановления дополнительно содержит преобразователь, выполненный с возможностью приема коэффициентов управляемого и прямого повышающего микширования, вычисления согласно предварительно заданному правилу первого набора коэффициентов и подачи этого, т.е. первого набора коэффициентов на блок предварительного умножения.

В соответствии со вторым аспектом иллюстративные варианты осуществления предлагают системы кодирования звука, а также способы и компьютерные программные продукты для кодирования множества звуковых сигналов. Предлагаемые системы, способы и компьютерные программные продукты для кодирования в соответствии со вторым аспектом могут в общем смысле быть связаны одними и теми же признаками и преимуществами. Более того, преимущества, представленные выше для признаков систем, способов и компьютерных программных продуктов для декодирования, в соответствии с первым аспектом могут в общем смысле сохранять силу и для соответствующих признаков систем, способов и компьютерных программных продуктов для кодирования в соответствии со вторым аспектом.

В соответствии с иллюстративными вариантами осуществления предоставляется способ кодирования множества звуковых сигналов в виде данных, пригодных для параметрического восстановления. Способ содержит этапы, на которых: принимают временной/частотный фрагмент множества звуковых сигналов; вычисляют сигнал понижающего микширования путем формирования линейных комбинаций звуковых сигналов согласно правилу понижающего микширования, причем сигнал понижающего микширования содержит меньше каналов, чем количество звуковых сигналов, подлежащих восстановлению; определяют коэффициенты прямого повышающего микширования, чтобы задать линейное отображение сигнала понижающего микширования, аппроксимирующее звуковые сигналы, которые должны быть закодированы во временном/частотном фрагменте; определяют коэффициенты управляемого повышающего микширования, основываясь на ковариации звуковых сигналов, которые приняты, и ковариации звуковых сигналов, которые аппроксимированы путем линейного отображения сигнала понижающего микширования; и выдают сигнал понижающего микширования вместе с коэффициентами управляемого и прямого повышающего микширования, причем эти коэффициенты сами по себе обеспечивают возможность вычисления согласно предварительно заданному правилу дополнительного набора коэффициентов, задающих линейное отображение предварительной декорреляции в рамках параметрического восстановления звуковых сигналов. В этом контексте линейное отображение предварительной декорреляции может, к примеру, обеспечивать возможность полной или частичной реконструкции ковариации звуковых сигналов.

Тот факт, что коэффициенты управляемого и прямого повышающего микширования сами по себе обеспечивают возможность вычисления согласно предварительно заданному правилу дополнительного набора коэффициентов, означает, что как только известны коэффициенты (их значения) управляемого и прямого повышающего микширования, дополнительный набор коэффициентов может быть вычислен согласно предварительно заданному правилу, без обращения к каким-либо добавочным коэффициентам (их значениям), отправленным со стороны кодера. Например, способ может включать в себя этап, на котором выдают только сигнал понижающего микширования, коэффициенты управляемого повышающего микширования и коэффициенты прямого повышающего микширования.

На стороне декодера параметрическое восстановление звуковых сигналов может, как правило, включать в себя суммирование сигнала прямого повышающего микширования, полученного посредством линейного отображения сигнала понижающего микширования, с вкладами от декоррелированного сигнала, сгенерированного на основании сигнала понижающего микширования. Под тем, что дополнительный набор коэффициентов задает линейное отображение предварительной декорреляции в рамках параметрического восстановления звуковых сигналов, подразумевается, что дополнительный набор коэффициентов включает в себя коэффициенты, задающие количественные характеристики линейного преобразования, берущего сигнал понижающего микширования в качестве входа и выдающего сигнал с одним или несколькими каналами, называемый промежуточным сигналом, на котором выполняется процедура декорреляции для генерирования декоррелированного сигнала.

Так как дополнительный набор коэффициентов может быть вычислен согласно предварительно заданному правилу, основываясь на коэффициентах управляемого и прямого повышающего микширования, объем информации, необходимый для того, чтобы обеспечить возможность восстановления множества звуковых сигналов, уменьшается, что позволяет сократить объем метаданных, передаваемых вместе с сигналом понижающего микширования на сторону декодера. За счет уменьшения объема данных, необходимого для параметрического восстановления, требуемая полоса пропускания для передачи параметрического представления множества звуковых сигналов, подлежащих восстановлению, и/или требуемая емкость запоминающего устройства для хранения такого представления может быть уменьшена.

Правило понижающего микширования, используемое при вычислении сигнала понижающего микширования, задает количественные характеристики линейных комбинаций звуковых сигналов, т.е. коэффициенты, которые будут применяться к соответственным звуковым сигналам при формировании линейных комбинаций.

Под тем, что коэффициенты прямого повышающего микширования задают линейное отображение сигнала понижающего микширования, аппроксимирующее звуковые сигналы, которые должны быть закодированы, подразумевается, что коэффициенты прямого повышающего микширования являются коэффициентами, задающими количественные характеристики линейного преобразования, берущего сигнал понижающего микширования в качестве входа и выдающего набор звуковых сигналов, аппроксимирующих звуковые сигналы, подлежащих кодированию. Определенный набор коэффициентов прямого повышающего микширования может, например, задавать линейное отображение сигнала понижающего микширования, соответствующее аппроксимации по критерию минимальной среднеквадратической ошибки звукового сигнала, т.е. среди набора линейных отображений сигнала понижающего микширования, определенный набор коэффициентов прямого повышающего микширования может задавать линейное отображение, которое лучше всего аппроксимирует звуковой сигнал в смысле минимума среднеквадратического отклонения.

Коэффициенты управляемого повышающего микширования могут, например, быть определены, основываясь на разности, или путем сравнения, ковариации звуковых сигналов, которые приняты, и ковариации звуковых сигналов, которые аппроксимированы путем линейного отображения сигнала понижающего микширования.

В одном из иллюстративных вариантов осуществления может быть принято множество временных/частотных фрагментов звуковых сигналов, и сигнал понижающего микширования может единообразно вычисляться согласно предварительно заданному правилу понижающего микширования. Другими словами, коэффициенты, применяемые к соответственным звуковым сигналам при формировании линейных комбинаций звуковых сигналов, предварительно заданы и постоянны в пределах последовательных временных кадров. Например, правило понижающего микширования может быть адаптировано для предоставления обратно совместимого сигнала понижающего микширования, т.е. для предоставления сигнала понижающего микширования, который может быть воспроизведен на воспроизводящем оборудовании прежней версии, использующем стандартизированную конфигурацию каналов.

В одном из иллюстративных вариантов осуществления может быть принято множество временных/частотных фрагментов звуковых сигналов, и сигнал понижающего микширования может вычисляться согласно адаптированному к сигналу правилу понижающего микширования. Другими словами, по меньшей мере один из коэффициентов, применяемых при формировании линейных комбинаций звуковых сигналов, является адаптированным к сигналу, т.е. значение по меньшей мере одного, а желательно нескольких, из коэффициентов может регулироваться/выбираться системой кодирования, основываясь на звуковом содержимом одного или нескольки

Структура декоррелятора для параметрического восстановления звуковых сигналов

Патент 2641463