2643489 - Аудиокодер и аудиодекодер

Аудиокодер и аудиодекодер

Иллюстрации

Показать все

Изобретение относится к средствам аудиокодирования и аудиодекодирования. Технический результат заключается в повышении эффективности кодирования аудиоданных. Способ кодирования вектора параметров в системе кодирования аудио, причем каждый параметр соответствует апериодической величине, вектор имеет первый элемент и по меньшей мере один второй элемент. Представляют каждый параметр в векторе посредством значения индекса, которое может принимать N значений. Ассоциируют каждый из одного второго элемента с символом, причем символ вычисляется посредством следующих этапов, на которых: вычисляют разность между значением индекса второго элемента и значением индекса его предыдущего элемента в векторе; применяют операцию по модулю N к разности; кодируют каждый по меньшей мере из одного второго элемента посредством энтропийного кодирования символа, ассоциированного по меньшей мере с одним вторым элементом на основе таблицы вероятностей, содержащей вероятности символов. 11 н. и 14 з.п. ф-лы, 15 ил.

Реферат

Перекрестная ссылка на родственные заявки

Настоящая заявка испрашивает приоритет по дате подачи американской предварительной заявки на патент № 61/827264, поданной 24 мая 2013 года, содержащейся в данном документе по ссылке.

Область техники

Раскрытие сущности в данном документе, в общем, относится к кодированию аудио. В частности, оно относится к кодированию и декодированию вектора параметров в системе кодирования аудио. Раскрытие сущности дополнительно относится к способу и устройству для восстановления аудиообъекта в системе декодирования аудио.

Предшествующий уровень техники

В традиционных аудиосистемах используется канальный подход. Каждый канал, например, может представлять контент одного динамика или одного массива динамиков. Возможные схемы кодирования для таких систем включают в себя дискретное многоканальное кодирование или параметрическое кодирование, к примеру, стандарт объемного звучания MPEG.

Впоследствии был разработан новый подход. Этот подход является объектно-ориентированным. В системе с использованием объектно-ориентированного подхода, трехмерная аудиосцена представлена посредством аудиообъектов с их ассоциированными позиционными метаданными. Эти аудиообъекты перемещаются в трехмерной аудиосцене во время воспроизведения аудиосигнала. Система дополнительно может включать в себя так называемые подложенные каналы, которые могут описываться как стационарные аудиообъекты, которые непосредственно преобразуются в позиции динамиков, например, традиционной аудиосистемы, как описано выше.

Проблема, которая может возникать в объектно-ориентированной аудиосистеме, состоит в этом, как эффективно кодировать и декодировать аудиосигнал и сохранять качество кодированного сигнала. Возможная схема кодирования включает в себя, на стороне кодера, создание сигнала понижающего микширования, содержащего число каналов, из аудиообъектов и подложенных каналов и вспомогательной информации, которая обеспечивает воссоздание аудиообъектов и подложенных каналов на стороне декодера.

Пространственное кодирование аудиообъектов по стандарту MPEG (MPEG SAOC) описывает систему для параметрического кодирования аудиообъектов. Система отправляет вспомогательную информацию, к примеру, матрицу повышающего микширования, описывающую свойства объектов посредством параметров, таких как разность уровня и взаимная корреляция объектов. Эти параметры затем используются для того, чтобы управлять воссозданием аудиообъектов на стороне декодера. Этот процесс может быть математическим комплексом и зачастую должен основываться на допущениях касательно свойств аудиообъектов, которые явно не описываются посредством параметров. Способ, представленный в MPEG SAOC, может понижать требуемую скорость передачи битов для объектно-ориентированной аудиосистемы, но дальнейшее улучшение может быть необходимо, чтобы дополнительно повышать эффективность и качество, как описано выше.

Краткое описание чертежей

Ниже описываются примерные варианты осуществления со ссылкой на прилагаемые чертежи, на которых:

Фиг. 1 является обобщенной блок-схемой системы кодирования аудио в соответствии с примерным вариантом осуществления;

Фиг. 2 является обобщенной блок-схемой примерного кодера матрицы повышающего микширования, показанного на фиг. 1;

Фиг. 3 показывает примерное распределение вероятностей для первого элемента в векторе параметров, соответствующих элементу в матрице повышающего микширования, определенной посредством системы кодирования аудио по фиг. 1;

Фиг. 4 показывает примерное распределение вероятностей, по меньшей мере, для одного дифференциально кодированного по модулю второго элемента в векторе параметров, соответствующих элементу в матрице повышающего микширования, определенной посредством системы кодирования аудио по фиг. 1;

Фиг. 5 является обобщенной блок-схемой системы декодирования аудио в соответствии с примерным вариантом осуществления;

Фиг. 6 является обобщенной блок-схемой декодера матрицы повышающего микширования, показанного на фиг. 5;

Фиг. 7 описывает способ кодирования для вторых элементов в векторе параметров, соответствующих элементу в матрице повышающего микширования, определенной посредством системы кодирования аудио по фиг. 1;

Фиг. 8 описывает способ кодирования для первого элемента в векторе параметров, соответствующих элементу в матрице повышающего микширования, определенной посредством системы кодирования аудио по фиг. 1;

Фиг. 9 описывает части способа кодирования по фиг. 7 для вторых элементов в примерном векторе параметров;

Фиг. 10 описывает части способа кодирования по фиг. 8 для первого элемента в примерном векторе параметров;

Фиг. 11 является обобщенной блок-схемой второго примерного кодера матрицы повышающего микширования, показанного на фиг. 1;

Фиг. 12 является обобщенной блок-схемой системы декодирования аудио в соответствии с примерным вариантом осуществления;

Фиг. 13 описывает способ кодирования для разреженного кодирования строки матрицы повышающего микширования;

Фиг. 14 описывает части способа кодирования по фиг. 10 для примерной строки матрицы повышающего микширования;

Фиг. 15 описывает части способа кодирования по фиг. 10 для примерной строки матрицы повышающего микширования;

Все данные являются схематичными и показывают, в общем, только части, которые требуются, чтобы пояснять раскрытие сущности, тогда как другие части могут опускаться или просто предполагаться. Если не указано иное, аналогичные ссылки с номерами означают аналогичные части на различных чертежах.

Подробное описание изобретения

С учетом вышеизложенного, цель заключается в том, чтобы предоставлять кодеры и декодеры и ассоциированные способы, которые предоставляют повышенную эффективность и качество кодированного аудиосигнала.

I. Обзор: кодер

Согласно первому аспекту, примерные варианты осуществления предлагают способы кодирования, кодеры и компьютерные программные продукты для кодирования. Предложенные способы, кодеры и компьютерные программные продукты могут, в общем, иметь идентичные признаки и преимущества.

Согласно примерным вариантам осуществления, предусмотрен способ для кодирования вектора параметров в системе кодирования аудио, причем каждый параметр соответствует апериодической величине, вектор имеет первый элемент и, по меньшей мере, один второй элемент, при этом способ содержит: представление каждого параметра в векторе посредством значения индекса, которое может принимать N значений; ассоциирование каждого, по меньшей мере, из одного второго элемента с символом, причем символ вычисляется посредством следующего: вычисление разности между значением индекса второго элемента и значением индекса его предыдущего элемента в векторе; применение операции по модулю N к разности. Способ дополнительно содержит этап кодирования каждого, по меньшей мере, из одного второго элемента посредством энтропийного кодирования символа, ассоциированного, по меньшей мере, с одним вторым элементом на основе таблицы вероятностей, содержащей вероятности символов.

Преимущество этого способа состоит в том, что число возможных символов уменьшается приблизительно на коэффициент в два по сравнению с традиционными стратегиями разностного кодирования, в которых по модулю N не применяется к разности. Следовательно, размер таблицы вероятностей уменьшается приблизительно на коэффициент в два. Как результат, меньше запоминающего устройства требуется, чтобы сохранять таблицу вероятностей и, поскольку таблица вероятностей зачастую сохраняется в дорогом запоминающем устройстве в кодере, кодер в силу этого может становиться менее дорогим. Кроме того, может повышаться скорость поиска символа в таблице вероятностей. Дополнительное преимущество состоит в том, что эффективность кодирования может увеличиваться, поскольку все символы в таблице вероятностей представляют собой возможные варианты, которые должны быть ассоциированы с конкретным вторым элементом. Оно может сравниваться с традиционными стратегиями разностного кодирования, в которых только приблизительно половина символов в таблице вероятностей представляют собой возможные варианты для ассоциирования с конкретным вторым элементом.

Согласно вариантам осуществления, способ дополнительно содержит ассоциирование первого элемента в векторе с символом, причем символ вычисляется посредством следующего: сдвиг значения индекса, представляющего первый элемент в векторе, посредством значения смещения; применение операции по модулю N к сдвигаемому значению индекса. Способ дополнительно содержит этап кодирования первого элемента посредством энтропийного кодирования символа, ассоциированного с первым элементом, с использованием идентичной таблицы вероятностей, которая используется для того, чтобы кодировать, по меньшей мере, один второй элемент.

Этот вариант осуществления использует тот факт, что распределение вероятностей значения индекса первого элемента и распределение вероятностей символов, по меньшей мере, одного второго элемента являются аналогичными, хотя и сдвинутыми относительно друг друга посредством значения смещения. Как следствие, идентичная таблица вероятностей может использоваться для первого элемента в векторе вместо выделенной таблицы вероятностей. Это может приводить к снижению требований к запоминающему устройству и менее дорогому кодеру согласно вышеуказанному.

Согласно варианту осуществления, значение смещения равно разности между наиболее вероятным значением индекса для первого элемента и наиболее вероятным символом, по меньшей мере, для одного второго элемента в таблице вероятностей. Это означает то, что пики распределений вероятностей совмещаются. Следовательно, практически идентичная эффективность кодирования поддерживается для первого элемента по сравнению с тем, как если бы использовалась выделенная таблица вероятностей для первого элемента.

Согласно вариантам осуществления, первый элемент и, по меньшей мере, один второй элемент вектора параметров соответствуют различным полосам частот, используемым в системе кодирования аудио в конкретном временном кадре. Это означает то, что данные, соответствующие множеству полос частот, могут кодироваться в идентичной операции. Например, вектор параметров может соответствовать коэффициенту повышающего микширования или восстановления, который варьируется по множеству полос частот.

Согласно варианту осуществления, первый элемент и, по меньшей мере, один второй элемент вектора параметров соответствуют различным временным кадрам, используемым в системе кодирования аудио в конкретной полосе частот. Это означает то, что данные, соответствующие множеству временных кадров, могут кодироваться в идентичной операции. Например, вектор параметров может соответствовать коэффициенту повышающего микширования или восстановления, который варьируется в зависимости от множества временных кадров.

Согласно вариантам осуществления, таблица вероятностей преобразуется в таблицу кодирования Хаффмана, при этом символ, ассоциированный с элементом в векторе, используется в качестве индекса таблицы кодирования, и при этом этап кодирования содержит кодирование каждого, по меньшей мере, из одного второго элемента посредством представления второго элемента с помощью кодового слова в таблице кодирования, которая индексируется посредством индекса таблицы кодирования, ассоциированного со вторым элементом. Посредством использования символа в качестве индекса таблицы кодирования может увеличиваться скорость поиска кодового слова, чтобы представлять элемент.

Согласно вариантам осуществления, этап кодирования содержит кодирование первого элемента в векторе с использованием идентичной таблицы кодирования Хаффмана, которая используется для того, чтобы кодировать, по меньшей мере, один второй элемент посредством представления первого элемента с помощью кодового слова в таблице кодирования Хаффмана, которая индексируется посредством индекса таблицы кодирования, ассоциированного с первым элементом. Следовательно, только одна таблица кодирования Хаффмана должна сохраняться в запоминающем устройстве кодера, что может приводить к менее дорогому кодеру согласно вышеуказанному.

Согласно дополнительному варианту осуществления, вектор параметров соответствует элементу в матрице повышающего микширования, определенной посредством системы кодирования аудио. Это может снижать требуемую скорость передачи битов в системе кодирования/декодирования аудио, поскольку может эффективно кодироваться матрица повышающего микширования.

Согласно примерным вариантам осуществления, предусмотрен машиночитаемый носитель, содержащий инструкции в виде машинного кода, адаптированные выполнять любой способ первого аспекта при выполнении на устройстве, имеющем возможности обработки.

Согласно примерным вариантам осуществления, предусмотрен кодер для кодирования вектора параметров в системе кодирования аудио, причем каждый параметр соответствует апериодической величине, вектор имеет первый элемент и, по меньшей мере, один второй элемент, причем кодер содержит: приемный компонент, адаптированный с возможностью принимать вектор; компонент индексации, адаптированный с возможностью представлять каждый параметр в векторе посредством значения индекса, которое может принимать N значений; компонент ассоциирования, адаптированный с возможностью ассоциировать каждый, по меньшей мере, один второй элемент с символом, причем символ вычисляется посредством следующего: вычисление разности между значением индекса второго элемента и значением индекса его предыдущего элемента в векторе; применение операции по модулю N к разности. Кодер дополнительно содержит компонент кодирования для кодирования каждого, по меньшей мере, из одного второго элемента посредством энтропийного кодирования символа, ассоциированного, по меньшей мере, с одним вторым элементом на основе таблицы вероятностей, содержащей вероятности символов.

II. Обзор: декодер

Согласно второму аспекту, примерные варианты осуществления предлагают способы декодирования, декодеры и компьютерные программные продукты для декодирования. Предложенные способы, декодеры и компьютерные программные продукты могут, в общем, иметь идентичные признаки и преимущества.

Преимущества относительно признаков и компоновок, как представлено в обзоре кодера выше, в общем, могут быть применимыми для соответствующих признаков и компоновок для декодера.

Согласно примерным вариантам осуществления, предусмотрен способ для декодирования вектора энтропийно кодированных символов в системе декодирования аудио в вектор параметров, связанных с апериодической величиной, вектор энтропийно кодированных символов содержит первый энтропийно кодированный символ и, по меньшей мере, один второй энтропийно кодированный символ и вектор параметров содержит первый элемент и, по меньшей мере, один второй элемент, при этом способ содержит: представление каждого энтропийно кодированного символа в векторе энтропийно кодированных символов посредством символа, который может принимать N целочисленных значений посредством использования таблицы вероятностей; ассоциирование первого энтропийно кодированного символа со значением индекса; ассоциирование каждого, по меньшей мере, из одного второго энтропийно кодированного символа со значением индекса, причем значение индекса, по меньшей мере, одного второго энтропийно кодированного символа вычисляется посредством следующего: вычисление суммы значения индекса, ассоциированного с энтропийно кодированным символом, предшествующим второму энтропийно кодированному символу в векторе энтропийно кодированных символов, и символа, представляющего второй энтропийно кодированный символ; применение операции по модулю N к сумме. Способ дополнительно содержит этап представления, по меньшей мере, одного второго элемента вектора параметров посредством значения параметра, соответствующего значению индекса, ассоциированному, по меньшей мере, с одним вторым энтропийно кодированным символом.

Согласно примерным вариантам осуществления, этап представления каждого энтропийно кодированного символа в векторе энтропийно кодированных символов посредством символа выполняется с использованием идентичной таблицы вероятностей для всех энтропийно кодированных символов в векторе энтропийно кодированных символов, при этом значение индекса, ассоциированное с первым энтропийно кодированным символом, вычисляется посредством следующего: сдвиг символа, представляющего первый энтропийно кодированный символ в векторе энтропийно кодированных символов, посредством значения смещения; применение операции по модулю N к сдвинутому символу. Способ дополнительно содержит этапы: представление первого элемента вектора параметров посредством значения параметра, соответствующего значению индекса, ассоциированному с первым энтропийно кодированным символом.

Согласно варианту осуществления, таблица вероятностей преобразуется в таблицу кодирования Хаффмана, и каждый энтропийно кодированный символ соответствует кодовому слову в таблице кодирования Хаффмана.

Согласно дополнительным вариантам осуществления, каждое кодовое слово в таблице кодирования Хаффмана ассоциировано с индексом таблицы кодирования, и этап представления каждого энтропийно кодированного символа в векторе энтропийно кодированных символов посредством символа содержит представление энтропийно кодированного символа посредством индекса таблицы кодирования, ассоциированного с кодовым словом, соответствующим энтропийно кодированному символу.

Согласно вариантам осуществления, каждый энтропийно кодированный символ в векторе энтропийно кодированных символов соответствует различным полосам частот, используемым в системе декодирования аудио в конкретном временном кадре.

Согласно варианту осуществления, каждый энтропийно кодированный символ в векторе энтропийно кодированных символов соответствует различным временным кадрам, используемым в системе декодирования аудио в конкретной полосе частот.

Согласно вариантам осуществления, вектор параметров соответствует элементу в матрице повышающего микширования, используемой посредством системы декодирования аудио.

Согласно примерным вариантам осуществления, предусмотрен машиночитаемый носитель, содержащий инструкции в виде машинного кода, адаптированные выполнять любой способ второго аспекта при выполнении на устройстве, имеющем возможности обработки.

Согласно примерным вариантам осуществления, предусмотрен декодер для декодирования вектора энтропийно кодированных символов в системе декодирования аудио в вектор параметров, связанных с апериодической величиной, вектор энтропийно кодированных символов содержит первый энтропийно кодированный символ и, по меньшей мере, один второй энтропийно кодированный символ и вектор параметров содержит первый элемент и, по меньшей мере, второй элемент, декодер содержит: приемный компонент, выполненный с возможностью принимать вектор энтропийно кодированных символов; компонент индексации, выполненный с возможностью представлять каждый энтропийно кодированный символ в векторе энтропийно кодированных символов посредством символа, который может принимать N целочисленных значений посредством использования таблицы вероятностей; компонент ассоциирования, выполненный с возможностью ассоциировать первый энтропийно кодированный символ со значением индекса; компонент ассоциирования, дополнительно выполненный с возможностью ассоциировать каждый, по меньшей мере, один второй энтропийно кодированный символ со значением индекса, причем значение индекса, по меньшей мере, одного второго энтропийно кодированного символа вычисляется посредством следующего: вычисление суммы значения индекса, ассоциированного с энтропийно кодированным символом, предшествующим второму энтропийно кодированному символу в векторе энтропийно кодированных символов, и символа, представляющего второй энтропийно кодированный символ; применение операции по модулю N к сумме. Декодер дополнительно содержит компонент декодирования, выполненный с возможностью представлять, по меньшей мере, один второй элемент вектора параметров посредством значения параметра, соответствующего значению индекса, ассоциированному, по меньшей мере, с одним вторым энтропийно кодированным символом.

III. Обзор: разреженный матричный кодер

Согласно третьему аспекту, примерные варианты осуществления предлагают способы кодирования, кодеры и компьютерные программные продукты для кодирования. Предложенные способы, кодеры и компьютерные программные продукты могут, в общем, иметь идентичные признаки и преимущества.

Согласно примерным вариантам осуществления, предусмотрен способ для кодирования матрицы повышающего микширования в системе кодирования аудио, причем каждая строка матрицы повышающего микширования содержит M элементов, обеспечивающие возможность восстановления частотно-временного мозаичного фрагмента аудиообъекта из сигнала понижающего микширования, содержащего M каналов, при этом способ содержит: для каждой строки в матрице повышающего микширования: выбор поднабора элементов из M элементов строки в матрице повышающего микширования; представление каждого элемента в выбранном поднаборе элементов посредством значения и позиции в матрице повышающего микширования; кодирование значения и позиции в матрице повышающего микширования каждого элемента в выбранном поднаборе элементов.

При использовании в данном документе, посредством термина "сигнал понижающего микширования, содержащий M каналов" предназначен сигнал, который содержит M-сигналы или каналы, причем каждый из каналов представляет собой комбинацию множества аудиообъектов, включающую в себя аудиообъекты, которые должны быть восстановлены. Число каналов типично больше одного, и во многих случаях число каналов равно пяти или более.

При использовании в данном документе, термин "матрица повышающего микширования" означает матрицу, имеющую N строк и M столбцов, которая дает возможность восстановления N аудиообъектов из сигнала понижающего микширования, содержащего M каналов. Элементы на каждой строке матрицы повышающего микширования соответствуют одному аудиообъекту и предоставляют коэффициенты, которые должны быть перемножены с M каналами понижающего микширования, чтобы восстанавливать аудиообъект.

При использовании в данном документе, посредством позиции в матрице повышающего микширования, в общем, означается индекс строки и столбца, который указывает строку и столбец матричного элемента. Термин "позиция" также может означать индекс столбца в данной строке матрицы повышающего микширования.

В некоторых случаях, отправка всех элементов матрицы повышающего микширования в расчете на частотно-временной мозаичный фрагмент требует нежелательно высокой скорости передачи битов в системе кодирования/декодирования аудио. Преимущество способа состоит в том, что только поднабор элементов матрицы повышающего микширования должен кодироваться и передаваться в декодер. Это может снижать требуемую скорость передачи битов системы кодирования/декодирования аудио, поскольку передается меньший объем данных, и данные могут кодироваться более эффективно.

Системы кодирования/декодирования аудио типично разделяют частотно-временное пространство на частотно-временные мозаичные фрагменты, например, посредством применения подходящих гребенок фильтров к входным аудиосигналам. Посредством частотно-временного мозаичного фрагмента, в общем, означается часть частотно-временного пространства, соответствующего временному интервалу и подполосе частот. Временной интервал типично может соответствовать длительности временного кадра, используемого в системе кодирования/декодирования аудио. Подполоса частот типично может соответствовать одной или нескольким подполосам частот соседней частоты, заданным посредством гребенки фильтров, используемой в системе кодирования/декодирования. В случае если подполоса частот соответствует нескольким подполосам частот соседней частоты, заданным посредством гребенки фильтров, это предоставляет возможность наличия неравномерных подполос частот в процессе декодирования аудиосигнала, например, более широких подполос частот для верхних частот аудиосигнала. В широкополосном случае, в котором система кодирования/декодирования аудио управляет полным частотным диапазоном, подполоса частот частотно-временного мозаичного фрагмента может соответствовать полному частотному диапазону. Вышеописанный способ раскрывает этапы кодирования для кодирования матрицы повышающего микширования в системе кодирования аудио для предоставления возможности восстановления аудиообъекта во время одного такого частотно-временного мозаичного фрагмента. Тем не менее, следует понимать, что способ может повторяться для каждого частотно-временного мозаичного фрагмента системы кодирования/декодирования аудио. Также следует понимать, что несколько частотно-временных мозаичных фрагментов могут кодироваться одновременно. Типично, соседние частотно-временные мозаичные фрагменты могут перекрывать бит во времени и/или частоту. Например, перекрытие во времени может быть эквивалентным линейной интерполяции элементов матрицы восстановления во времени, т.е. от одного временного интервала до следующего. Тем не менее, это раскрытие сущности направлено на другие части системы кодирования/декодирования, и реализация перекрытия во времени и/или по частоте между соседними частотно-временными мозаичными фрагментами оставлена для специалистов в данной области техники.

Согласно вариантам осуществления, для каждой строки в матрице повышающего микширования, позиции в матрице повышающего микширования выбранного поднабора элементов варьируются для множества полос частот и/или для множества временных кадров. Соответственно, выбор элементов может зависеть от конкретного частотно-временного мозаичного фрагмента, так что различные элементы могут выбираться для различных частотно-временных мозаичных фрагментов. Это предоставляет более гибкий способ кодирования, который повышает качество кодированного сигнала.

Согласно вариантам осуществления, выбранный поднабор элементов содержит идентичное число элементов для каждой строки матрицы повышающего микширования. В дополнительных вариантах осуществления, число выбранных элементов может составлять ровно один. Это уменьшает сложность кодера, поскольку алгоритм должен только выбирать идентичное число элемента (элементов) для каждой строки, т.е. элемент (элементы), которые являются наиболее важными при выполнении повышающего микширования на стороне декодера.

Согласно вариантам осуществления, для каждой строки в матрице повышающего микширования и для множества полос частот или множества временных кадров, значения элементов выбранных поднаборов элементов формируют один или более векторов параметров, причем каждый параметр в векторе параметров соответствует одному из множества полос частот или множества временных кадров, и при этом один или более векторов параметров кодируются с использованием способа согласно первому аспекту. Другими словами, могут эффективно кодироваться значения выбранных элементов. Преимущества относительно признаков и компоновок как представлено в обзоре первого аспекта выше, в общем, могут быть допустимы для этого варианта осуществления.

Согласно вариантам осуществления, для каждой строки в матрице повышающего микширования и для множества полос частот или множества временных кадров, позиции элементов выбранных поднаборов элементов формируют один или более векторов параметров, причем каждый параметр в векторе параметров соответствует одному из множества полос частот или множества временных кадров, и при этом один или более векторов параметров кодируются с использованием способа согласно первому аспекту. Другими словами, могут эффективно кодироваться позиции выбранных элементов. Преимущества относительно признаков и компоновок как представлено в обзоре первого аспекта выше, в общем, могут быть допустимы для этого варианта осуществления.

Согласно примерным вариантам осуществления, предусмотрен машиночитаемый носитель, содержащий инструкции в виде машинного кода, адаптированные выполнять любой способ третьего аспекта при выполнении на устройстве, имеющем возможности обработки.

Согласно примерным вариантам осуществления, предусмотрен кодер для кодирования матрицы повышающего микширования в системе кодирования аудио, причем каждая строка матрицы повышающего микширования содержит M элементов, обеспечивающие возможность восстановления частотно-временного мозаичного фрагмента аудиообъекта из сигнала понижающего микширования, содержащего M каналов, причем кодер содержит: приемный компонент, адаптированный с возможностью принимать каждую строку в матрице повышающего микширования; компонент выбора, адаптированный с возможностью выбирать поднабор элементов из M элементов строки в матрице повышающего микширования; компонент кодирования, адаптированный с возможностью представлять каждый элемент в выбранном поднаборе элементов посредством значения и позиции в матрице повышающего микширования, причем компонент кодирования дополнительно адаптирован с возможностью кодировать значение и позицию в матрице повышающего микширования каждого элемента в выбранном поднаборе элементов.

IV. Обзор: разреженный матричный декодер

Согласно четвертому аспекту, примерные варианты осуществления предлагают способы декодирования, декодеры и компьютерные программные продукты для декодирования. Предложенные способы, декодеры и компьютерные программные продукты могут, в общем, иметь идентичные признаки и преимущества.

Преимущества относительно признаков и компоновок, как представлено в обзоре разреженного матричного кодера выше, в общем, могут быть допустимыми для соответствующих признаков и компоновок для декодера.

Согласно примерным вариантам осуществления, предусмотрен способ для восстановления частотно-временного мозаичного фрагмента аудиообъекта в системе декодирования аудио, содержащий: прием сигнала понижающего микширования, содержащего M каналов; прием, по меньшей мере, одного кодированного элемента, представляющего поднабор M элементов строки в матрице повышающего микширования, каждый кодированный элемент содержит значение и позицию в строке в матрице повышающего микширования, позиция указывает один из M каналов сигнала понижающего микширования, которому соответствует кодированный элемент; и восстановление частотно-временного мозаичного фрагмента аудиообъекта из сигнала понижающего микширования посредством формирования линейной комбинации каналов понижающего микширования, которые соответствуют, по меньшей мере, одному кодированному элементу, при этом в упомянутой линейной комбинации каждый канал понижающего микширования умножается на значение его соответствующего кодированного элемента.

Таким образом, согласно этому способу частотно-временной мозаичный фрагмент аудиообъекта восстановлен посредством формирования линейной комбинации поднабора каналов понижающего микширования. Поднабор каналов понижающего микширования соответствует этим каналам, для которых приняты кодированные коэффициенты повышающего микширования. Таким образом, способ предоставляет возможность восстановления аудиообъекта, несмотря на то, что принимается только поднабор, к примеру, разреженный поднабор, матрицы повышающего микширования. Посредством формирования линейной комбинации только каналов понижающего микширования, которые соответствуют, по меньшей мере, одному кодированному элементу, может снижаться сложность процесса декодирования. Альтернатива заключается в том, чтобы формировать линейную комбинацию всех сигналов понижающего микширования и затем перемножать некоторые из них (которые не соответствуют, по меньшей мере, одному кодированному элементу) со значением нуль.

Согласно вариантам осуществления, позиции, по меньшей мере, одного кодированного элемента варьируются для множества полос частот и/или для множества временных кадров. Другими словами, различные элементы матрицы повышающего микширования могут кодироваться для различных частотно-временных мозаичных фрагментов.

Согласно вариантам осуществления, число элементов, по меньшей мере, одного кодированного элемента равно одному. Это означает то, что аудиообъект восстановлен из одного канала понижающего микширования в каждом частотно-временном мозаичном фрагменте. Тем не менее, один канал понижающего микширования, используемый для того, чтобы восстанавливать аудиообъект, может варьироваться между различными частотно-временными мозаичными фрагментами.

Согласно вариантам осуществления, для множества полос частот или множества временных кадров, значения, по меньшей мере, одного кодированного элемента формируют один или более векторов, при этом каждое значение представлено посредством энтропийно кодированного символа, при этом каждый символ в каждом векторе энтропийно кодированных символов соответствует одной из множества полос частот или одному из множества временных кадров, и при этом один или более векторов энтропийно кодированных символов декодируются с использованием способа согласно второму аспекту. Таким образом, значения элементов матрицы повышающего микширования могут эффективно кодироваться.

Согласно вариантам осуществления, для множества полос частот или множества временных кадров, позиции, по меньшей мере, одного кодированного элемента формируют один или более векторов, при этом каждая позиция представлена посредством энтропийно кодированного символа, при этом каждый символ в каждом векторе энтропийно кодированных символов соответствует одной из множества полос частот или множества временных кадров, и при этом один или более векторов энтропийно кодированных символов декодируются с использованием способа согласно второму аспекту. Таким образом, могут эффективно кодироваться позиции элементов матрицы повышающего микширования.

Согласно примерным вариантам осуществления, предусмотрен декодер для восстановления частотно-временного мозаичного фрагмента аудиообъекта, содержащий: приемный компонент, выполненный с возможностью принимать сигнал понижающего микширования, содержащий M каналов и, по меньшей мере, один кодированный элемент, представляющий поднабор M элементов строки в матрице повышающего микширования, каждый кодированный элемент содержит значение и позицию в строке в матрице повышающего микширования, позиция указывает один из M каналов сигнала понижающего микширования, которому соответствует кодированный элемент; и компонент восстановления, выполненный с возможностью восстанавливать частотно-временной мозаичный фрагмент аудиообъекта из сигнала понижающего микширования посредством формирования линейной комбинации каналов понижающего микширования, которые соответствуют, по меньшей мере, одному кодированному элементу, при этом в упомянутой линейной комбинации каждый канал понижающего микширования умножается на значение его соответствующего кодированного элемента.

V. Примерные варианты осуществления

Фиг. 1 показывает обобщенную блок-схему системы 100 кодирования аудио для кодирования аудиообъектов 104. Система кодиро

Аудиокодер и аудиодекодер

Патент 2643489