Кодирование и декодирование аудиосигналов с использованием гребенок фильтров с комплексным значением

Иллюстрации

Показать все

Изобретение относится к кодированию и/или декодированию аудиосигналов и, в частности, к кодированию/декодированию формы аудиосигнала. Технический результат - повышение точности кодирования аудиосигналов. Кодер содержит приемник (201), который принимает аудиосигнал временной области. Гребенка (203) фильтров генерирует первый поддиапазонный сигнал из аудиосигнала временной области, где первый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области сигнала временной области. Процессор (205) преобразования генерирует второй поддиапазонный сигнал из первого поддиапазонного сигнала путем поддиапазонной обработки. Второй поддиапазонный сигнал соответствует критически дискретизированному представлению в поддиапазонной области аудиосигналов временной области. Процессор (207) кодирования затем генерирует поток данных кодированного по форме сигнала путем кодирования значений данных второго поддиапазонного сигнала. Процессор (205) преобразования генерирует второй поддиапазонный сигнал путем непосредственного преобразования поддиапазонов, без обратного преобразования во временную область. Изобретение позволяет выполнять кодирование по форме сигнала с уменьшенной сложностью для поддиапазонного сигнала с повышенной частотой дискретизации, обычно генерируемого при параметрическом кодировании. Декодер выполняет обратную операцию. 13 н. и 15 з.п. ф-лы, 11 ил.

Реферат

Изобретение относится к кодированию и/или декодированию аудиосигналов и, в частности, к кодированию/декодированию формы аудиосигнала.

Цифровое кодирование сигналов различных источников за последние десятилетия приобретает все большее значение, поскольку цифровое представление сигналов и цифровая связь все в большей степени заменяют аналоговое представление и связь. Например, системы мобильных телефонов, такие как Глобальная система мобильной связи, основаны на цифровом кодировании речи. Кроме того, распространение мультимедийного содержания, такого как видео и музыка, все в большей степени основывается на цифровом кодировании содержания.

Традиционно при кодировании аудио, в основном, использовали кодирование формы сигнала, при котором соответствующую форму сигнала преобразовывали в цифровую форму и эффективно кодировали. Например, типичный кодер формы сигнала содержит гребенку фильтров, преобразующую сигнал в область частотного поддиапазона. Основываясь на психоакустической модели, применяют порог маскирования, и полученные в результате значения поддиапазонов эффективно дискретизируют и кодируют, например, используя код Хаффмана.

Примеры кодеров формы сигнала включают в себя хорошо известные схемы кодирования MPEG-1 (Экспертная группа по вопросам движущегося изображения) уровень 3 (или MP3), или AAC (УКЗ, усовершенствованное кодирование аудио).

В последние годы было предложено множество методов кодирования, которые не используют непосредственное кодирование соответствующей формы сигнала, а вместо этого используют характеристики кодируемых сигналов, используя множество параметров. Например, для кодирования речи кодер и декодер могут быть основанными на модели голосового тракта человека, и вместо кодирования формы сигнала могут кодироваться различные параметры и сигналы возбуждения для этой модели. Такие методы обычно называются методами параметрического кодирования.

Кроме того, кодирование формы сигнала и параметрическое кодирование могут комбинироваться для получения особенно эффективного и высококачественного кодирования. В таких системах параметры могут описывать часть сигнала со ссылкой на другую часть сигнала, которая кодирована по форме сигнала. Например, были предложены методы кодирования, в которых нижние частоты кодируют по форме сигнала, а высокие частоты кодируют с использованием параметрического расширения, которое описывает свойства более высоких частот относительно низких частот. В качестве другого примера было предложено многоканальное кодирование сигнала, в котором, например, монофонический сигнал кодируют с использованием формы сигнала, и параметрическое расширение включает в себя параметрические данные, указывающие, чем отдельные каналы отличаются от общего сигнала.

Примеры методов кодирования на основе параметрического расширения включают в себя методы репликации спектральной полосы (SBR, РСП), параметрического стерео (PS, ПС) кодирования и пространственного кодирования аудио (SAC, ПКА).

В настоящее время метод SAC разрабатывается для эффективного кодирования многоканальных аудиосигналов. Этот метод частично основан на методе кодирования PS. Аналогично парадигме PS, метод SAC основан на понимании того, что многоканальный сигнал, содержащий М каналов, может быть эффективно представлен сигналом, состоящим из N каналов, где N<М, и небольшим количеством параметров, представляющих пространственные ориентиры. Типичное применение состоит в кодировании обычного представления сигнала 5.1 в качестве монофонического или стереофонического сигнала, кодированного по форме или с добавлением пространственных параметров. Пространственные параметры могут быть внедрены во вспомогательную часть данных основного монофонического или стереофонического потока битов для формирования расширения, обладающего обратной совместимостью.

Так же, как и в методах SBR и PS, в методе SAC используются гребенки комплексных (псевдо) квадратурных зеркальных фильтров (QMF) для преобразования представления во временной области в представление в частотной области (и наоборот). Характеристика этих гребенок фильтров состоит в том, что сигналы в областях поддиапазонов с комплексным значением эффективно подвергают дискретизации с повышенной частотой с коэффициентом два. Это позволяет выполнять операции пост-обработки сигналов в области поддиапазона без ввода искажений, связанных с дискретизацией.

Другая общая характеристика параметрического расширения состоит в том, что в типичных условиях эти методы не позволяют достичь прозрачного уровня качества аудио, то есть вводится некоторое ухудшение качества.

Для развития параметрических расширений, таких как SBR, PS и SAC в направлении прозрачного качества аудио, было бы желательно кодировать отдельные части, например, определенное количество полос сигналов в области комплексных поддиапазонов, используя кодер формы сигнала.

Непосредственный подход состоит в том, что вначале эти части области комплексного поддиапазона преобразуют обратно во временную область. Существующий кодер формы сигнала (например, AAC) затем можно применять к полученным в результате сигналам во временной области. Однако такой подход связан с множеством недостатков.

В частности, в результате получаются кодер и декодер большой сложности с высокой вычислительной нагрузкой, связанной с повторными преобразованиями между частотной областью и временной областью, с использованием разных преобразований. Например, если в параметрическом расширении будет использоваться кодирование сигнала во временной области, полученного после синтеза QMF, соответствующий декодер будет состоять из полного декодера формы сигнала (например, декодера производного AAC) и дополнительно гребенки анализа QMF. Это решение является дорогостоящим ввиду высокой сложности вычислений.

Кроме того, было бы предпочтительно получить корреляцию между используемым параметрическим расширением и кодированием формы сигнала для элементов сигнала, кодированных с использованием параметрического расширения.

Например, система может состоять из, например, кодирования AAC и SBR (НE-AAC) или AAC и SAC. Если в системе возможно дополнить расширение SBR или SAC кодированием формы сигнала, было бы логично также использовать AAC для кодирования сигнала во временной области, полученной после синтеза QMF. Однако в другой системе, использующей те же расширения, например, в комбинации MPEG-1, уровень II и SBR предпочтительно возможно было бы использовать другую систему кодирования формы сигнала: MPEG-1, уровень II. В соответствии с этим, было бы предпочтительно объединить расширение кодирования формы сигнала с инструментом параметрического расширения, а не с основным кодером.

Следовательно, предпочтительно было бы получить улучшенную систему и, в частности, систему кодирования и/или декодирования, позволяющую повысить гибкость, снизить сложность, уменьшить вычислительную нагрузку, которая способствовала бы взаимодействию между разными элементами используемого кодирования, обеспечить улучшение (например, с возможностью масштабирования) качества аудио и/или улучшение рабочих характеристик.

В соответствии с этим, изобретение, предпочтительно, направлено на уменьшение, ослабление или устранение одного или более из указанных выше недостатков, по отдельности или в любой их комбинации.

В соответствии с аспектом изобретения предложен декодер, предназначенный для генерирования аудиосигнала во временной области путем декодирования формы сигнала, причем декодер содержит: средство приема потока кодированных данных; средство генерирования первого поддиапазонного сигнала путем декодирования значений данных потока кодированных данных, причем первый поддиапазонный сигнал соответствует критически дискретизированному представлению сигнала области поддиапазонов для аудиосигнала временной области; средство преобразования, предназначенное для генерирования второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области аудиосигнала во временной области; и гребенку фильтров синтеза, предназначенную для генерирования аудиосигнала временной области из второго поддиапазонного сигнала.

Изобретение позволяет получить улучшенный декодер. При этом может быть создан декодер с уменьшенной сложностью и/или могут быть снижены требования к вычислительным ресурсам. В частности, гребенка фильтров синтеза может использоваться как для декодирования параметрического расширения для аудиосигнала во временной области, так и для декодирования формы сигнала. При этом может быть достигнута общность между декодированием формы сигнала и параметрическим декодированием. В частности, гребенка фильтров синтеза может представлять собой гребенку фильтров QMF, которую обычно используют для параметрического декодирования в методах кодирования на основе параметрического расширения, таких как SBR, PS и SAC.

Процессор преобразования выполнен с возможностью генерирования второго поддиапазонного сигнала в результате поддиапазонной обработки, при этом не требуется какое-либо преобразование, например, первого поддиапазонного сигнала обратно во временную область.

Декодер может дополнительно содержать средство обработки сигналов без искажений, связанных с дискретизацией, для второго поддиапазонного сигнала перед выполнением операции синтеза в гребенке фильтров синтеза.

В качестве дополнительного признака изобретения каждый поддиапазон первого поддиапазонного сигнала содержит множество подподдиапазонов, и средство преобразования содержит вторую гребенку фильтров синтеза, предназначенную для генерирования поддиапазонов вторых поддиапазонных сигналов из подподдиапазонов первого поддиапазонного сигнала.

Это может обеспечить эффективное средство преобразования первого поддиапазонного сигнала. Может быть предусмотрено свойство для получения эффективного средства и/или средства низкой сложности для компенсации частотного отклика фильтров поддиапазонов гребенки фильтров синтеза.

В качестве дополнительного признака изобретения каждый поддиапазон второго поддиапазонного сигнала содержит поддиапазон с наложением спектров и поддиапазон без наложения спектров, при этом средство преобразования содержит средство разделения, предназначенное для разделения подподдиапазона первого поддиапазонного сигнала на подподдиапазон с наложением спектров в полосе первого поддиапазона второго поддиапазонного сигнала и поддиапазон без наложения спектров второго поддиапазона второго поддиапазонного сигнала, при этом поддиапазон с наложением спектров и поддиапазон без наложения спектров имеют соответствующие частотные интервалы в сигнале временной области.

Это может обеспечить эффективное средство преобразования первого поддиапазонного сигнала. В частности, это позволяет генерировать сигнальные компоненты в разных поддиапазонах, получаемых из одной и той же частоты аудиосигнала временной области, из одного сигнального компонента.

В качестве дополнительного признака изобретения средство разделения содержит структуру типа бабочки.

Такой подход позволяет получить особенно эффективный вариант выполнения и/или высокие рабочие характеристики. В структуре типа бабочки может использоваться одно нулевое входное значение и одно входное значение данных поддиапазона для генерирования двух выходных значений, соответствующих разным поддиапазонам второго поддиапазона.

В соответствии с другим аспектом изобретения предусмотрен кодер для кодирования аудиосигнала временной области, причем кодер содержит: средство приема аудиосигнала временной области; первую гребенку фильтров, предназначенную для генерирования первого поддиапазонного сигнала из аудиосигнала временной области, причем первый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области сигнала временной области; средство преобразования, предназначенное для генерирования второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует критически дискретизированному представлению в поддиапазонной области аудиосигналов временной области; и средство генерирования потока данных, кодированных по форме сигнала, путем кодирования значений данных второго поддиапазонного сигнала.

Изобретение позволяет получить улучшенный кодер. При этом может быть получен кодер с уменьшенной сложностью, и/или могут быть снижены требования к вычислительным ресурсам. При этом обеспечивается общность между кодированием по форме сигнала и параметрическим кодированием. В частности, первая гребенка фильтров может представлять собой гребенку фильтров QMF, которую обычно используют для параметрического кодирования при использовании методов кодирования с параметрическим расширением, таких как SBR, PS и SAC.

Может быть улучшено качество декодированного аудио. Например, аудиосигнал временной области может представлять собой остаточный сигнал после параметрического кодирования. Сигнал, кодированный по форме сигнала, может обеспечить информацию, которая позволяет получить повышенную прозрачность.

Процессор преобразования выполнен с возможностью генерирования второго поддиапазонного сигнала в результате поддиапазонной обработки, и при этом не требуется какое-либо преобразование, например, первого поддиапазонного сигнала обратно во временную область.

В качестве дополнительного признака изобретения кодер дополнительно содержит средство параметрического кодирования аудиосигнала временной области с использованием первого поддиапазонного сигнала.

Изобретение обеспечивает возможность эффективного и/или высококачественного кодирования основного сигнала с одновременным использованием параметрического кодирования и кодирования по форме сигнала. При этом функции могут быть разделены между параметрическим кодированием и кодированием по форме сигнала. Параметрическое кодирование может представлять собой кодирование параметрического расширения, такое как кодирование SBR, PS или SAC. Кодер может, в частности, обеспечивать кодирование формы сигнала некоторых или всех поддиапазонов кодирования параметрического расширения.

В качестве дополнительного признака изобретения средство преобразования содержит вторую гребенку фильтров для генерирования множества подподдиапазонов для каждого поддиапазона первого поддиапазонного сигнала.

Это позволяет обеспечить эффективное средство преобразования первого поддиапазонного сигнала. Этот признак может обеспечить эффективное средство и/или средство низкой сложности для компенсации частотного отклика фильтров поддиапазонов для первого поддиапазона.

В качестве дополнительного признака изобретения вторая гребенка фильтров упорядочена нечетным образом.

Это позволяет улучшить рабочие характеристики и обеспечить улучшенное разделение между положительными и отрицательными частотами в области комплексных поддиапазонов.

В качестве дополнительного признака изобретения каждый поддиапазон содержит несколько подподдиапазонов с наложением спектров, соответствующих диапазону с наложением спектров поддиапазона, и несколько подподдиапазонов без наложения спектров, соответствующих диапазону без наложения спектров поддиапазона; при этом средство преобразования содержит средство комбинирования, предназначенное для комбинирования подподдиапазонов с наложением спектров в полосе первого поддиапазона с подподдиапазонами без наложения спектров второго поддиапазона, при этом подподдиапазоны с наложением спектров и подподдиапазоны без наложения спектров имеют соответствующие частотные интервалы в сигнале временной области.

Это позволяет обеспечить эффективное средство преобразования первого поддиапазонного сигнала. В частности, это позволяет скомбинировать сигнальные компоненты разных поддиапазонов, полученных из одной и той же частоты аудиосигнала временной области, в один сигнальный компонент. Это позволяет снизить скорость передачи данных.

В качестве дополнительного признака изобретения средство комбинирования выполнено с возможностью уменьшения энергии в диапазоне с наложением спектров.

Это позволяет улучшить рабочие характеристики и/или позволяет снизить скорость передачи данных. В частности, энергия диапазона с наложением спектров может быть сведена к минимуму, и диапазоны с наложением спектров могут игнорироваться.

В частности, средство комбинирования может дополнительно содержать средство, предназначенное для компенсации поддиапазонов без наложения спектров первого поддиапазона поддиапазонами с наложением спектров второго поддиапазона. В частности, средство комбинирования может содержать средство вычитания коэффициентов поддиапазонов с наложением спектров второго поддиапазона из поддиапазонов без наложения спектров первого поддиапазона.

В качестве дополнительного признака изобретения средство комбинирования содержит средство, предназначенное для генерирования суммарного сигнала без наложения спектров для первого подподдиапазона с наложением спектров в первом поддиапазоне и первого подподдиапазона без наложения спектров во втором поддиапазоне.

Это позволяет обеспечить особенно эффективную реализацию и/или высокие рабочие характеристики.

В качестве дополнительного признака изобретения средство комбинирования содержит структуру типа бабочки, предназначенную для генерирования суммарного сигнала без наложения спектров.

Это позволяет обеспечить особенно эффективную реализацию и/или высокие рабочие характеристики. Структура типа бабочки, в частности, может представлять собой половину структуры типа бабочки, в которой генерируется только одно выходное значение.

В качестве дополнительного признака изобретения, по меньшей мере, один коэффициент структуры типа бабочки зависит от частотного отклика фильтра первой гребенки фильтров.

Это позволяет обеспечить особенно эффективную реализацию и/или высокие рабочие характеристики.

В качестве дополнительного признака изобретения средство преобразования выполнено с возможностью не включать значения данных для диапазона с наложением спектров в поток кодированных данных.

Это позволяет обеспечить высокое качество кодированного аудио для заданной скорости передачи данных.

В качестве дополнительного признака изобретения кодер дополнительно содержит средство обработки сигнала без наложения спектров для первого поддиапазонного сигнала перед преобразованием во второй сигнал.

Это позволяет улучшить рабочие характеристики. Изобретение позволяет эффективно реализовать кодер по форме сигнала, имеющий критически дискретизированный выходной сигнал, что обеспечивает выполнение обработки сигналов в отдельных поддиапазонах без ввода ошибок, обусловленных наложением спектров, связанным с дискретизацией.

В качестве дополнительного признака изобретения кодер дополнительно содержит средство компенсации фазы первого поддиапазонного сигнала перед преобразованием во второй сигнал.

Это позволяет улучшить рабочие характеристики и/или обеспечить возможность эффективной реализации.

В качестве дополнительного признака изобретения первая гребенка фильтров представляет собой гребенку фильтров QMF.

Изобретение позволяет обеспечить эффективное кодирование по форме сигнала, используя фильтр QMF, который используется во многих методах параметрического кодирования, таких как SBR, PS, SAC. Таким образом могут быть достигнуты улучшенная совместимость и/или улучшенное разделение функций и/или улучшенное взаимодействие методов кодирования по форме сигнала и параметрического кодирования.

В соответствии с другим аспектом изобретения предложен способ генерирования аудиосигнала временной области путем декодирования формы сигнала, причем способ содержит: прием потока кодированных данных; генерирование первого поддиапазонного сигнала путем декодирования значений данных из потока кодированных данных, причем первый поддиапазонный сигнал соответствует критически дискретизированному представлению в поддиапазонной области аудиосигнала временной области; генерирование второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области аудиосигнала временной области; и генерирование гребенкой фильтров синтеза аудиосигнала временной области из второго поддиапазонного сигнала.

В соответствии с другим аспектом изобретения предложен способ кодирования аудиосигнала временной области, причем способ содержит: прием аудиосигнала временной области; генерирование первой гребенкой фильтров первого поддиапазонного сигнала из аудиосигнала временной области, причем первый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области сигнала временной области; генерирование второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует критически дискретизированному представлению в поддиапазонной области аудиосигналов временной области; и генерирование потока данных, кодированных по форме сигнала, путем кодирования значения данных второго поддиапазонного сигнала.

В соответствии с другим аспектом изобретения предусмотрен приемник для приема аудиосигнала, причем приемник содержит: средство приема потока кодированных данных; средство генерирования первого поддиапазонного сигнала путем декодирования значения данных потока кодированных данных, причем первый поддиапазонный сигнал соответствует критически дискретизированному представлению сигнала в поддиапазонной области аудиосигнала временной области; средство преобразования, предназначенное для генерирования второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области аудиосигнала временной области; и гребенку фильтров синтеза для генерирования аудиосигнала временной области из второго поддиапазонного сигнала.

В соответствии с другим аспектом изобретения предложен передатчик, предназначенный для передачи кодированного аудиосигнала, причем передатчик содержит: средство приема аудиосигнала временной области; первую гребенку фильтров, предназначенную для генерирования первого поддиапазонного сигнала из аудиосигнала временной области, причем первый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области сигнала временной области; средство преобразования, предназначенное для генерирования второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует критически дискретизированному представлению в поддиапазонной области аудиосигналов временной области; и средство генерирования потока данных, кодированных по форме сигнала, путем кодирования значений данных второго поддиапазонного сигнала; и средство передачи потока данных, кодированных по форме сигнала.

В соответствии с другим аспектом изобретения предложена система передачи, предназначенная для передачи аудиосигнала временной области, причем система передачи содержит: передатчик, содержащий: средство приема аудиосигнала временной области, первую гребенку фильтров, предназначенную для генерирования первого поддиапазонного сигнала из аудиосигнала временной области, причем первый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области сигнала временной области, средство преобразования, предназначенное для генерирования второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует критически дискретизированному представлению в поддиапазонной области аудиосигналов временной области, средство генерирования потока данных, кодированных по форме сигнала, путем кодирования значений данных второго поддиапазонного сигнала, и средство передачи потока данных, кодированных по форме сигнала; и приемник, содержащий: средство приема потока данных, кодированных по форме сигнала, средство генерирования третьего поддиапазонного сигнала путем декодирования значения данных потока кодированных данных, причем третий поддиапазонный сигнал соответствует критически дискретизированному представлению сигнала в поддиапазонной области аудиосигнала временной области, средство преобразования, предназначенное для генерирования четвертого поддиапазонного сигнала из третьего поддиапазонного сигнала путем поддиапазонной обработки, причем четвертый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области аудиосигнала временной области; и гребенку фильтров синтеза, предназначенную для генерирования аудиосигнала временной области из четвертого поддиапазонного сигнала.

В соответствии с другим аспектом изобретения предложен способ приема аудиосигнала, причем способ содержит: прием потока кодированных данных; генерирование первого поддиапазонного сигнала путем декодирования значения данных потока кодированных данных, причем первый поддиапазонный сигнал соответствует критически дискретизированному представлению сигнала в поддиапазонной области аудиосигнала временной области; генерирование второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области аудиосигнала временной области; и генерирование с помощью гребенки фильтров синтеза аудиосигнала временной области из второго поддиапазонного сигнала.

В соответствии с другим аспектом изобретения предложен способ передачи кодированного аудиосигнала, причем способ содержит: прием аудиосигнала временной области; генерирование с помощью первой гребенки фильтров первого поддиапазонного сигнала из аудиосигнала временной области, причем первый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области сигнала временной области; генерирование второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует критически дискретизированному представлению в поддиапазонной области аудиосигналов временной области; и генерирование потока данных, кодированных по форме сигнала путем кодирования значения данных второго поддиапазонного сигнала; и передачу потока данных, кодированных по форме сигнала.

В соответствии с другим аспектом изобретения предложен способ передачи и приема аудиосигнала временной области, причем способ содержит: передатчик: прием аудиосигнала временной области, генерирование с помощью первой гребенки фильтров первого поддиапазонного сигнала из аудиосигнала временной области, причем первый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области сигнала временной области, генерирование второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует критически дискретизированному представлению в поддиапазонной области аудиосигналов временной области, генерирование потока данных, кодированных по форме сигнала, путем кодирования значений данных второго поддиапазонного сигнала, и передачу потока данных, кодированных по форме сигнала; и приемник: прием потока данных, кодированных по форме сигнала, генерирование третьего поддиапазонного сигнала путем декодирования значений данных потока кодированных данных, причем третий поддиапазонный сигнал соответствует критически дискретизированному представлению сигнала в поддиапазонной области аудиосигнала временной области, генерирование четвертого поддиапазоного сигнала из третьего поддиапазонного сигнала путем поддиапазонной обработки, причем четвертый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области аудиосигнала временной области; и генерирование гребенкой фильтров синтеза аудиосигнала временной области из четвертого поддиапазонного сигнала.

В соответствии с другим аспектом изобретения предложен компьютерный программный продукт, предназначенный для выполнения любого из описанных выше способов.

Эти и другие аспекты, свойства и преимущества изобретения будут очевидны из вариантов выполнения, описанных ниже.

Варианты выполнения изобретения описаны только в качестве примера со ссылкой на чертежи, на которых представлено следующее:

фиг. 1 - система 100 передачи, предназначенная для передачи аудиосигнала в соответствии с некоторыми вариантами выполнения изобретения;

фиг. 2 - кодер в соответствии с некоторыми вариантами выполнения изобретения;

фиг. 3 - пример некоторых элементов кодера в соответствии с некоторыми вариантами выполнения изобретения;

фиг. 4 - декодер в соответствии с некоторыми вариантами выполнения изобретения;

фиг. 5 - кодер в соответствии с некоторыми вариантами выполнения изобретения;

фиг. 6 - пример гребенки фильтра анализа и синтеза;

фиг. 7 - пример спектра гребенки фильтра QMF;

фиг. 8 - примеры спектров фильтра поддиапазона QMF, дискретизированных с пониженной частотой дискретизации;

фиг. 9 - примеры спектров поддиапазона QMF;

фиг. 10 - примеры спектров гребенки фильтров поддиапазонов; и

фиг. 11 - пример структуры преобразования типа бабочки.

На фиг. 1 показана система 100 передачи, предназначенная для передачи аудиосигнала в соответствии с некоторыми вариантами выполнения изобретения. Система 100 передачи содержит передатчик 101, который связан с приемником 103 через сеть 105, которая, в частности, может представлять собой сеть Интернет.

В конкретном примере передатчик 101 представляет собой устройство записи сигнала, и приемник представляет собой устройство 103 воспроизведения сигнала, но следует понимать, что в других вариантах выполнения передатчик и приемник можно использовать в других реализациях и для других целей. Например, передатчик 101 и/или приемник 103 могут представлять собой часть функциональных средств транскодирования, например, они могут обеспечивать интерфейс для других отправителей сигнала или других получателей сигнала.

В конкретном примере, когда поддерживается функция записи сигнала, передатчик 101 содержит цифровой преобразователь 107, который принимает аналоговый сигнал, который преобразуется в цифровой сигнал PCM, путем дискретизации и аналогово-цифрового преобразования.

Передатчик 101 связан с кодером 109 по фиг. 1, который кодирует сигнал PCM в соответствии с алгоритмом кодирования. Кодер 100 связан с сетевым передатчиком 111, который принимает кодированный сигнал и обеспечивает интерфейс с Интернетом 105. Сетевой передатчик может передавать кодированный сигнал в приемник 103 через Интернет 105.

Приемник 103 содержит сетевой приемник 113, который обеспечивает интерфейс с Интернетом 105 и который выполнен с возможностью приема кодированного сигнала из передатчика 101.

Сетевой приемник 111 связан с декодером 115. Декодер 115 принимает кодированный сигнал и декодирует его в соответствии с алгоритмом декодирования.

В конкретном примере, когда поддерживается функция воспроизведения сигнала, приемник 103 дополнительно содержит устройство 117 воспроизведения сигнала, которое принимает декодированный аудиосигнал из декодера 115 и представляет его пользователю. В частности, устройство 113 воспроизведения сигнала может содержать цифроаналоговый преобразователь, усилители и громкоговорители, в соответствии с требованиями вывода декодированного аудиосигнала.

На фиг. 2 более подробно представлен кодер 109 по фиг. 1. Кодер 109 содержит приемник 201, который принимает аудиосигнал временной области, предназначенный для кодирования. Аудиосигнал может поступать из любого внешнего или внутреннего источника, например из локального хранилища сигнала.

Приемник соединен с первой гребенкой 203 фильтров, которая генерирует поддиапазонный сигнал, содержащий множество разных поддиапазонов. В частности, первая гребенка 203 фильтров может представлять собой гребенку фильтров QMF, как известно из методов параметрического кодирования, таких как SBR, PS и SAC. Таким образом, первая гребенка 203 фильтров генерирует первый поддиапазонный сигнал, который соответствует некритически дискретизированному комплексному представлению в поддиапазонной области сигнала временной области. В конкретном примере первый поддиапазонный сигнал имеет коэффициент дискретизации с повышенной частотой, равный двум, как хорошо известно для фильтров QMF с комплексной модуляцией.

Поскольку каждый диапазон QMF дискретизирован с повышенной частотой с коэффициентом два, возможно выполнить множество операций обработки сигнала над отдельными поддиапазонами, без ввода каких-либо искажений наложения спектров, связанных с дискретизацией. Например, каждый отдельный поддиапазон может быть масштабирован, и/или другие поддиапазоны могут быть добавлены или вычтены, и т.д. Таким образом, в некоторых вариантах выполнения кодер 109 дополнительно содержит средство выполнения операций обработки без наложения спектров сигнала для поддиапазонов QMF.

Первый поддиапазонный сигнал соответствует поддиапазонным сигналам, обычно генерируемым кодерами параметрического расширения, такими как SBR, PS и SAC. Таким образом, первый поддиапазонный сигнал можно использовать для генерирования кодирования параметрического расширения для сигнала временной области. Кроме того, этот же поддиапазонный сигнал в кодере 109 по фиг. 2 также используется для кодирования сигнала по форме для сигнала временной области. Таким образом, кодер 109 может использовать одну и ту же гребенку 203 фильтров для параметрического кодирования и кодирования сигнала по форме.

Основная трудность кодирования по форме комплексного представления в поддиапазонной области для первого поддиапазонного сигнала состоит в том, что он не формирует компактное представление, то есть он дискретизирован с повышенной частотой с коэффициентом два. Кодер 109 непосредственно преобразует комплексное представление в поддиапазонной области в представление, которое близко повторяет представление, которое было бы получено при непосредственном применении модифицированного дискретного косинусного преобразования (MDCT, МДКП) к исходному сигналу временной области (см., например, H. Malvar, "Signal Processing with Lapped Transforms", Artech House, Boston, London, 1992, где описана процедура MDCT). Такое представление типа MDCT является критически дискретизированным. Кроме того, такой сигнал можно использовать в известных перцептуальных методах кодирования аудио, которые можно применять для эффективного кодирования полученного представления, в результате чего обеспечивается эффективное кодирование сигнала по форме.

В частности, кодер 109 содержит процессор 205 преобразования, который генерирует второй поддиапазонный сигнал из первого поддиапазонного сигнала, применяя комплексное прео