Способ и устройство для обработки аудио сигнала и для обеспечения большей детализации во времени для комбинированного унифицированного кодека речи и аудио (usac)

Иллюстрации

Показать все

Изобретение относится к обработке аудио сигнала. Технический результат - упрощение устройства и обеспечение большей детализации во времени для комбинированного унифицированного кодека речи и аудио. Устройство для обработки аудио сигнала содержит процессор обработки сигналов и конфигуратор. Процессор обработки сигналов выполнен с возможностью: приема первого кадра аудио сигнала, имеющего первое конфигурируемое количество отсчетов упомянутого аудио сигнала; повышения частоты дискретизации аудио сигнала на конфигурируемый коэффициент повышения частоты дискретизации, для получения обработанного аудио сигнала; вывода второго кадра аудио сигнала, имеющего второе конфигурируемое количество отсчетов обработанного аудио сигнала. Конфигуратор выполнен с возможностью: конфигурирования процессора обработки сигналов на основе информации конфигурации так, что конфигурируемый коэффициент повышения частоты дискретизации равен первому значению повышения частоты дискретизации, когда первое отношение второго конфигурируемого количества отсчетов к первому конфигурируемому количеству отсчетов имеет первое значение отношения; конфигурирования процессора обработки сигналов так, что конфигурируемый коэффициент повышения частоты дискретизации равен отличающемуся второму значению повышения частоты дискретизации, когда отличающееся второе отношение второго конфигурируемого количества отсчетов к первому конфигурируемому количеству отсчетов имеет отличающееся второе значение отношения. 6 н. и 14 з.п. ф-лы, 13 ил.

Реферат

Настоящее изобретение относится к обработке аудио и, в частности, к способу и устройству для обработки аудио сигнала и для обеспечения большей детализации во времени для комбинированного унифицированного кодека речи и аудио (USAC).

У USAC, как и у других аудиокодеков, фиксированный размер кадра (USAC: 2048 отсчетов/кадр). Несмотря на то, что существует возможность переключения на ограниченный набор более коротких размеров преобразования в пределах одного кадра, упомянутый размер кадра по-прежнему ограничивает временное разрешение полной системы. Для увеличения степени детализации во времени (временной гранулярности) полной системы, для обычных аудиокодеков увеличивают частоту дискретизации, (что приводит) к более короткой длительности одного кадра во времени (например, миллисекунды). Однако для кодека USAC это, возможно, не так просто.

Кодек USAC содержит комбинацию инструментальных средств из обычных общих аудиокодеков, например, кодера с преобразованием AAC (Advanced Audio Coding, Перспективное звуковое кодирование), SBR (Spectral Band Replication, Репликация спектральной полосы) и Многоканальной стереофонии MPEG (MPEG Surround, MPEG = Moving Picture Experts Group, Экспертная группа по вопросам движущегося изображения), плюс инструментальных средств из обычных речевых кодеров, нарпимер, ACELP (ACELP = Algebraic Code Excited Linear Prediction, Линейное предсказание с алгебраическим кодовым возбуждением). Как кодер ACELP, так и кодер с преобразованием обычно работают одновременно в идентичных условиях (то есть размер кадра, частота дискретизации), и между ними можно легко переключаться: обычно, для чистых речевых сигналов, используется инструментальное средство ACELP, а для музыки, смешанных сигналов используется кодер с преобразованием.

Вместе с тем, инструментальное средство ACELP имеет ограничения и работает только при сравнительно низких частотах дискретизации. Для 24 кбит/сек, используется частота дискретизации только 17075 Гц. Для более высоких частот дискретизации, эксплуатационные качества инструментального средства ACELP начинают значительно снижаться. Однако кодер с преобразованием, а также SBR и Многоканальная стереофония MPEG имеют преимущество при намного более высокой частоте дискретизации, например, 22050 Гц - для кодера с преобразованием, и 44100 Гц - для Многоканальной стереофонии MPEG и SBR. Однако пока инструментальное средство ACELP ограничивает частоту дискретизации полной системы, что приводит к квазиоптимальной системе, в частности, для музыкальных сигналов.

Задачей настоящего изобретения является обеспечение улучшенных принципов для устройства и способа обработки аудио сигнала. Задача настоящего изобретение решается посредством устройства по п. 1, способа по п. 15, устройства по п. 16, способа по п. 18 и компьютерной программы по п. 19.

Современная RM USAC обеспечивает высокие эксплуатационные качества кодирования при большем количестве режимов работы в диапазоне от самых низких скоростей передачи битов (битрейт), например, 8 кбит/с до "прозрачного" качества при скоростях передачи битов 128 кбит/с и выше. Для достижения такого высокого качества при таком широком диапазоне скоростей передачи битов, используется комбинация инструментальных средств, например, Многоканальной стереофонии MPEG, SBR, ACELP и обычных кодеров с преобразованием. Такая комбинация инструментальных средств, конечно, требует совместного процесса оптимизации взаимодействия инструментальных средств и общих условий, в которую помещены эти инструментальные средства.

При этом совместном процессе оптимизации обнаружено, что у некоторых из инструментальных средств существуют недостатки при воспроизведении сигналов, которые демонстрируют большую временную структуру в диапазоне средних скоростей передачи битов (24 кбит/сек - 32 кбит/сек). В частности, инструментальные средства Многоканальной стереофонии MPEG. SBR и кодеры с преобразованием FD (FD, TCX) (FD=Frequency Domain, Частотная область, TCX=Transform Coded Excitation, Преобразование кодированного возбуждения), то есть все инструментальные средства, которые функционируют в частотной области, могут иметь высокие эксплуатационные качества при функционировании с более высокой степенью детализации во времени, что идентично более короткому размеру кадра во временной области.

По сравнению с кодером HE-AACv2 (High-Efficiency AAC v2, Высокопроизводительный кодер AAC v2) существующего уровня техники, обнаружено, что, с использованием идентичного размера кадра (в отсчетах), кодер текущего эталонного качества USAC функционирует при таких скоростях передачи битов, как 24 кбит/сек и 32 кбит/сек, при значительно меньшей частоте дискретизации. Это означает, что длительность кадров в миллисекундах является значительно большей. Для компенсации этих недостатков степень детализации во времени должна быть увеличена. Это может быть достигнуто посредством увеличения частоты дискретизации или сокращения размеров кадра (например, систем, использующих фиксированный размер кадра).

В то время как увеличение частоты дискретизации является разумным направлением дальнейших действий для SBR и Многоканальной стереофонии MPEG с целью повышения эксплуатационных качеств для временных динамических сигналов, оно не является эффективным для всех инструментальных средств базового кодера. Известно, что более высокая частота дискретизации является полезной для кодера с преобразованием, но одновременно существенно понижает эксплуатационные качества инструментального средства ACELP.

Обеспечено устройство для обработки аудио сигнала. Это устройство содержит процессор обработки сигналов и конфигуратор. Процессор обработки сигналов выполнен с возможностью приема первого кадра аудио сигнала, имеющего первое конфигурируемое количество отсчетов аудио сигнала. Кроме того, процессор обработки сигналов выполнен с возможностью повышения частоты дискретизации аудио сигнала на конфигурируемый коэффициент повышения частоты дискретизации, для получения обработанного аудио сигнала. Кроме того, процессор обработки сигналов выполнен с возможностью вывода второго кадра аудио сигнала, имеющего второе конфигурируемое количество отсчетов обработанного аудио сигнала.

Конфигуратор выполнен с возможностью конфигурирования процессора обработки сигналов на основе информации конфигурации так, что конфигурируемый коэффициент повышения частоты дискретизации равен первому значению повышения частоты дискретизации, когда первое отношение второго конфигурируемого количества отсчетов к первому конфигурируемому количеству отсчетов имеет первое значение отношения. Кроме того, конфигуратор выполнен с возможностью конфигурирования процессора обработки сигналов так, что конфигурируемый коэффициент повышения частоты дискретизации равен отличающемуся второму значению повышения частоты дискретизации, когда отличающееся второе отношение второго конфигурируемого количества отсчетов к первому конфигурируемому количеству отсчетов имеет отличающееся второе значение отношения. Причем это первое или второе значение отношения не является целочисленным значением.

Согласно вышеописанному варианту осуществления, процессор обработки сигналов повышает частоту дискретизации аудио сигнала для получения обработанного аудио сигнала с повышенной частотой дискретизации. В вышеупомянутом варианте осуществления коэффициент повышения частоты дискретизации, является конфигурируемым и может являться нецелочисленным значением. Конфигурируемость и тот факт, что коэффициент повышения частоты дискретизации, может являться нецелочисленным значением, увеличивают гибкость устройства. Когда отличающееся второе отношение второго конфигурируемого количества отсчетов к первому конфигурируемому количеству отсчетов имеет отличающееся второе значение отношения, тогда конфигурируемый коэффициент повышения частоты дискретизации, имеет отличающееся второе значение повышения частоты дискретизации. Соответственно, устройство выполнено с возможностью учета взаимосвязи между коэффициентом повышения частоты дискретизации, и отношением длины кадра (то есть количества отсчетов) второго и первого кадра аудио сигнала.

В одном варианте осуществления, конфигуратор выполнен с возможностью конфигурирования процессора обработки сигналов так, что отличающееся второе значение повышения частоты дискретизации, больше первого значения повышения частоты дискретизации, когда второе отношение второго конфигурируемого количества отсчетов к первому конфигурируемому количеству отсчетов больше первого отношения второго конфигурируемого количества отсчетов к первому конфигурируемому количеству отсчетов.

Согласно одному варианту осуществления, предложен новый рабочий режим (далее называемый "специальной настройкой") кодека USAC, который повышает эксплуатационные качества системы для средних скоростей передачи данных, например, 24 кбит/сек и 32 кбит/сек. Обнаружено, что для этих режимов работы, временное разрешение текущего опорного кодека USAC является слишком низким. Следовательно, предлагается a) увеличить это временное разрешение посредством сокращения размеров кадра базового кодера без увеличения частоты дискретизации для базового кодера, и также b) увеличить частоту дискретизации для SBR и Многоканальной стереофонии MPEG без изменения размера кадра для этих инструментальных средств.

Предложенная специальная настройка существенно улучшает гибкость системы, так как она обеспечивает возможность функционирования системы, включающей в себя инструментальное средство ACELP, при более высоких частотах дискретизации, например, 44,1 и 48 кГц. Так как на рынке, как правило, требуются эти частоты дискретизации, ожидается, что это поможет принятию кодека USAC.

С увеличением степени детализации во времени полного аудиокодека, новый рабочий режим для современного элемента унифицированного кодека речи и аудио (USAC) MPEG увеличивает временную гибкость всего кодека. Если (с предположением того, что второе количество отсчетов оставалось неизменным) второе отношение больше первого отношения, то первое конфигурируемое количество отсчетов было сокращено, то есть размер кадра первого кадра аудио сигнала был сокращен. Это в результате приводит к более высокой степени детализации во времени, и все инструментальные средства, которые функционируют в частотной области, и которые обрабатывают первый кадр аудио сигнала, могут иметь высокие эксплуатационные качества. В таком высокоэффективном рабочем режиме, однако, также требуется повышение эксплуатационных качеств инструментальных средств, которые обрабатывают второй кадр аудио сигнала, содержащий аудио сигнал с повышенной частотой дискретизации. Такое повышение эксплуатационных качеств этих инструментальных средств может быть реализовано посредством более высокой частоты дискретизации аудио сигнала с повышенной частотой дискретизации, то есть посредством увеличения коэффициента повышения частоты дискретизации, для такого рабочего режима. Кроме того, существуют инструментальные средства, например, декодер ACELP в USAC, которые не функционируют в частотной области, которые обрабатывают первый кадр аудио сигнала, и которые лучше всего функционируют тогда, когда частота дискретизации (исходного) аудио сигнала является относительно небольшой. Эти инструментальные средства имеют преимущество при большом коэффициенте повышения частоты дискретизации, поскольку это означает то, что частота дискретизации (исходного) аудио сигнала является относительно небольшой по сравнению с частотой дискретизации аудио сигнала с повышенной частотой дискретизации. В вышеописанном варианте осуществления обеспечено устройство, выполненное с возможностью обеспечения режима конфигурации для эффективной работы для таких условий.

С увеличением степени детализации во времени полного аудиокодека, новый рабочий режим увеличивает временную гибкость всего кодека.

В одном варианте осуществления, конфигуратор выполнен с возможностью конфигурирования процессора обработки сигналов так, что конфигурируемый коэффициент повышения частоты дискретизации, равен первому значению отношения, когда первое отношение второго конфигурируемого количества отсчетов к первому конфигурируемому количеству отсчетов имеет первое значение отношения, и причем этот конфигуратор выполнен с возможностью конфигурирования процессора обработки сигналов так, что конфигурируемый коэффициент повышения частоты дискретизации, равен отличающемуся второму значению отношения, когда второе отношение второго конфигурируемого количества отсчетов к первому конфигурируемому количеству отсчетов имеет отличающееся второе значение отношения.

В одном варианте осуществления, конфигуратор выполнен с возможностью конфигурирования процессора обработки сигналов так, что конфигурируемый коэффициент повышения частоты дискретизации, равен 2, когда первое отношение имеет первое значение отношения, и причем этот конфигуратор выполнен с возможностью конфигурирования процессора обработки сигналов так, что конфигурируемый коэффициент повышения частоты дискретизации, равен 8/3, когда второе отношение имеет отличающееся второе значение отношения.

Согласно еще одному варианту осуществления, конфигуратор выполнен с возможностью конфигурирования процессора обработки сигналов так, что первое конфигурируемое количество отсчетов равно 1024, и второе конфигурируемое количество отсчетов равно 2048, когда первое отношение имеет первое значение отношения, и причем этот конфигуратор выполнен с возможностью конфигурирования процессора обработки сигналов так, что это первое конфигурируемое количество отсчетов равно 768, и второе конфигурируемое количество отсчетов равно 2048, когда второе отношение имеет отличающееся второе значение отношения.

В одном варианте осуществления предложено ввести дополнительную настройку кодера USAC, где базовый кодер функционирует при более короткой длине кадра (768 вместо 1024 отсчетов). Кроме того, в этом контексте предложено модифицировать повторную дискретизацию в декодере SBR с 2:1 на 8:3, обеспечить возможность функционирования SBR и Многоканальной стереофонии MPEG при более высокой частоте дискретизации.

Кроме того, согласно одному варианту осуществления, степень детализации во времени базового кодера увеличивается при сокращении размера кадра базового кодера с 1024 до 768 отсчетов. На этом этапе, степень детализации во времени основного кодера увеличивается в 4/3 раза, тогда как частота дискретизации остается постоянной. Это обеспечивает возможность ACELP работать при надлежащей частоте дискретизации (Fs).

Кроме того, в инструментальном средстве SBR, применяется повторная дискретизация с отношением 8/3, (до настоящего момента: отношение 2), преобразование кадра размером 768 базового кодера при 3/8 Fs в выходной кадр размером 2048 при Fs. Это обеспечивает возможность работы инструментального средства SBR и Инструментального средства Многоканальной стереофонии MPEG при обычно высокой частоте дискретизации (например, 44100 Гц). Соответственно, обеспечивается хорошее качество для речевых и музыкальных сигналов, поскольку все инструментальные средства работают в своем оптимальном режиме работы.

В одном варианте осуществления, процессор обработки сигналов содержит модуль базового декодера для декодирования аудио сигнала для получения предварительно обработанного аудио сигнала, набор фильтров для анализа, имеющий несколько каналов набора фильтров для анализа, для преобразования первого предварительно обработанного аудио сигнала из временной области в частотную область для получения предварительно обработанного аудио сигнала частотной области, содержащего множество сигналов поддиапазонов, генератор поддиапазонов для создания и добавления дополнительных сигналов поддиапазонов для предварительно обработанного аудиосигнала частотной области, и набор фильтров для синтеза, имеющий несколько каналов набора фильтров для синтеза, для преобразования первого предварительно обработанного аудио сигнала из частотной области во временную область для получения обработанного аудио сигнала. Конфигуратор может быть выполнен с возможностью конфигурирования процессора обработки сигналов посредством конфигурирования количества каналов набора фильтров для синтеза или количества каналов набора фильтров для анализа так, что конфигурируемый коэффициент повышения частоты дискретизации, равен третьему отношению количества каналов набора фильтров для синтеза к количеству каналов набора фильтров для анализа. Генератор поддиапазонов может являться Средством репликации спектральной полосы (Spectral Band Replicator), выполненным с возможностью репликации сигналов поддиапазонов генератора предварительно обработанного аудио сигнала, для создания дополнительных сигналов поддиапазонов для предварительно обработанного аудиосигнала частотной области. Процессор обработки сигналов может также содержать декодер Многоканальной стереофонии MPEG для декодирования предварительно обработанного аудио сигнала для получения предварительно обработанного аудио сигнала, содержащего стерео- или пространственные каналы. Кроме того, генератор поддиапазонов может быть выполнен с возможностью подачи предварительно обработанного аудио сигнала частотной области в декодер Многоканальной стереофонии MPEG для предварительно обработанного аудио сигнала частотной области после того, как были созданы дополнительные сигналы поддиапазонов и добавлены к предварительно обработанному аудиосигналу частотной области.

Модуль базового декодера может содержать первый базовый декодер и второй базовый декодер, причем первый базовый декодер может быть выполнен с возможностью функционирования во временной области, и причем второй базовый декодер может быть выполнен с возможностью функционирования в частотной области. Первый базовый декодер может быть декодером ACELP, и второй базовый декодер может быть декодером с преобразованием FD или декодером с преобразованием TCX.

В одном варианте осуществления, размер суперкадра для кодека ACELP сокращается с 1024 до 768 отсчетов. Это может быть выполнено посредством объединения 4 кадров ACELP размером 192 (3 подкадра размером 64) в один кадр базового кодера размером 768 (ранее: 4 кадра ACELP размером 256 объединялись в кадр базового кодера размером 1024). Другим решением для достижения размера кадра базового кодера в 768 отсчетов является, например, объединение 3 кадров ACELP размером 256 (4 подкадра размером 64).

Согласно еще одному варианту осуществления, конфигуратор выполнен с возможностью конфигурирования процессора обработки сигналов на основе информации конфигурации, указывающей, по меньшей мере, одно из первого конфигурируемого количества отсчетов аудио сигнала и второго конфигурируемого количества отсчетов обработанного аудио сигнала.

В другом варианте осуществления конфигуратор выполнен с возможностью конфигурирования процессора обработки сигналов на основе информации конфигурации, причем эта информация конфигурации указывает первое конфигурируемое количество отсчетов аудио сигнала и второе конфигурируемое количество отсчетов обработанного аудио сигнала, причем эта информация конфигурации является индексом конфигурации.

Кроме того, обеспечено устройство для обработки аудио сигнала. Это устройство содержит процессор обработки сигналов и конфигуратор. Процессор обработки сигналов выполнен с возможностью приема первого кадра аудио сигнала, имеющего первое конфигурируемое количество отсчетов аудио сигнала. Кроме того, процессор обработки сигналов выполнен с возможностью понижения частоты дискретизации аудио сигнала посредством конфигурируемого коэффициента понижения частоты дискретизации, для получения обработанного аудио сигнала. Кроме того, процессор обработки сигналов выполнен с возможностью вывода второго кадра аудио сигнала, имеющего второе конфигурируемое количество отсчетов обработанного аудио сигнала.

Конфигуратор может быть выполнен с возможностью конфигурирования процессора обработки сигналов на основе информации конфигурации так, что конфигурируемый коэффициент понижения частоты дискретизации, равен первому значению понижения частоты дискретизации, когда первое отношение второго конфигурируемого количества отсчетов к первому конфигурируемому количеству отсчетов имеет первое значение отношения. Кроме того, конфигуратор выполнен с возможностью конфигурирования процессора обработки сигналов так, что конфигурируемый коэффициент понижения частоты дискретизации, равен отличающемуся второму значению понижения частоты дискретизации, когда отличающееся второе отношение второго конфигурируемого количества отсчетов к первому конфигурируемому количеству отсчетов имеет отличающееся второе значение отношения. Причем это первое или второе значение отношения не является целочисленным значением.

Далее обсуждаются предпочтительные варианты осуществления настоящего изобретения со ссылкой на прилагаемые чертежи, на которых:

На фиг. 1 изображено устройство для обработки аудио сигнала согласно одному варианту осуществления.

На фиг. 2 изображено устройство для обработки аудио сигнала согласно еще одному варианту осуществления.

На фиг. 3 изображен процесс повышения частоты дискретизации, осуществляемый устройством согласно одному варианту осуществления.

На фиг. 4 изображено устройство для обработки аудио сигнала согласно еще одному варианту осуществления.

На фиг. 5 изображен модуль базового декодера согласно одному варианту осуществления.

На фиг. 5B изображено устройство для обработки аудио сигнала согласно варианту осуществления по фиг. 4 с модулем базового декодера согласно фиг. 5A.

На фиг. 6A изображен суперкадр ACELP, содержащий 4 кадра ACELP.

На фиг. 6B изображен суперкадр ACELP, содержащий 3 кадра ACELP.

На фиг. 7A изображена настройка USAC по умолчанию.

На фиг. 7B изображена специальная настройка для USAC согласно одному варианту осуществления.

На фиг. 8A, фиг. 8B представлены результаты теста на прослушивание согласно способу MUSHRA.

На фиг. 9 изображено устройство для обработки аудио сигнала согласно альтернативному варианту осуществления.

На фиг. 1 изображено устройство для обработки аудио сигнала согласно одному варианту осуществления. Это устройство содержит процессор 110 обработки сигналов и конфигуратор 120. Процессор 110 обработки сигналов выполнен с возможностью приема первого кадра 140 аудио сигнала, имеющего первое конфигурируемое количество отсчетов 145 аудио сигнала. Кроме того, процессор 110 обработки сигналов выполнен с возможностью повышения частоты дискретизации аудио сигнала на конфигурируемый коэффициент повышения частоты дискретизации, для получения обработанного аудио сигнала. Кроме того, процессор обработки сигналов выполнен с возможностью вывода второго кадра 150 аудио сигнала, имеющего второе конфигурируемое количество отсчетов 155 обработанного аудио сигнала.

Конфигуратор 120 выполнен с возможностью конфигурирования процессора 110 обработки сигналов на основе информации ci конфигурации так, что конфигурируемый коэффициент повышения частоты дискретизации, равен первому значению повышения частоты дискретизации, когда первое отношение второго конфигурируемого количества отсчетов к первому конфигурируемому количеству отсчетов имеет первое значение отношения. Кроме того, конфигуратор 120 выполнен с возможностью конфигурирования процессора 110 обработки сигналов так, что конфигурируемый коэффициент повышения частоты дискретизации, равен отличающемуся второму значению повышения частоты дискретизации, когда отличающееся второе отношение второго конфигурируемого количества отсчетов к первому конфигурируемому количеству отсчетов имеет отличающееся второе значение отношения. Причем это первое или второе значение отношения не является целочисленным значением.

Устройство согласно фиг. 1 может, например, быть использовано в процессе декодирования.

Согласно одному варианту осуществления, конфигуратор 120 может быть выполнен с возможностью конфигурирования процессора 110 обработки сигналов так, что отличающееся второе значение повышения частоты дискретизации, больше первого отличающегося значения повышения частоты дискретизации, когда второе отношение второго конфигурируемого количества отсчетов к первому конфигурируемому количеству отсчетов больше первого отношения второго конфигурируемого количества отсчетов к первому конфигурируемому количеству отсчетов. В еще одном варианте осуществления, конфигуратор 120 выполнен с возможностью конфигурирования процессора 110 обработки сигналов так, что конфигурируемый коэффициент повышения частоты дискретизации, равен первому значению отношения, когда первое отношение второго конфигурируемого количества отсчетов к первому конфигурируемому количеству отсчетов имеет первое значение отношения, и причем конфигуратор 120 выполнен с возможностью конфигурирования процессора 110 обработки сигналов так, что конфигурируемый коэффициент повышения частоты дискретизации, равен отличающемуся второму значению отношения, когда второе отношение второго конфигурируемого количества отсчетов к первому конфигурируемому количеству отсчетов имеет отличающееся второе значение отношения.

В еще одном варианте осуществления, конфигуратор 120 выполнен с возможностью конфигурирования процессора 110 обработки сигналов так, что конфигурируемый коэффициент повышения частоты дискретизации, равен 2, когда первое отношение имеет первое значение отношения, и причем этот конфигуратор 120 выполнен с возможностью конфигурирования процессора 110 обработки сигналов так, что конфигурируемый коэффициент повышения частоты дискретизации, равен 8/3, когда второе отношение имеет отличающееся второе значение отношения. Согласно еще одному варианту осуществления, конфигуратор 120 выполнен с возможностью конфигурирования процессора 110 обработки сигналов так, что первое конфигурируемое количество отсчетов равно 1024, и второе конфигурируемое количество отсчетов равно 2048, когда первое отношение имеет первое значение отношения, и причем конфигуратор 120 выполнен с возможностью конфигурирования процессора 110 обработки сигналов так, что это первое конфигурируемое количество отсчетов равно 768, и второе конфигурируемое количество отсчетов равно 2048, когда второе отношение имеет отличающееся второе значение отношения.

В одном варианте осуществления конфигуратор 120 выполнен с возможностью конфигурирования процессора 110 обработки сигналов на основе информации ci конфигурации, причем информация ci конфигурации указывает коэффициент повышения частоты дискретизации, первое конфигурируемое количество отсчетов аудио сигнала и второе конфигурируемое количество отсчетов обработанного аудио сигнала, причем эта информация конфигурации является индексом конфигурации.

В нижеследующей таблице представлен пример для индекса конфигурации как информации конфигурации:

Index (Индекс) coreCoderFrameLength (длина Кадра Базового Кодера) sbrRatio (отношение sbr) outputFrameLength (длина Выходного Кадра)
2 768 8:3 2048
3 1024 2:1 2048

в которой "Index" указывает индекс конфигурации, в которой "coreCoderFrameLength" указывает первое конфигурируемое количество отсчетов аудио сигнала, в которой "sbrRatio" указывает коэффициент повышения частоты дискретизации, и в которой "outputFrameLength" указывает второе конфигурируемое количество отсчетов обработанного аудио сигнала.

На фиг. 2 изображено устройство согласно еще одному варианту осуществления. Это устройство содержит процессор 205 обработки сигналов и конфигуратор 208. Процессор 205 обработки сигналов содержит модуль 210 базового декодера, набор 220 фильтров для анализа, генератор 230 поддиапазонов и набор 240 фильтров для синтеза.

Модуль 210 базового декодера выполнен с возможностью приема аудио сигнала as1. После приема аудио сигнала as1, модуль 210 базового декодера декодирует аудио сигнал для получения предварительно обработанного аудио сигнала as2. Далее, модуль 210 базового декодера подает предварительно обработанный аудио сигнал as2, который представлен во временной области, в набор 220 фильтров для анализа.

Набор 220 фильтров для анализа выполнен с возможностью преобразования предварительно обработанного аудио сигнала as2 из временной области в частотную область для получения предварительно обработанного аудио сигнала as3 частотной области, содержащего множество сигналов поддиапазонов. Набор 220 фильтров для анализа имеет конфигурируемое количество каналов набора фильтров для анализа (полосы частот набора фильтров для анализа). Количество каналов набора фильтров для анализа определяет количество сигналов поддиапазонов, которые генерируются из предварительно обработанного аудио сигнала as2 временной области. В одном варианте осуществления, количество каналов набора фильтров для анализа может быть определено посредством установки значения конфигурируемого параметра c1. Например, набор 220 фильтров для анализа может конфигурироваться с 32 или 24 каналами набора фильтров для анализа. В варианте осуществления по фиг. 2, количество каналов набора фильтров для анализа может устанавливаться согласно информации ci конфигурации конфигуратора 208. После преобразования предварительно обработанного аудио сигнала as2 в частотную область, набор 220 фильтров для анализа подает предварительно обработанный аудио сигнал as3 частотной области в генератор 230 поддиапазонов.

Генератор 230 поддиапазонов выполнен с возможностью создания дополнительных сигналов поддиапазонов для аудио сигнала as3 частотной области. Кроме того, генератор 230 поддиапазонов выполнен с возможностью модификации предварительно обработанного аудио сигнала as3 частотной области для получения модифицированного аудио сигнала as4 частотной области, который содержит сигналы поддиапазонов предварительно обработанного аудио сигнала as3 частотной области и созданные дополнительные сигналы поддиапазонов, которые созданы генератором 230 поддиапазонов. Количество дополнительных сигналов поддиапазонов, которые генерируются генератором 230 поддиапазонов, является конфигурируемым. В одном варианте осуществления, генератор поддиапазонов является Средством репликации спектральной полосы (Spectral Band Replicator, SBR). После этого генератор 230 поддиапазонов подает модифицированный предварительно обработанный аудио сигнал as4 частотной области в набор фильтров для синтеза.

Набор 240 фильтров для синтеза выполнен с возможностью преобразования модифицированного предварительно обработанного аудио сигнала as4 частотной области из частотной области во временную область для получения обработанного аудио сигнала as5 временной области. Набор 240 фильтров для синтеза имеет конфигурируемое количество каналов набора фильтров для синтеза (полосы частот набора фильтров для синтеза). Количество каналов набора фильтров для синтеза является конфигурируемым. В одном варианте осуществления, количество каналов набора фильтров для синтеза может быть определено посредством установки значения конфигурируемого параметра c2. Например, набор 240 фильтров для синтеза может конфигурироваться так, чтобы иметь 64 канала набора фильтров для синтеза. В варианте осуществления по фиг. 2, информация ci конфигурации конфигуратора 208 может устанавливать количество каналов набора фильтров для анализа. Посредством преобразования модифицированного предварительно обработанного аудио сигнала as4 частотной области во временную область, получают обработанный аудио сигнал as5.

В одном варианте осуществления, количество каналов поддиапазонов модифицированного предварительно обработанного аудио сигнала as4 частотной области равно количеству каналов набора фильтров для синтеза. В этом варианте осуществления конфигуратор 208 выполнен с возможностью конфигурирования упомянутого количества дополнительных каналов поддиапазонов, которые создаются генератором 230 поддиапазонов. Конфигуратор 208 может быть выполнен с возможностью конфигурирования упомянутого количества дополнительных каналов поддиапазонов, которые создаются генератором 230 поддиапазонов так, что количество каналов c2 набора фильтров для синтеза, конфигурируемое конфигуратором 208, равно количеству каналов поддиапазонов предварительно обработанного аудио сигнала as3 частотной области плюс количество дополнительных сигналов поддиапазонов, создаваемых генератором 230 поддиапазонов. Соответственно, количество каналов набора фильтров для синтеза равно количеству сигналов поддиапазонов модифицированного предварительно обработанного аудио сигнала as4 частотной области.

С предположением того, что аудио сигнал as1 имеет частоту дискретизации (sampling rate) sr1, и с предположением того, что набор 220 фильтров для анализа имеет c1 канал набора фильтров для анализа, и что набор 240 фильтров для синтеза имеет c2 каналов набора фильтров для синтеза, обработанный аудио сигнал as5 имеет частоту дискретизации sr5:

sr5=(c2/c1)-sr1

c2/c1 определяет коэффициент u повышения частоты дискретизации:

u=c2/c1

В варианте осуществления по фиг. 2, коэффициент u повышения частоты дискретизации, может быть установлен равным некоторому числу, которое не является целочисленным значением. Например, коэффициент u повышения частоты дискретизации, может быть установлен в значение 8/3, при установке количества каналов набора фильтров для анализа: c1=24, и при установке количества каналов набора фильтров для синтеза: c2=64, так что:

u=8/3=64/24.

С предположением того, что генератором 230 поддиапазонов является Средство репликации спектральной полосы, Средство репликации спектральной полосы согласно одному варианту осуществления может генерировать произвольное количество дополнительных поддиапазонов из исходных поддиапазонов, причем отношение количества генерируемых дополнительных поддиапазонов к количеству уже доступных поддиапазонов не обязательно должно являться целым числом. Например, Средство репликации спектральной полосы согласно одному варианту осуществления может осуществлять следующие этапы:

На первом этапе, Средство репликации спектральной полосы реплицирует количество сигналов поддиапазонов посредством генерирования некоторого количества дополнительных поддиапазонов, причем это количество генерируемых дополнительных поддиапазонов может являться целым числом, кратным количеству уже доступных поддиапазонов. Например, из 24 исходных сигналов поддиапазонов аудио сигнала может быть сгенерировано 24 (или, например, 48) дополнительных сигналов поддиапазонов (например, общее количество сигналов поддиапазонов может быть удвоено или утроено).

На втором этапе, с предположением того, что требуемое количество сигналов поддиапазонов равно cl2, и количество фактических доступных сигналов поддиапазонов равно c11, можно выделить три различные ситуации:

Если c11 равно c12, то количество c11 доступных сигналов поддиапазонов равно количеству c12 требуемых сигналов поддиапазонов. Настройка поддиапазонов не требуется.

Если c12 меньше c11, то количество c11 доступных сигналов поддиапазонов больше количества c12 требуемых сигналов поддиапазонов. Согласно одному варианту осуществления, могут быть удалены самые высокочастотные сигналы поддиапазонов. Например, если 64 сигнала поддиапазонов являются доступными, и если требуется только 61 сигнал поддиапазонов, то три сигнала поддиапазонов с самой высокой частотой могут быть сброшены.

Если c12 больше c11, то количество c11 доступных сигналов поддиапазонов меньше количества c12 требуемых сигналов поддиапазонов.

Согласно одному варианту осуществления, дополнительные сигналы поддиапазонов могут генерироваться посредством добавления нулевых сигналов в качестве дополнительных сигналов поддиапазонов, то есть сигналов, у которых значения амплитуды каждого отсчета поддиапазона равны нулю. Согласно другому варианту осуществления, дополнительные сигналы поддиапазонов могут генерироваться посредством добавления п