2665913 - Устройство и способ формирования расширенного сигнала с использованием заполнения независимым шумом

Устройство и способ формирования расширенного сигнала с использованием заполнения независимым шумом

Иллюстрации

Показать все

Изобретение относится к средствам для формирования расширенного сигнала с использованием заполнения независимым шумом. Технический результат заключается в повышении качества кодированного аудиосигнала. Отображают исходный участок спектра входного сигнала на целевой участок в участке спектра расширения. Формируют первые значения шума для участка заполнения шумом в исходном участке спектра входного сигнала и для формирования вторых значений шума для шумового участка в целевом участке. Причем вторые значения шума являются декоррелированными от первых значений шума. Формируют вторые значения шума для шумового участка в целевом участке, при этом вторые значения шума являются декоррелированными от первых значений шума в исходном участке спектра, причем первые значения шума в исходном участке спектра не являются результатом операции заполнения шумом. 6 н. и 8 з.п. ф-лы, 20 ил.

Реферат

Заявка на изобретение относится к обработке сигналов, и конкретно - к обработке аудиосигнала.

Перцептуальное кодирование аудиосигналов с целью уменьшения объема данных для эффективного хранения или передачи этих сигналов является широко используемой практикой. В частности, когда должны обеспечиваться низкие битовые скорости передачи данных, применяемое кодирование ведет к снижению качества звучания, каковое зачастую прежде всего обусловлено ограничением на стороне кодера ширины полосы частот аудиосигнала, подлежащего передаче. В современных кодеках существуют известные способы для восстановления сигнала на стороне декодера путем Расширения диапазона рабочих частот (BWE) аудиосигнала, например, способ Копирования спектральной полосы (SBR).

В кодировании с низкой битовой скоростью часто также используется так называемое «заполнение шумом». Выступающие участки спектра, которые были квантованы в нуль в силу строгих ограничений скорости передачи данных, заполняют синтезированным шумом в декодере.

Обычно оба способа объединяют в приложениях кодирования с низкой скоростью передачи данных. Кроме того, существуют интегрированные решения, такие как Интеллектуальное заполнение промежутков (Intelligent Gap Filling, IGF), которые объединяют кодирование аудио, заполнение шумом и заполнение спектрального промежутка.

Однако все эти способы имеют общее в том, что на первом этапе соответствующий основной полосе частот (немодулированной передачи) или базовый аудиосигнал восстанавливают, используя декодирование формы сигнала и заполнение шумом, и на втором этапе выполняют обработку согласно BWE или IGF, используя полностью восстановленный сигнал. Это приводит к факту, что те же значения шума, которые были заполнены в основной полосе частот согласно заполнению шумом в ходе восстановления, используются для повторного формирования отсутствующих частей в диапазоне высоких частот (в BWE) или для заполнения оставшихся спектральных промежутков (в IGF). Использование высоко коррелированного шума для повторного создания множества участков спектра в BWE или IGF может вести к ухудшениям восприятия.

Соответствующие вопросы в уровне техники содержат

- SBR в качестве постпроцессора для декодирования формы сигнала [1-3]

- PNS (замещение воспринимаемого шума) в AAC (усовершенствованное кодирование аудио) [4]

- заполнение шумом по стандарту USAC (объединенное кодирование речи и аудио) в MPEG-D (многоканальное кодирование) [5]

- G.719 и G.722.1C [6]

- IGF по MPEG-H 3-D [8]

Последующие публикации и заявки на патент описывают способы, которые считаются относящимися к заявке:

[1] M. Dietz, L. Liljeryd, K. Kjörling and O. Kunz, ʺSpectral Band Replication, a novel approach in audio codingʺ, в 112th AES Convention, Мюнхен, Германия, 2002.

[2] S. Meltzer, R. Böhm and F. Henn, ʺSBR enhanced audio codecs for digital broadcasting such as ʺDigital Radio Mondialeʺ (DRM)ʺ, в 112th AES Convention, Мюнхен, Германия, 2002.

[3] T. Ziegler, A. Ehret, P. Ekstrand and M. Lutzky, ʺEnhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithmʺ, в 112th AES Convention, Мюнхен, Германия, 2002.

[4] J. Herre, D. Schulz, Extending the MPEG-4 AAC Codec by Perceptual Noise Substitution, Audio Engineering Society 104th Convention, Предварительная публикация 4720, Амстердам, Нидерланды, 1998.

[5] Европейская заявка на патент EP2304720, заполнение шумом по стандарту USAC.

[6] Рекомендации G.719 и G.221C ITU-T (Международный союз электросвязи - сектор телекоммуникаций).

[7] Документ EP 2704142.

[8] Документ EP 13177350.

Аудиосигналы, обрабатываемые с помощью этих способов, страдают от артефактов, таких как резкость, модуляционные искажения и тембр, воспринимаемый как неприятный, в частности - на низкой скорости передачи данных и поэтому малой ширины полосы частот и/или появление спектральных провалов в диапазоне низких частот (LF). Причиной этого, как будет пояснено ниже, в первую очередь является факт, что восстановленные компоненты расширенного или с заполненными промежутками спектра основываются на одной или нескольких прямых копиях, содержащих шум, из основной полосы. Временные модуляции, проистекающие из упомянутой нежелательной корреляции в восстановленном шуме, являются слышимыми раздражающим образом как резкость (звука) или нежелательное искажение при восприятии. Все существующие способы, подобные mp3+SBR, AAC+SBR, USAC, G.719 и G.722.1C, а также IGF по MPEG-H 3D сначала выполняют полное базовое декодирование, включая заполнение шумом, до заполнения спектральных промежутков или диапазона высоких частот скопированными или дублированными спектральными данными из базовой полосы.

Задача настоящего изобретения состоит в обеспечении усовершенствованной концепции формирования расширенного сигнала.

Эта задача достигается посредством устройства для формирования расширенного сигнала по п.1, способа для формирования расширенного сигнала по п.11, системы кодирования и декодирования по п.13, способа кодирования и декодирования по п.14 или компьютерной программы по п.15.

Настоящее изобретение основано на заключении, что значительное улучшение качества звучания расширенного сигнала, сформированного путем расширения полосы частот или интеллектуального заполнения промежутков или любым другим способом формирования расширенного сигнала, имеющего спектральные значения для участка спектра расширения, не содержащиеся во входном сигнале, получают путем формирования первых значений шума для участка заполнения шумом в исходном участке спектра (источника) входного сигнала и путем формирования затем вторых независимых значений шума для шумового участка в участке назначения или целевом, то есть, в участке расширения, который теперь имеет значения шума, то есть, вторые значения шума, которые являются независимыми от первых значений шума.

Таким образом, устраняется проблема известного уровня техники в наличии зависимого шума в основной полосе частот и полосе частот расширения благодаря отображению спектральных значений, и устраняются связанные проблемы артефактов, таких как резкость, модуляционные искажения и тембр, воспринимаемый как неприятный в частности на низких скоростях передачи.

Другими словами, заполнение шумом вторыми значениями шума, являющимися декоррелированными от первых значений шума, то есть, значениями шума, которые, по меньшей мере, являются частично независимыми от первых значений шума, гарантирует, что артефакты более не возникают или, по меньшей мере, снижаются по отношению к известному уровню техники. Следовательно, соответствующая известному уровню техники обработка спектральных значений заполнения шумом в основной полосе частот путем операции прямого расширения полосы частот или интеллектуального заполнения промежутков не декоррелирует шум от основной полосы частот, а только изменяет его уровень, например. Однако, введение декоррелированных значений шума в исходном диапазоне частот с одной стороны и в целевом диапазоне частот с другой стороны, предпочтительно выводимых на основе отдельного процесса (обработки) шума обеспечивает лучшие результаты. Однако, даже введение значений шума, не являющихся полностью декоррелированными, или не полностью независимых, но, по меньшей мере, частично декоррелированных, например, согласно значению декорреляции в 0,5 или менее, если значение декорреляции «нуль» обозначает «полностью декоррелированный», исправляет проблему полной корреляции в известном уровне техники.

Следовательно, варианты осуществления относятся к объединению декодирования формы сигнала, расширения полосы частот или заполнения промежутков и заполнения шумом в перцепционном декодере.

Дополнительные преимущества состоят в том, что в отличие от уже существующих концепций, устраняются появление искажений сигнала и артефакты резкости восприятия, которые в настоящий момент являются типичными для вычисления расширений полосы частот или заполнения промежутков после декодирования формы сигнала и заполнения шумом.

Это обусловлено, в некоторых вариантах осуществления, изменением порядка упомянутых этапов обработки. Предпочтительно выполнять расширение полосы частот или заполнение промежутков непосредственно после декодирования формы сигнала, и кроме того предпочтительно вычислять заполнение шумом затем на уже восстановленном сигнале, используя некоррелированный шум.

В дополнительных вариантах осуществления декодирование формы сигнала и заполнение шумом могут выполняться в обычном порядке и далее ниже по ходу обработки, значения шума могут быть заменены надлежаще масштабированным некоррелированным шумом.

Следовательно, настоящее изобретение решает проблемы, которые происходят из-за операции копирования или операции дублирования на заполненном шумом спектре, путем сдвига этапа заполнения шумом на самый конец цепочки обработки и использования некоррелированного шума для внесения вставок или заполнения промежутков.

Затем, предпочтительные варианты осуществления настоящего изобретения рассматриваются относительно сопроводительных чертежей, на которых:

Фиг.1a - иллюстрация устройства для кодирования аудиосигнала;

Фиг.1b - иллюстрация декодера для декодирования кодированного аудиосигнала, соответствующего кодеру по Фиг.1a;

Фиг.2a - иллюстрация предпочтительной реализации декодера;

Фиг.2b - иллюстрация предпочтительной реализации кодера;

Фиг.3a - иллюстрация схематичного представления спектра, как сформирован декодером спектральной области по Фиг.1b;

Фиг.3b - иллюстрация таблицы, указывающей отношение между масштабными коэффициентами для диапазонов масштабных коэффициентов и энергий для диапазонов восстановления и информацией о заполнении шумом для диапазона заполнения шумом;

Фиг.4a - иллюстрация функциональности кодера спектральной области для применения выбора спектральных областей в первый и второй наборы спектральных областей;

Фиг.4b - иллюстрация реализации функциональности по Фиг.4a;

Фиг.5a - иллюстрация функциональности кодера с поддержкой MDCT (модифицированное дискретное косинусное преобразование);

Фиг.5b - иллюстрация функциональности декодера с технологией MDCT;

Фиг.5c - иллюстрация реализации регенератора частоты;

Фиг.6 - иллюстрация блок-схемы устройства для формирования расширенного сигнала в соответствии с настоящим изобретением;

Фиг.7 - иллюстрация потока сигналов независимого заполнения шумом, управляемого информацией выбора в декодере, в соответствии с вариантом осуществления настоящего изобретения;

Фиг.8 - иллюстрация потока сигналов независимого заполнения шумом, реализованного при помощи измененного порядка следования заполнения промежутков или расширения полосы частот и заполнения шумом в декодере;

Фиг.9 - иллюстрация структурной схемы процедуры в соответствии с дополнительным вариантом осуществления настоящего изобретения;

Фиг.10 - иллюстрация структурной схемы процедуры в соответствии с дополнительным вариантом осуществления настоящего изобретения;

Фиг.11 - иллюстрация структурной схемы для пояснения масштабирования случайных значений;

Фиг.12 - иллюстрация структурной схемы, иллюстрирующей встраивание настоящего изобретения в общую процедуру расширения полосы частот или заполнения промежутков;

Фиг.13a - иллюстрация кодера с вычислением параметра расширения полосы частот; и

Фиг.13b - иллюстрация декодера с расширением полосы частот, реализованного в виде постпроцессора, а не интегрированной процедуры как на Фиг.1a или 1b.

Фиг.6 иллюстрирует устройство для формирования расширенного сигнала, такого как аудиосигнал, из входного сигнала, который может также быть аудиосигналом. Расширенный сигнал имеет спектральные значения для участка спектра расширения, причем спектральные значения для участка спектра расширения не содержатся в первоначальном входном сигнале на входе 600 входного сигнала. Устройство содержит средство 602 отображения, чтобы отображать исходный участок спектра входного сигнала на целевой участок в участке спектра расширения, причем исходный участок спектра содержит участок заполнения шумом.

Кроме того, устройство содержит средство 604 заполнения шумом, сконфигурированный для формирования первых значений шума для участка заполнения шумом в исходном участке спектра входного сигнала и для формирования вторых значений шума для шумового участка в целевом участке, причем вторые значения шума, то есть, значения шума в целевом участке, являются независимыми или некоррелированными или декоррелированными от первых значений шума в участке заполнения шумом.

Один вариант осуществления относится к ситуации, в которой заполнение шумом фактически выполняется в основной полосе частот, то есть, в которой значения шума в исходном участке были сформированы заполнением шумом. В дополнительной альтернативе полагают, что заполнение шумом в исходном участке не выполнялось. Однако исходный участок имеет шумовой участок, фактически заполненный шумоподобными спектральными значениями, для примера кодированными в виде спектральных значений исходным или базовым кодером. Отображение этого шумоподобного исходного участка на участок расширения также будет генерировать зависимый шум в исходном и целевом участках. Чтобы решить этот вопрос, средство заполнения шумом только заполняет шумом целевой участок средства отображения, то есть, генерирует вторые значения шума для шумового участка в целевом участке, причем вторые значения шума являются декоррелированными от первых значений шума в исходном участке. Эта замена или заполнение шумом также могут иметь место или в буфере исходных фрагментов, или могут иметь место непосредственно в целевом объекте. Шумовой участок может быть идентифицирован классификатором либо путем анализа исходного участка, либо путем анализа целевого участка.

С этой целью ссылка делается на Фиг.3A. Фиг.3A иллюстрирует в качестве участка заполнения, такого как диапазон 301 масштабных коэффициентов во входном сигнале, и средство заполнения генерирует первые спектральные значения шума в этом диапазоне 301 заполнения шумом в операции декодирования входного сигнала.

Кроме того, этот диапазон 301 заполнения шумом отображают на целевой участок, то есть, в соответствии с известным уровнем техники, сформированные значения шума отображают на целевой участок и, следовательно, целевой участок будет иметь зависимый или коррелированный с исходным участком шум.

В соответствии с настоящим изобретением, однако, средство 604 заполнения шумом по Фиг.6 генерирует вторые значения шума для шумового участка в участке назначения или целевом, где вторые значения шума являются декоррелированными или некоррелированными или независимыми от первых значений шума в диапазоне 301 заполнения шумом по Фиг.3A.

В целом, средство заполнения шумом и средство отображения для отображения исходного участка спектра на целевой участок могут быть включены в регенератор высокой частоты, как проиллюстрировано в контексте фигур Фиг. 1A - 5C для примера в рамках интегрированного заполнения промежутков, или может быть реализовано в виде постпроцессора, как проиллюстрировано на Фиг.13B, и соответствующего кодера на Фиг.13A.

Обычно, входной сигнал подвергается обратному квантованию 700 или любой другой или дополнительной предопределенной обработке 700 декодера, каковое означает, что на выходе блока 700 получают входной сигнал по Фиг.6, так что вход в блок заполнения шумом базового кодера или блок 704 средства заполнения шумом является входом 600 по Фиг.6. Средство отображения на Фиг.6 соответствует блоку 602 заполнения промежутков или расширения полосы частот, и блок 702 заполнения независимым шумом также включен в состав средства 604 заполнения шумом по Фиг.6. Таким образом, блоки 704 и 702 оба включены в блок 604 средства заполнения шумом по Фиг.6, и блок 704 генерирует так называемые первые значения шума для шумового участка в участке заполнения шумом, и блок 702 генерирует вторые значения шума для шумового участка в участке назначения или целевом, который выводят на основе участка заполнения шумом в основной полосе частот путем расширения полосы частот, выполняемого средством отображения или блоком 602 заполнения промежутков или расширения полосы частот. Кроме того, как обсуждено далее, операция заполнения независимым шумом, выполняемая блоком 702, управляется согласно вектору (параметров) управления PHI, проиллюстрированного линией 706 управления.

1. Этап: Идентификация шума

На первом этапе идентифицируют все спектральные линии, которые представляют шум в переданном аудио кадре. Процесс идентификации может управляться согласно уже существующим, переданным сведениям о шумовых позициях, используемых заполнением шумом [4][5], или может быть идентифицирован с помощью дополнительного классификатора. Результатом идентификации линии шума является вектор, содержащий нули и единицы, где позиция с единицей указывает спектральную линию, которая представляет шум.

В математических терминах эта процедура может быть описана в виде:

Пусть будет переданным и повторно квантованным спектром после заполнения шумом [4][5] кодированного с преобразованием, обрабатываемого способом окна сигнала длиной . Пусть будет линией остановки всего процесса декодирования.

Классификатор определяет спектральные линии, где используется заполнение шумом [4][5] в базовой области:

	использовалось заполнение шумом	, 0≤i<m≤N.
иначе

и результат является вектором длины m.

Дополнительный классификатор может идентифицировать дополнительные линии в , который представляет шум. Этот классификатор может быть описан в виде:

	если классифицировано как шум	, 0≤i<m≤N.
иначе

После процесса идентификации шума вектор указателей шума задается в виде:

	спектральная линия идентифицирована как линия шума	, 0≤i<m≤N.
спектральная линия не идентифицирована как линия шума

2. Этап: Независимый шум

На втором этапе конкретный участок переданного спектра выбирают и копируют в исходный фрагмент. Внутри этого исходного фрагмента идентифицированный шум заменяют случайным шумом. Энергию вставленного случайного шума настраивают на такую же энергию первоначального шума в исходном фрагменте.

В математических терминах эта процедура может быть описана в виде:

Пусть , будет начальной линией для процесса копирования, описанного на этапе 3. Пусть будет непрерывной частью переданного спектра , представляющей исходный фрагмент длиной , который содержит спектральные линии в , где - индекс первой спектральной линии в исходном фрагменте , так что Кроме того, пусть , так что

Идентифицированный шум теперь заменяют сформированным случайным синтезированным шумом. Чтобы сохранить спектральную энергию на том же уровне, сначала вычисляют энергию шума, обозначенного :

Если - пропустить замещение независимого шума для исходного фрагмента , иначе заменить шум, обозначенного :

где - случайное число для всех .

Затем вычисляют энергию для вставленных случайных чисел:

Если - вычислить коэффициент , иначе установить :

С помощью g, повторно масштабировать замененный шум:

После замещения шума исходный фрагмент содержит линии шума, которые являются независимыми от линий шума в .

3. Этап: Копирование

Исходный фрагмент отображают на его целевой участок в :

или, если используется IGF-схема [8]:

Фиг.8 иллюстрирует вариант осуществления, в котором после какой-либо постобработки, такой как декодирование спектральной области, иллюстрируемое в блоке 112 на Фиг.1B, или, в варианте осуществления постпроцессора, иллюстрируемого блоком 1326 на Фиг.13B, входной сигнал подвергают заполнению промежутков или расширению полосы частот сначала, то есть, сначала подвергают операции отображения и затем выполняют заполнение независимым шумом после этого, то есть, внутри полного спектра.

Процесс, описанный в вышеупомянутом контексте по Фиг.7, может выполняться как операция «на месте», так что промежуточный буфер не является необходимым. Следовательно, порядок исполнения приспосабливается (упрощается).

Исполнить первый этап, как описано в контексте Фиг.7, снова набор спектральных линий в являются исходным участком. Выполнить:

2. Этап: Копирование

или, если используется IGF-схема [8]:

3. Этап: Заполнение независимым шумом

Выполнить действующее заполнение шумом вплоть до и вычислить энергию спектральных линий шума в исходном участке :

Выполнить независимое заполнение шумом в заполнении промежутка или участка спектра BWE:

где снова является набором случайных чисел.

Вычислить энергию для вставленных случайных чисел:

Снова, если вычислить коэффициент , иначе установить :

С помощью g, повторно масштабировать замененный шум:

Заполнение независимым шумом по изобретению может использоваться также в стерео среде пары каналов. Следовательно, кодер вычисляет надлежащее представление, L/R (правый/левый) или M/S (средний/боковой), пары каналов на каждый частотный диапазон и необязательные коэффициенты предсказания. Декодер применяет заполнение независимым шумом, как описано выше, к надлежаще выбранному представлению каналов до последующего вычисления окончательного преобразования всех частотных диапазонов в представление L/R.

Изобретение является применимым или подходящим для всех аудио приложений, в которых полная полоса частот не является доступной, или которые используют заполнение промежутка для заполнения спектральных провалов. Изобретение может найти применение в распространении или широковещании аудио контента такого как, например, с приложениями цифрового радио, потоковой передачи в сети Интернет и аудио связи.

Затем, варианты осуществления настоящего изобретения обсуждаются относительно фигур Фиг. 9-12. На этапе 900 шумовые участки идентифицируют в исходном диапазоне. Эта процедура, которая была обсуждена выше по отношению к ʺИдентификации шумаʺ, может основываться на дополнительной информации заполнения шумом, принятой от стороны кодера полностью, или также может быть сконфигурирована, чтобы альтернативно или дополнительно основываться на анализе сигнала относительно входного сигнала, уже сформированного, но без спектральных значений для участка спектра расширения, то есть, без спектральных значений для участка спектра этого расширения.

Затем, на этапе 902, исходный диапазон, который уже был подвергнут прямому заполнению шумом, как известно в области техники, то есть, полностью исходный диапазон, копируют в буфер исходных фрагментов.

Затем, на этапе 904, первые значения шума, то есть, прямые значения шума, сформированные внутри участка заполнения шумом входного сигнала, заменяют в буфере исходных фрагментов случайными значениями. Затем, на этапе 906, эти случайные значения масштабируют в буфере исходных фрагментов, чтобы получить вторые значения шума для целевого участка. Затем, на этапе 908 выполняют операцию отображения, то есть, их контент из буфера исходных фрагментов, доступный после этапов 904 и 906, отображают на целевой диапазон. Таким образом, посредством операции 904 замещения и после операции 908 отображения была получена операция заполнения независимым шумом в исходном диапазоне и в целевом диапазоне.

Фиг.10 иллюстрирует дополнительный вариант осуществления настоящего изобретения. Снова, на этапе 900, идентифицируют шум в исходном диапазоне. Однако функциональность этого этапа 900 отличается от функциональности этапа 900 на Фиг.9, поскольку этап 900 на Фиг.9 может работать на спектре входного сигнала, который уже имеет принятые значения шума, то есть, в котором операция заполнения шумом уже была выполнена.

Однако, на Фиг.10, какая-либо операция заполнения шумом по отношению к входному сигналу не была выполнена, и входной сигнал еще не имеет каких-либо значений шума в участке заполнения шумом на входе на этапе 902. На этапе 902 исходный диапазон отображают на диапазон назначения или целевой, где значения заполнения шумом не включены в исходный диапазон.

Таким образом, идентификация шума в исходном диапазоне на этапе 900 может быть, относительно участка заполнения шумом, выполняемой путем идентификации нулевых спектральных значений в сигнале и/или путем использования этой дополнительной информации заполнения шумом из входного сигнала, то есть, сформированной стороной кодера информации заполнения шумом. Затем, на этапе 904 считывается информация заполнения шумом и, конкретно, информация энергии, идентифицирующая энергию, подлежащая введению во входной сигнал стороны декодера.

Затем, как проиллюстрировано на этапе 1006, выполняется заполнение шумом в исходном диапазоне и, затем или одновременно, выполняется этап 1008, то есть, случайные значения вставляются в позиции в диапазоне назначения, которые были идентифицированы этапом 900 по полной полосе, или которые были идентифицированы путем использования информации основной полосы частот или входного сигнала вместе с информацией отображения, то есть, какой (из множества) исходный диапазон отображен на какой (из множества) целевой диапазон.

В заключение, вставленные случайные значения масштабируют, чтобы получить вторые независимые или некоррелированные или декоррелированные значения шума.

Затем обсуждается Фиг.11, чтобы проиллюстрировать дополнительную информацию о масштабировании значений заполнения шумом в участке спектра расширения, то есть, каким образом из случайных значений получают вторые значения шума.

На этапе 1100 получают информацию об энергии шума в исходном диапазоне. Затем, информацию энергии определяют из случайных значений, то есть, из значений, сформированных случайным или псевдослучайным процессом, как проиллюстрировано на этапе 1102. Кроме того, этап 1104 иллюстрирует, каким образом вычислять масштабный коэффициент, то есть, путем использования информации энергии относительно шума в исходном диапазоне и путем использования информации энергии относительно случайных значений. Затем, на этапе 1106, случайные значения, то есть, на основе которых энергия была вычислена на этапе 1102, умножают на масштабный коэффициент, сформированный этапом 1104. Следовательно, иллюстрируемая на Фиг.11 процедура соответствует вычислению масштабных коэффициентов g, иллюстрируемому ранее в варианте осуществления. Однако все эти вычисления также могут выполняться в логарифмической области или в любой другой области, и этап 1106 умножения может быть заменен сложением или вычитанием в области значений по логарифмической шкале.

Дополнительная ссылка делается на Фиг.12, чтобы проиллюстрировать встраивание настоящего изобретения в рамки общей схемы интеллектуального заполнения промежутков или расширения полосы частот. На этапе 1200 информацию огибающей спектра извлекают из входного сигнала. Информация огибающей спектра может, например, формироваться выделителем 1306 параметров по Фиг.13A и может предоставляться декодером 1324 параметра по Фиг.13b. Затем, вторые значения шума и другие значения в диапазоне назначения масштабируют, используя эту информацию огибающей спектра, как проиллюстрировано на этапе 1202. Затем, любая дополнительная постобработка 1204 может выполняться для получения окончательного расширенного сигнала временной области, имеющего увеличенную ширину полосы частот в случае расширения полосы частот или имеющего сниженное число спектральных провалов или отсутствие таковых в контексте интеллектуального заполнения промежутков.

В этом контексте в общих чертах изложено, конкретно для варианта осуществления по Фиг.9, что могут применяться несколько альтернатив. Для варианта осуществления этап 902 выполняют с полным спектром для входного сигнала или, по меньшей мере, с областью спектра входного сигнала, которая находится выше граничной частоты заполнения шумом. Эта частота гарантирует, что ниже некоторой частоты, то есть, ниже этой частоты, какое-либо заполнение шумом не выполняют вовсе.

Затем, независимо от какой-либо специфической информации отображения исходный диапазон/целевой диапазон, полный спектр входного сигнала, то есть, весь потенциальный исходный диапазон копируют в буфер 902 исходных фрагментов и затем обрабатывают с помощью этапа 904 и 906, и этап 908 затем выбирает некоторый конкретно требуемый исходный участок из этого буфера исходных фрагментов.

В других вариантах осуществления, однако, только конкретно требуемые исходные диапазоны, которые могут быть только частями входного сигнала, копируют в одиночный буфер исходных фрагментов или в несколько отдельных буферов исходных фрагментов на основании информации «исходный диапазон/целевой диапазон», включенной во входной сигнал, то есть, ассоциированной в виде дополнительной информации к этому входному сигналу аудио. В зависимости от ситуации вторая альтернатива, где только конкретно требуемые исходные диапазоны обрабатываются согласно этапам 902, 904, 906, сложность или, по меньшей мере, требования к памяти, могут быть снижены по сравнению с ситуацией, где всегда, независимо от конкретной ситуации отображения, исходный диапазон целиком, по меньшей мере, выше граничной частоты заполнения шумом обрабатывается согласно этапам 902, 904, 906.

Затем ссылка делается на фигуры Фиг.1a - 5c, чтобы проиллюстрировать конкретную реализацию настоящего изобретения в регенераторе 116 частоты, который помещают до преобразователя 118 спектр-время.

Фиг.1a иллюстрирует устройство для кодирования аудиосигнала 99. Аудиосигнал 99 вводится в преобразователь 100 время-спектр для преобразования аудиосигнала, имеющего частоту дискретизации, в спектральное представление 101, выводимое этим преобразователем время-спектр. Спектр 101 вводится в спектральный анализатор 102 для осуществления анализа спектрального представления 101. Спектральный анализатор 101 сконфигурирован для определения первого набора первых спектральных областей 103, подлежащих кодированию с первым спектральным разрешением, и другого второго набора вторых спектральных областей 105, подлежащих кодированию со вторым спектральным разрешением. Второе спектральное разрешение меньше чем первое спектральное разрешение. Второй набор вторых спектральных областей 105 вводится в вычислитель параметра или параметрический кодер 104 для вычисления информации огибающей спектра, имеющей второе спектральное разрешение. Кроме того, кодер 106 аудио спектральной области обеспечивается для формирования первого кодированного представления 107 первого набора первых спектральных областей, имеющих первое спектральное разрешение. Кроме того, вычислитель параметра/параметрический кодер 104 сконфигурирован для формирования второго кодированного представления 109 для второго набора вторых спектральных областей. Первое кодированное представление 107 и второе кодированное представление 109 вводятся в мультиплексор битового потока или формирователь 108 битового потока и блок 108 в заключение выводит кодированный аудиосигнал для передачи или сохранения на запоминающем устройстве.

Как правило, первую спектральную область, такую как 306 на Фиг.3a, будут окружать две вторые спектральные области, такие как 307a, 307b. Это не так в случае HE AAC, где частотный диапазон базового кодера является ограниченным по полосе частот.

Фиг.1b иллюстрирует декодер, соответствующий кодеру по Фиг.1a. Первое кодированное представление 107 вводится в декодер 112 аудио спектральной области, чтобы сформировать первое декодированное представление для первого набора первых спектральных областей, декодированное представление имеет первое спектральное разрешение. Кроме того, второе кодированное представление 109 вводится в параметрический декодер 114, чтобы сформировать второе декодированное представление для второго набора вторых спектральных областей, имеющих второе спектральное разрешение, являющееся более низким, чем первое спектральное разрешение.

Декодер дополнительно содержи

Устройство и способ формирования расширенного сигнала с использованием заполнения независимым шумом

Патент 2665913