Расширение полосы пропускания аудио посредством вставки шума с предварительно приданной формой по времени в частотной области

Иллюстрации

Показать все

Изобретение относится к средствам для расширения полосы пропускания аудио посредством вставки шума. Технический результат заключается в повышении эффективности расширения полосы пропускания. Принимают битовый поток и выводят закодированный аудиосигнал из битового потока, используя приемник битового потока. Выводят декодированный аудиосигнал во временной области из закодированного аудиосигнала, используя модуль базового декодера. Определяют временную огибающую декодированного аудиосигнала, используя генератор временной огибающей. Создают сигнал расширения полосы пропускания частотной области, используя модуль расширения полосы пропускания, выполняющий следующие этапы. Создают сигнал шума во временной области, используя генератор шума модуля расширения полосы пропускания. Придают форму по времени сигналу шума в зависимости от временной огибающей декодированного аудиосигнала, используя модуль предварительного придания формы. Трансформируют сигнал шума с приданной формой в сигнал шума частотной области, при этом сигнал расширения полосы пропускания частотной области зависит от сигнала шума частотной области, используя время-частотный преобразователь. 3 н. и 21 з.п. ф-лы, 4 ил.

Реферат

Изобретение относится к кодированию речи и аудио и, в частности, к расширению полосы пропускания (BWE) аудио.

Методики расширения полосы пропускания сфокусированы на улучшении воспринимаемого качестве аудио кодека посредством уширения его эффективной выходной полосы пропускания. Вместо кодирования всего диапазона полосы пропускания с помощью лежащего в основе базового кодера, кодеки, использующие методику расширения полосы пропускания обеспечивают меньший расход битов в менее важных по восприятию диапазонах верхней частоты (HF). Таким образом, больше битов доступно базовому кодеру, обрабатывающему более важный диапазон нижней частоты (LF) с более высокой точностью. По этой причине методики расширения полосы пропускания обычно используются в кодеках, которым требуется реализовать надлежащее воспринимаемое качество при низких скоростях передачи битов.

В целом, существует два разных подхода расширения полосы пропускания, которые необходимо различать: Слепое расширение полосы пропускания и направленное расширение полосы пропускания. При слепом расширении полосы пропускания, не передается какой-либо дополнительной побочной информации. Таким образом, HF-контент, который должен быть вставлен на стороне декодера, генерируется, используя лишь информацию, которая выводится из декодированного LF-сигнала базового кодера. Поскольку передача затратной подобной информации не требуется, методики Слепого расширения полосы пропускания хорошо подходят для кодеков, работающих на самых низких скоростях передачи битов или для обратно совместимых процедур постобработки. С другой стороны, недостаток возможности управления обеспечивает лишь относительно небольшое эффективное расширение полосы пропускания, используя Слепое расширение полосы пропускания (например, 6,4-7,0 кГц в [1]). В противоположность слепому подходу, при направленном расширении полосы пропускания HF-контент реконструируется, используя параметры, которые извлекаются на стороне кодировщика и передаются декодеру в качестве побочной информации в битовом потоке. Следовательно, направленное расширение полосы пропускания обеспечивает более хорошее управление HF-реконструкцией, и возможно воспроизведение более широких эффективных полос пропускания. Из-за дополнительного расхода битов, методики направленного расширения полосы пропускания обычно используются для кодеков, работающих на более высоких скоростях передачи битов, чем системы, включающие в себя слепое расширение полосы пропускания.

В частности, существуют разные методологии для реализации расширения полосы пропускания.

При кодировании речи, обычно используются основанные на модели исходного фильтра способы расширения полосы пропускания, которые тесно связаны с лежащими в их основе базовыми кодерами, как например в G.722.2 (AMR-WB) [1]. В AMR-WB, выходная полоса пропускания в 6,4 кГц базового кодера ACELP (линейное предсказание с возбуждением алгебраическим кодом) расширяется до 7,0 кГц посредством введения белого шума в область возбуждения. Впоследствии, расширенному возбуждению придается форма посредством фильтра, который выведен из фильтра линейного предсказания (LP) базового кодера. В зависимости от скорости передачи битов коэффициент усиления для масштабирования вставленного шума либо оценивается используя только информацию базового кодера, либо он извлекается в кодировщике и передается. Данный способ расширения полосы пропускания в значительной степени зависит от лежащей в его основе схемы кодирования, поскольку он использует ее механизмы синтеза и, следовательно, дополнительно должен выполняться в той же самой области.

Общеизвестной независимой от базового кодера методикой расширения полосы пропускания в кодировании аудио является репликация спектральной полосы (SBR) [2]. В противоположность предыдущему примеру, репликация спектральной полосы может быть применена независимо от лежащего в ее основе базового кодера. В качестве первого этапа, входной сигнал разбивается на LF- и HF-часть на стороне кодировщика, например, посредством использования набора фильтров анализа квадратурного зеркального фильтра (QMF). LF-сигнал подается на базовый кодер в то время как HF-часть обрабатывается посредством репликации спектральной полосы. Вследствие этого, параметры, описывающие частотно-временную огибающую HF-сигнала, как, впрочем, и тональность/шумность HF-сигнала относительно LF-сигнала, извлекаются и передаются. После декодирования, сигнал трансформируется, используя тот же самый набор фильтров анализа, который использовался в кодировщике. Чтобы реконструировать HF-контент, декодированный сигнал копируется, зеркально отображается или транспонируется порционно в HF-диапазон, подвергается постобработке, чтобы совпадать с тональностью/шумностью исходного, и ему придается форма по времени, как, впрочем, и по спектру, учитывая переданные параметры. Впоследствии выходной сигнал во временной области генерируется посредством соответствующего набора фильтров синтеза.

В противоположность предыдущим отмеченным (полу-) параметрическим способам также существуют многочисленные подходы на основе слоя, использующие несколько, выбираемых по скорости передачи битов слоев для расширения полосы пропускания. Данный принцип также в значительной степени связан со схемами масштабируемого кодирования. Эти методики часто используются для расширения существующих систем кодирования допускающим совместную работу образом. В [3] представляется сверхширокополосное (SWB) расширение полосы пропускания для G.711.1 и G.722, которое обрабатывает дополнительную полосу пропускания (8,0-14,4 кГц) с помощью основанной на модифицированном дискретном косинусном преобразовании схеме кодирования независимой от базового кодера. Данный подход обеспечивает точную реконструкцию HF-частей, но за счет дополнительно необходимого, высокого расхода битов.

Несмотря на то что вышеупомянутые подходы расширения полосы пропускания широко распространены в настоящих системах кодирования речи и аудио, все они представляют конкретные дефекты или недостатки, соответственно.

Цель настоящего изобретения состоит в предоставлении улучшенной концепции для расширения полосы пропускания.

Данная цель достигается посредством устройства декодера для декодирования битового потока, при этом устройство декодера аудио содержит:

приемник битового потока, выполненный с возможностью приема битового потока и выведения закодированного аудиосигнала из битового потока;

модуль базового декодера, выполненный с возможностью выведения декодированного аудиосигнала во временной области из закодированного аудиосигнала;

генератор временной огибающей, выполненный с возможностью определения временной огибающей декодированного аудиосигнала;

модуль расширения полосы пропускания, выполненный с возможностью создания сигнала расширения полосы пропускания частотной области, при этом модуль расширения полосы пропускания содержит генератор шума, выполненный с возможностью создания сигнала шума во временной области, при этом модуль расширения полосы пропускания содержит модуль предварительного придания формы, выполненный с возможностью придания формы по времени сигналу шума в зависимости от временной огибающей декодированного аудиосигнала для того, чтобы создать сигнал шума с приданной формой и при этом модуль расширения полосы пропускания содержит время-частотный преобразователь, выполненный с возможностью трансформирования сигнала шума с приданной формой в сигнал шума частотной области; при этом сигнал расширения полосы пропускания частотной области зависит от сигнала шума частотной области;

время-частотный преобразователь, выполненный с возможностью трансформирования декодированного аудиосигнала в декодированный аудиосигнал частотной области;

объединитель, выполненный с возможностью объединения декодированного аудиосигнала частотной области и сигнала расширения полосы пропускания частотной области для того, чтобы создать аудиосигнал частотной области с расширенной полосой пропускания; и

частотно-временной преобразователь, выполненный с возможностью трансформирования аудиосигнал частотной области с расширенной полосой пропускания в аудиосигнал временной области с расширенной полосой пропускания.

Изобретение предоставляет концепцию расширения полосы пропускания, которая может быть главным образом применена независимо от лежащей в основе методики базового кодирования. Кроме того, оно предлагает расширение полосы пропускания вплоть до сверхширокополосных диапазонов частот для точек, работающих с низкой скоростью передачи битов, с высоким воспринимаемым качеством в особенности для речевых сигналов. Это достигается посредством генерирования сигналов шума с приданной формой по времени во временной области, которые трансформируются и вставляются в декодированный аудиосигнал частотной области.

Понятие сигнал расширения полосы пропускания частотной области относится к сигналу, содержащему частоты, которые не содержатся в декодированном аудиосигнале.

В гибких, адаптивных к сигналу системах, включающих в себя более одного единого базового кодера, например, как содержится в унифицированном кодировании речи и аудио (MPEG-D USAC), артефакты переключения, которые возникают на переходе между разными базовыми кодерами, могут быть более ярко выделены, поскольку в то же самое время также должно переключаться расширение полосы пропускания. Эти проблемы могут быть преодолены посредством применения независимой от базового кодера методики расширения полосы пропускания в соответствии с изобретением.

Репликация спектральной полосы привносит артефакты, которые могут быть раздражающими, в особенности, когда кодируется речь, из-за накладки LF-компонентов на HF-часть. Эти артефакты возникают из-за корреляции LF- и HF-контента, на который осуществляется накладка, с одной стороны. С другой стороны, возможное спектральное несовпадение между LF- и HF-частью приводит к резко звучащим, негармоничным искажениям. В противоположность этому, устройство декодера в соответствии с изобретением предупреждает создание артефактов и резкого звучания.

Другой дефект репликации спектральной полосы состоит в том, что присутствует ограниченная возможность манипулирования временной структурой HF-части, на которую осуществляется накладка. Из-за необходимости эффективного для скорости передачи битов параметрического время-частотного представления контента, временное разрешение является ограниченным. Это может быть недостатком для, например, обработки женской речи, где основной тон глоттальных импульсов является высоким и также проявляет высокое временное непостоянство. Устройство декодера в соответствии с изобретением, в противоположность репликации спектральной полосы, хорошо подходит для воспроизведения женской речи.

Наконец, расширение полосы пропускания, основанное на нескольких слоях, способно точно реконструировать HF-контент как по спектру, так и по времени, но с другой стороны его необходимый расход битов значительно выше, чем для параметрических подходов. Устройство декодера в соответствии с изобретением обеспечивает более низкий расход битов, обусловленный такими подходами.

Таким образом, настоящее изобретение предоставляет новую концепцию расширения полосы пропускания, которая объединяет преимущества общеизвестных, ранее описанных методик расширения полосы пропускания, при этом исключая их недостатки. В частности предоставляется концепция, которая обеспечивает высококачественное, сверхширокополосное кодирование речи на низких скоростях передачи битов, при этом независимое от лежащего в основе базового кодера.

Изобретение обеспечивает с высоким воспринимаемым качеством в особенности применительно к речи выходные полосы пропускания вплоть до сверхширокополосного диапазона. Расширение полосы пропускания в соответствии с изобретением основано на вставке шума. Дополнительно, новое расширение полосы пропускания является независимым от лежащего в его основе базового кодека. Вследствие этого, оно - в противоположность стандартному расширению полосы пропускания кодирования речи - подходит для использования поверх переключаемых систем, включающих в себя фундаментально разные схемы кодирования.

Поскольку микширование сигнала нового предлагаемого расширения полосы пропускания и сигнала базового кодера выполняется в сравнимом время-частотном представлении с репликацией спектральной полосы, обе методики могут быть легко объединены в объединенной системе, где будет возможно гладкое переключение на основе кадр-за-кадром или смешивание в рамках заданного кадра. Так как новое расширение полосы пропускания сфокусировано главным образом на речи, данный подход может быть желательным для обработки сигналов, содержащих музыку или смешанный контент. Управление переключением может осуществляться либо посредством переданной побочной информации, либо посредством параметров, которые выводятся в декодере посредством анализа базового сигнала.

В соответствии с изобретением, генерирование и последующее придание формы шуму выполняется во временной области, поскольку во временной области временное разрешение может быть выше, чем в решениях, в которых шум генерируется и ему придается форма в время-частотном представлении, подобно тому, что применяется в обработке репликации спектральной полосы, поскольку наборы фильтров ограничивают временное разрешение, которое является неотъемлемым для воспроизведения речи с высоким основным тоном (например, женской).

Чтобы избежать вышеупомянутых проблем и все же выполнить требования, новое расширение полосы пропускания выполняет следующие этапы обработки: Сначала, один сигнал шума генерируется во временной области, при этом количество элементов дискретизации возникает из частоты кадров системы, как, впрочем, и выбранной частоты дискретизации и полосы пропускания сигнала шума. Впоследствии, осуществляется придание формы по времени сигналу шума, на основании временной огибающей декодированного сигнала базового кодера. Кроме того, объединенный время-частотно представленный сигнал преобразуется в аудио сигнал временной области с расширенной полосой пропускания посредством обратной трансформации.

Методики расширения полосы пропускания обычно используются в кодировании речи и аудио для улучшения воспринимаемого качества посредством уширения эффективной выходной полосы пропускания. Таким образом, большая часть доступных битов может быть использована внутри базового кодера, обеспечивая более высокую точность в более важном диапазоне нижней частоты. Несмотря на то что есть существующие подходы, некоторые из которых получили широкое признание, у всех у них отсутствует целесообразность использования при обработке речи системами, которые включают в себя несколько, переключаемых базовых кодеров, на основании разных схем кодирования. Так как расширение полосы пропускания в соответствии с изобретением является независимым от технологии базового декодера, настоящее изобретение предлагает методику расширения полосы пропускания, которая прекрасно подходит для вышеупомянутого и других применений.

В рамках расширения полосы пропускания в соответствии с изобретением, полностью синтетические сигналы расширения могут быть сгенерированы с временной огибающей, в отношении которой может быть осуществлено предварительное придание формы, и вследствие этого адаптированные к лежащему в основе сигналу базового кодера. Придание формы временной огибающей сигналу расширения может быть выполнено в значительно более высоком временном разрешении, чем это доступно в рамках реального набора фильтров или области трансформации, используемых в процессе пост-придания формы расширения полосы пропускания.

В соответствии с предпочтительным вариантом осуществления изобретения сигнал расширения полосы пропускания частотной области создается без репликации спектральной полосы. Посредством этих признаков могут быть минимизированы требуемые вычислительные затраты.

В соответствии с предпочтительным вариантом осуществления изобретения модуль расширения полосы пропускания выполнен таким образом, что придание формы по времени сигналу шума выполняется чрезмерно выраженным образом. Вместо придания формы сигналу шума на основании исходной временной огибающей декодированного аудиосигнала; также можно выполнять данное придание формы чрезмерно выраженным образом. Это может быть реализовано посредством раздвижения временной огибающей с точки зрения амплитуд, другими словами посредством динамического растяжения, в частности посредством модифицирования измеренной огибающей, чтобы представлять импульсы более острыми, чем было измерено, перед выведением коэффициентов усиления предварительного придания формы на ее основе. Несмотря на то что данное чрезмерное выражение не представляет собой фактическую исходную огибающую, разборчивость некоторых фрагментов сигнала, подобных, например, гласным звукам, улучшается применительно к очень низким скоростям передачи битов.

В соответствии с предпочтительным вариантом осуществления изобретения, модуль расширения полосы пропускания выполнен таким образом, что придание формы по времени сигналу шума выполняется по субполосам посредством разбиения сигнала шума на несколько сигналов шума субполосы посредством набора из полосовых фильтров и выполнения особого придания формы по времени над каждым из сигналов шума субполосы.

Вместо единообразного предварительного придания формы сигналу шума, придание формы может быть выполнено более точно посредством разбиения сигнала шума на несколько субполос посредством набора из полосовых фильтров и выполнения особого придания формы над каждым сигналом субполосы.

В соответствии с предпочтительным вариантом осуществления изобретения модуль расширения полосы пропускания содержит селектор диапазона частот, выполненный с возможностью установки диапазона частот сигнала расширения полосы пропускания частотной области. После преобразования сигнала шума с приданной формой во время-частотное представление, целевая полоса пропускания аудиосигнала частотной области с расширенной полосой пропускания может быть выбрана и, при необходимости, сдвинута до своей предназначенной, спектральной позиции. Посредством этих признаков диапазон частот аудиосигнала временной области с расширенной полосой пропускания может быть выбран простым образом.

В соответствии с предпочтительным вариантом осуществления изобретения модуль расширения полосы пропускания содержит модуль пост-придания формы, выполненный с возможностью придания формы по времени и/или по спектру в частной области сигналу расширения полосы пропускания частотной области. Посредством этих признаков сигнал расширения полосы пропускания частотной области может быть адаптирован по отношению к дополнительному временному тренду и/или спектральной огибающей для уточнения.

В соответствии с предпочтительным вариантом осуществления изобретения приемник битового потока выполнен с возможностью выведения сигнала побочной информации из битового потока, при этом модуль расширения полосы пропускания выполнен с возможностью создания сигнала расширения полосы пропускания частотной области в зависимости от сигнала побочной информации. Другими словами, дополнительная побочная информация, которая была извлечена внутри кодировщика и передана через битовый поток, может быть применена для дополнительного уточнения сигнала расширения полосы пропускания частотной области. Посредством этих признаков воспринимаемое качество аудиосигнала временной области с расширенной полосой пропускания может быть дополнительно увеличено.

В соответствии с предпочтительным вариантом осуществления изобретения генератор шума выполнен с возможностью создания сигнала шума в зависимости от сигнала побочной информации. В данном варианте осуществления управление генератором шума может осуществляться таким образом, чтобы получать сигнал шума со спектральным наклоном, вместо спектрально плоского белого шума, для того, чтобы дополнительно улучшить воспринимаемое качество аудиосигнала временной области с расширенной полосой пропускания.

В соответствии с предпочтительным вариантом осуществления изобретения модуль предварительного придания формы выполнен с возможностью придания формы по времени сигналу шума в зависимости от сигнала побочной информации. В рамках предварительного придания формы, побочная информация может быть использована, чтобы, например, выбирать некоторую целевую полосу пропускания сигнала базового декодера, которая используется для предварительного придания формы.

В соответствии с предпочтительным вариантом осуществления изобретения модуль пост-придания формы выполнен с возможностью придания формы по времени и/или по спектру выходному сигналу шума частотной области в зависимости от сигнала побочной информации. Использование побочной информации при пост-придании формы может гарантировать то, что грубая время-частотная огибающая сигнала расширения полосы пропускания частотной области следует исходной огибающей.

В соответствии с предпочтительным вариантом осуществления изобретения модуль расширения полосы пропускания содержит дополнительный генератор шума, выполненный с возможностью создания дополнительного сигнала шума во временной области, дополнительный модуль предварительного придания формы, выполненный с возможностью придания формы по времени дополнительному сигналу шума в зависимости от временной огибающей декодированного аудиосигнала для того, чтобы создавать дополнительный сигнал шума с приданной формой и дополнительный время-частотный преобразователь, выполненный с возможностью трансформирования дополнительного сигнала шума с приданной формой в дополнительный сигнал шума частотной области; при этом сигнал расширения полосы пропускания частотной области зависит от дополнительного сигнала шума частотной области. Создание сигнала расширения полосы пропускания частотной области используя два или более сигнала шума частотной области может привести к увеличению воспринимаемого качества аудиосигнала временной области с расширенной полосой частот.

В соответствии с предпочтительным вариантом осуществления изобретения модуль расширения полосы пропускания выполнен таким образом, что придание формы по времени дополнительному сигналу шума выполняется чрезмерно выраженным образом. Вместо придания формы дополнительному сигналу шума на основании исходной временной огибающей декодированного аудиосигнала; также можно выполнять данное придание формы чрезмерно выраженным образом. Это может быть реализовано посредством раздвижения временной огибающей с точки зрения амплитуд, перед выведением коэффициентов усиления предварительного придания формы на ее основе. Несмотря на то что данное чрезмерное выражение не представляет собой фактическую исходную огибающую, разборчивость некоторых фрагментов сигнала, подобных, например, гласным звукам, улучшается применительно к очень низким скоростям передачи битов.

В соответствии с предпочтительным вариантом осуществления изобретения модуль расширения полосы пропускания выполнен таким образом, что придание формы по времени дополнительному сигналу шума выполняется по субполосам посредством разбиения дополнительного сигнала шума на несколько дополнительных сигналов шума субполосы посредством набора из полосовых фильтров и выполнения особого придания формы по времени над каждым из дополнительных сигналов шума субполосы.

Вместо единообразного предварительного придания формы дополнительному сигналу шума, придание формы может быть выполнено более точно посредством разбиения дополнительного сигнала шума на несколько субполос посредством набора из полосовых фильтров и выполнения особого придания формы над каждым сигналом субполосы.

В соответствии с предпочтительным вариантом осуществления изобретения модуль расширения полосы пропускания содержит генератор тона, выполненный с возможностью создания сигнала тона во временной области, модуль предварительного придания формы тону, выполненный с возможностью придания формы по времени сигналу тона в зависимости от временной огибающей декодированного аудиосигнала для того, чтобы создать сигнал тона с приданной формой и время-частотный преобразователь, выполненный с возможностью трансформирования сигнала тона с приданной формой в сигнал тона частотной области, при этом сигнал расширения полосы пропускания частотной области зависит от сигнала тона частотной области.

Упомянутый генератор тона может быть функциональным, чтобы создавать все виды тонов, например, синусоидальные тоны, тоны треугольной и прямоугольной волны, пилообразные тоны, импульсы, которые напоминают искусственно озвученную речь, и т.д. В дополнение к обработке синтетических сигналов шума, также можно генерировать синтетические компоненты тона во временной области, которым придается форма по времени и впоследствии трансформируются в частотное представление. В данном случае, придание формы во временной области является более выгодным, например, для точного моделирования фаз ADSR (Атака, Спад, Поддержка, Затухание) тонов, что невозможно в обычном представлении в частотной области. Дополнительное использование сигнала тона частотной области может дополнительно увеличить качество сигнала временной области с расширенной полосой пропускания.

В соответствии с предпочтительным вариантом осуществления изобретения модуль базового декодера содержит базовый декодер временной области и базовый декодер частотной области, при этом либо базовый декодер временной области, либо базовый декодер частотной области используется для выведения декодированного аудиосигнала из закодированного аудиосигнала. Эти признаки позволяют использовать изобретение в среде унифицированного кодирования речи и аудио (MPEG-D USAC).

В соответствии с предпочтительным вариантом осуществления экстрактор параметра управления выполнен с возможностью извлечения параметров управления, используемых модулем базового декодера, из декодированного аудиосигнала и при этом модуль расширения полосы пропускания выполнен с возможностью создания сигнала расширения полосы пропускания частотной области в зависимости от параметров управления. Несмотря на то что сигнал расширения полосы пропускания частотной области может быть создан вслепую на основании огибающей базового кодера или на основании управления посредством параметров, выведенных из сигнала базового кодера, он также может быть создан частично направленным образом, посредством извлеченных и переданных параметров от кодировщика.

В соответствии с предпочтительным вариантом осуществления изобретения, модуль расширения полосы пропускания содержит калькулятор коэффициентов усиления придания формы, выполненный с возможностью установления коэффициентов усиления придания формы для модуля предварительного придания формы в зависимости от временной огибающей декодированного аудиосигнала и при этом модуль предварительного придания формы выполнен с возможностью придания формы по времени сигналу шума в зависимости от коэффициентов усиления придания формы для модуля предварительного придания формы. Эти признаки обеспечивают реализацию изобретения в простом виде.

В соответствии с предпочтительным вариантом осуществления изобретения калькулятор коэффициентов усиления придания формы для установления коэффициентов усиления придания формы для модуля предварительного придания формы выполнен с возможностью установления коэффициентов усиления придания формы для модуля предварительного придания формы в зависимости от параметров управления. Эти признаки обеспечивают реализацию изобретения в простом виде.

В соответствии с предпочтительным вариантом осуществления изобретения модуль расширения полосы пропускания содержит калькулятор коэффициентов усиления придания формы, выполненный с возможностью установления коэффициентов усиления придания формы для дополнительного модуля предварительного придания формы в зависимости от временной огибающей декодированного аудиосигнала и при этом дополнительный модуль предварительного придания формы выполнен с возможностью придания формы по времени дополнительному сигналу шума в зависимости от коэффициентов усиления придания формы для дополнительного модуля предварительного придания формы.

В соответствии с предпочтительным вариантом осуществления изобретения калькулятор коэффициентов усиления придания формы для установления коэффициентов усиления придания формы для дополнительного модуля предварительного придания формы выполнен с возможностью установления коэффициентов усиления придания формы для дополнительного модуля предварительного придания формы в зависимости от параметров управления.

В соответствии с предпочтительным вариантом осуществления изобретения, модуль расширения полосы пропускания содержит калькулятор коэффициентов усиления придания формы, выполненный с возможностью установления коэффициентов усиления придания формы для модуля предварительного придания формы тону в зависимости от временной огибающей декодированного аудиосигнала и при этом модуль предварительного придания формы тону выполнен с возможностью придания формы по времени сигналу тона в зависимости от коэффициентов усиления придания формы для модуля предварительного придания формы тону.

В соответствии с предпочтительным вариантом осуществления изобретения калькулятор коэффициентов усиления придания формы для установления коэффициентов усиления придания формы для модуля предварительного придания формы тону выполнен с возможностью установления коэффициентов усиления придания формы для дополнительного модуля предварительного придания формы в зависимости от параметров управления.

В дополнительном аспекте, цель достигается посредством способа для декодирования битового потока, при этом способ содержит этапы, на которых:

принимают битовый поток и выводят закодированный аудиосигнал из битового потока, используя приемник битового потока;

выводят декодированный аудиосигнал во временной области из закодированного аудиосигнала, используя модуль базового декодера;

определяют временную огибающую декодированного аудиосигнала, используя генератор временной огибающей;

создают сигнал расширения полосы пропускания частотной области, используя модуль расширения полосы пропускания, исполняющий этапы, на которых:

создают сигнал шума во временной области, используя генератор шума модуля расширения полосы пропускания,

придают форму по времени сигналу шума в зависимости от временной огибающей декодированного аудиосигнала для того, чтобы создать сигнал шума с приданной формой, используя модуль предварительного придания формы модуля расширения полосы пропускания,

трансформируют сигнал шума с приданной формой в сигнал шума частотной области; при этом сигнал расширения полосы пропускания частотной области зависит от сигнала шума частотной области, используя время-частотный преобразователь модуля расширения полосы пропускания;

трансформируют декодированный аудиосигнал в декодированный аудиосигнал частотной области, используя дополнительный время-частотный преобразователь;

объединяют декодированный аудиосигнал частотной области и сигнал расширения полосы пропускания частотной области для того, чтобы создать аудиосигнал частотной области с расширенной полосой пропускания, используя объединитель; и

трансформируют аудиосигнал частотной области с расширенной полосой пропускания в аудиосигнал временной области с расширенной полосой пропускания, используя частотно-временной преобразователь.

В дополнительном аспекте цель достигается посредством компьютерной программы, исполняющей способ изобретения, при выполнении на процессоре.

Предпочтительные варианты осуществления изобретения впоследствии рассматриваются в отношении сопроводительных чертежей, на которых:

Фиг. 1 иллюстрирует первый вариант осуществления устройства декодера аудио в соответствии с изобретением в схематичном виде;

Фиг. 2 иллюстрирует второй вариант осуществления устройства декодера аудио в соответствии с изобретением в схематичном виде;

Фиг. 3 иллюстрирует третий вариант осуществления устройства декодера аудио в соответствии с изобретением в схематичном виде; и

Фиг. 4 иллюстрирует четвертый вариант осуществления устройства декодера аудио в соответствии с изобретением в схематичном виде.

Фиг. 1 иллюстрирует первый вариант осуществления устройства декодера аудио в соответствии с изобретением в схематичном виде.

Устройство 1 декодера аудио содержит:

приемник 2 битового потока, выполненный с возможностью приема битового потока BS и выведения закодированного аудиосигнала EAS из битового потока BS;

модуль 3 базового декодера, выполненный с возможностью выведения декодированного аудиосигнала DAS во временной области из закодированного аудиосигнала EAS;

генератор 4 временной огибающей, выполненный с возможностью определения временной огибающей TED декодированного аудиосигнала DAS;

модуль 5 расширения полосы пропускания, выполненный с возможностью создания сигнала расширения полосы пропускания BEF частотной области, при этом модуль 5 расширения полосы пропускания содержит генератор 6 шума, выполненный с возможностью создания сигнала шума NOS во временной области, при этом модуль 5 расширения полосы пропускания содержит модуль 7 предварительного придания формы, выполненный с возможностью придания формы по времени сигналу шума NOS в зависимости от временной огибающей TED декодированного аудиосигнала DAS для того, чтобы создать сигнал шума с приданной формой SNS и при этом модуль 5 расширения полосы пропускания содержит время-частотный преобразователь 8, выполненный с возможностью трансформирования сигнала шума с приданной формой SNS в сигнал шума частотной области FNS; при этом сигнал расширения полосы пропускания частотной области BEF зависит от сигнала шума частотной области FNS;

время-частотный преобразователь 9, выполненный с возможностью трансформирования декодированного аудиосигнала DAS в декодированный аудиосигнал частотной области FDS;

объединитель 10, выполненный с возможностью объединения декодированного аудиосигнала частотной области FDS и сигнала расширения полосы пропускания частотной области BEF для того, чтобы создать аудиосигнал частотной области с расширенной полосой пропускания BFS; и

частотно-временной преобразователь 11, выполненный с возможностью трансформирования аудиосигнал частотной области с расширенной полосой пропускания BFS в аудиосигнал временной области с расширенной полосой пропускания BAS.

Изобретение предоставляет концепцию расширения полосы пропускания, которая может быть главным образом применена независимо от лежащей в основе методики базового кодирования. Кроме того, оно предлагает расширение полосы пропускания вплоть до сверхширокополосных диапазонов частот для точек, работающих с низкой скоростью передачи битов, с высоким воспринимаемым качеством в особенности для речевых сигналов. Это достигается посредством генерирования сигналов шума с приданной формой по времени SNS во временной области, которые трансформируются и вставляются в декодированный аудиосигнал частотной области FDS.

В гибких, адаптивных к сигналу системах, включающих в себя более одного единого базового кодера, например, как содержится в унифицированном кодировании речи и аудио (MPEG-D USAC), артефакты переключения, которые возникают на переходе между разными базовыми кодерами, могут быть более ярко выделены, поскольку в то же самое вр