Концепция заполнения шумом

Иллюстрации

Показать все

Изобретение относится к средствам для заполнения шумом спектра аудиосигнала. Технический результат заключается в повышении качества заполненного шумом аудиосигнала. Деквантуют спектр, как получен после заполнения шумом, с использованием спектрально изменяющегося и адаптивного к сигналу размера шага квантования, управляемого посредством огибающей спектра линейного предсказания, сигнализируемой посредством коэффициентов линейного предсказания в потоке данных, в который спектр кодируется, или коэффициентов масштабирования, относящихся к диапазонам коэффициентов масштабирования, сигнализируемых в потоке данных, в который спектр кодируется. Заполняют непрерывную спектральную нулевую часть спектра аудиосигнала шумом, спектрально сформированным с использованием функции, принимающей максимум во внутренней части непрерывной спектральной нулевой части и имеющей спадающие кнаружи края, абсолютный угол наклона которых отрицательно зависит от тональности. 13 н. и 12 з.п. ф-лы, 23 ил.

Реферат

Настоящая заявка относится к кодированию аудио, и, главным образом, к заполнению шумом в соединении с кодированием аудио.

В кодировании с преобразованием часто указывается (сравнивая [1], [2], [3]), что квантование частей спектра в нули ведет к ухудшению восприятия. Такие части, квантованные в нуль, называются спектральными дырами. Решение для этой проблемы, представленное в [1], [2], [3] и [4], состоит в том, чтобы заменять квантованные в нуль спектральные линии на шум. Иногда избегают вставки шума ниже некоторой частоты. Начальная частота для заполнения шумом является фиксированной, но разной среди известного в предшествующем уровне техники.

Иногда, FDNS (Формирование шума частотной области) используется для формирования спектра (включая вставленный шум) и для управления шумом квантования, как в USAC (сравнивая с [4]). FDNS выполняется с использованием амплитудной характеристики фильтра LPC. Коэффициенты фильтра LPC вычисляются с использованием подвергнутого предыскажению входного сигнала.

В [1] было замечено, что добавление шума в непосредственной окрестности тональной компоненты ведет к ухудшению, и соответственно, точно так же как в [5] только длинные последовательности нулей заполняются шумом, чтобы избегать скрытия квантованных не в нуль значений вставленным окружающим шумом.

В [3] замечено, что имеется проблема компромисса между гранулярностью заполнения шумом и размером требуемой сторонней информации. В [1], [2], [3] и [5] передается один параметр заполнения шумом в расчете на полный спектр. Вставленный шум спектрально формируется с использованием LPC как в [2] или с использованием коэффициентов масштабирования как в [3]. В [3] описано как адаптировать коэффициенты масштабирования к заполнению шумом с одним уровнем заполнения шумом для всего спектра. В [3], коэффициенты масштабирования для диапазонов, которые полностью квантуются в нуль, модифицируются, чтобы избегать спектральных дыр и иметь корректный уровень шума.

Даже хотя решения в [1] и [5] избегают ухудшения тональных компонент в том, что они предлагают не заполнять малые спектральные дыры, все еще имеется необходимость, чтобы дополнительно улучшать качество аудиосигнала, кодированного с использованием заполнения шумом, особенно при очень низких битрейтах (скоростях передачи битов).

Целью настоящего изобретения является предоставление концепции для заполнения шумом с улучшенными характеристиками.

Эта цель достигается посредством предмета независимых пунктов формулы изобретения, содержащихся здесь, при этом предпочтительные аспекты настоящей заявки являются предметом зависимых пунктов формулы изобретения.

Базовой идеей настоящей заявки является то, что заполнение шумом спектра аудиосигнала может улучшаться по качеству по отношению к заполненному шумом спектру, так что воспроизведение заполненного шумом аудиосигнала является менее раздражающим, посредством выполнения заполнения шумом способом, зависящим от тональности аудиосигнала.

В соответствии с одним вариантом осуществления настоящей заявки, непрерывная спектральная нулевая часть спектра аудиосигнала заполняется шумом, спектрально сформированным с использованием функции, принимающей максимум во внутренней части непрерывной спектральной нулевой части, и имеющей спадающие кнаружи края, абсолютный угол наклона которых отрицательно зависит от тональности, то есть угол наклона уменьшается с увеличением тональности. Дополнительно или альтернативно, функция, используемая для заполнения, принимает максимум во внутренней части непрерывной спектральной нулевой части и имеет спадающие кнаружи края, спектральная ширина которых положительно зависит от тональности, то есть спектральная ширина увеличивается с увеличением тональности. Даже дополнительно, дополнительно или альтернативно, для заполнения может использоваться постоянная или унимодальная функция, интеграл которой - нормализованный к интегралу, равному 1 - по внешним четвертям непрерывной спектральной нулевой части отрицательно зависит от тональности, то есть интеграл уменьшается с увеличением тональности. Посредством всех из этих мер, заполнение шумом имеет тенденцию быть менее вредным для тональных частей аудиосигнала, однако, при этом является тем не менее эффективным для нетональных частей аудиосигнала в терминах уменьшения спектральных дыр. Другими словами, всякий раз, когда аудиосигнал имеет тональное содержимое, шум, заполняемый в спектр аудиосигнала, оставляет тональные пики спектра не затронутыми посредством поддержания достаточного расстояния от них, при этом, однако, нетональный характер временных фаз аудиосигнала с аудио-содержимым как нетональный тем не менее удовлетворяется заполнением шумом.

В соответствии с одним вариантом осуществления настоящей заявки, непрерывные спектральные нулевые части спектра аудиосигнала идентифицируются и идентифицированные нулевые части заполняются шумом, спектрально сформированным с помощью функций, так что для каждой непрерывной спектральной нулевой части соответствующая функция устанавливается в зависимости от ширины соответствующей непрерывной спектральной нулевой части и тональности аудиосигнала. Для легкости реализации, зависимость может достигаться посредством поиска в таблице поиска функций, или функции могут вычисляться аналитически с использованием математической формулы в зависимости от ширины непрерывной спектральной нулевой части и тональности аудиосигнала. В любом случае, усилие для реализации зависимости является относительно малым по сравнению с преимуществами, проистекающими от зависимости. В частности, зависимость может быть такой, что соответствующая функция устанавливается в зависимости от ширины непрерывной спектральной нулевой части, так что функция ограничивается соответствующей непрерывной спектральной нулевой частью, и в зависимости от тональности аудиосигнала, так что, для более высокой тональности аудиосигнала, масса функции становится более компактной во внутренней части соответствующей непрерывной спектральной нулевой части и отдаленной от краев соответствующей непрерывной спектральной нулевой части.

В соответствии с одним дополнительным вариантом осуществления, шум, спектрально формируемый и заполняемый в непрерывные спектральные нулевые части, обычно масштабируется с использованием спектрально глобального уровня заполнения шумом. В частности, шум масштабируется так, что интеграл по шуму в непрерывных спектральных нулевых частях или интеграл по функциям непрерывных спектральных нулевых частей соответствует, например, равен, глобальному уровню заполнения шумом. Предпочтительно, глобальный уровень заполнения шумом кодируется внутри существующих аудиокодеков в любом случае так, что никакой дополнительный синтаксис не должен обеспечиваться для таких аудиокодеков. То есть глобальный уровень заполнения шумом может явно сигнализироваться в потоке данных, в который аудиосигнал кодируется, с малым усилием. В действительности, функции, с помощью которых шум непрерывной спектральной нулевой части спектрально формируется, могут масштабироваться так, что интеграл по шуму, с помощью которого все непрерывные спектральные нулевые части заполняются, соответствует глобальному уровню заполнения шумом.

В соответствии с одним вариантом осуществления настоящей заявки, тональность получается из параметра кодирования, с использованием которого аудиосигнал кодируется. Посредством этой меры, никакая дополнительная информация не должна передаваться внутри существующего аудиокодека. В соответствии с конкретными вариантами осуществления, параметр кодирования является флагом или усилением LTP (долгосрочного предсказания), флагом поддержки или усилением TNS (временного формирования шума) и/или флагом поддержки перегруппировки спектра.

В соответствии с одним дополнительным вариантом осуществления, выполнение заполнения шумом ограничивается на высокочастотную спектральную часть, при этом низкочастотное начальное положение высокочастотной спектральной части устанавливается, соответствуя явной сигнализации в потоке данных, и в который аудиосигнал кодируется. Посредством этой меры, является возможной адаптивная к сигналу установка нижней границы высокочастотной спектральной части, в которой выполняется заполнение шумом. Посредством этой меры, в свою очередь, качество аудио, полученное в результате заполнения шумом, может увеличиваться. Необходимая дополнительная сторонняя информация, в свою очередь, внесенная посредством явной сигнализации, является сравнительно малой.

В соответствии с одним дополнительным вариантом осуществления настоящей заявки, устройство сконфигурировано с возможностью выполнять заполнение шумом с использованием спектрального низкочастотного фильтра, чтобы противодействовать спектральному наклону, вызываемому предыскажением, используемым, чтобы кодировать спектр аудиосигнала. Посредством этой меры, качество заполнения шумом увеличивается даже дополнительно, так как глубина оставшихся спектральных дыр дополнительно уменьшается. Говоря более широко, заполнение шумом в аудиокодеках с перцепционным преобразованием может улучшаться посредством, в дополнение к зависящему от тональности спектральному формированию шума внутри спектральных дыр, выполнения заполнения шумом со спектрально глобальным наклоном, нежели спектрально плоским способом. Например, спектрально глобальный наклон может иметь отрицательный угол наклона, то есть демонстрировать уменьшение от низких к высоким частотам, чтобы, по меньшей мере, частично обращать спектральный наклон, вызываемый подверганием заполненного шумом спектра спектральной перцепционной весовой функции. Положительный угол наклона также может быть возможным, например, в случаях, когда кодированный спектр демонстрирует подобный высокочастотному характер. В частности, спектральные перцепционные весовые функции обычно имеют тенденцию демонстрировать увеличение от низких к высоким частотам. Соответственно, шум, заполняемый в спектр аудиокодеров с перцепционным преобразованием спектрально плоским способом, в конечном итоге дает минимальный уровень наклоненного шума в конечно восстановленном спектре. Изобретатели настоящей заявки, однако, осознали, что этот наклон в конечно восстановленном спектре отрицательно влияет на качество аудио, так как он ведет к спектральным дырам, остающимся в заполненных шумом частях спектра. Соответственно, вставка шума со спектрально глобальным наклоном, так что уровень шума уменьшается от низких к высоким частотам, по меньшей мере, частично компенсирует такой спектральный наклон, вызываемый последующим формированием заполненного шумом спектра с использованием спектральной перцепционной весовой функции, тем самым, улучшая качество аудио. В зависимости от обстоятельств, положительный угол наклона может быть предпочтительным, например, на некоторых подобных высокочастотным спектрах.

В соответствии с одним вариантом осуществления, угол наклона спектрально глобального наклона изменяется в ответ на сигнализацию в потоке данных, в который спектр кодируется. Сигнализация может, например, явно сигнализировать крутизну и может адаптироваться, на стороне кодирования, к величине спектрального наклона, вызываемого спектральной перцепционной весовой функцией. Например, величина спектрального наклона, вызываемого спектральной перцепционной весовой функцией, может проистекать от предыскажения, которому аудиосигнал подвергается до применения анализа LPC на нем.

Заполнение шумом может использоваться на стороне кодирования аудио и/или декодирования аудио. Когда используется на стороне кодирования аудио, заполненный шумом спектр может использоваться для целей анализа посредством синтеза.

В соответствии с одним вариантом осуществления, кодер определяет глобальный уровень масштабирования шума посредством учета зависимости от тональности.

Предпочтительные варианты осуществления настоящей заявки описываются ниже по отношению к фигурам, среди которых:

Фиг. 1 показывает, выровненным по времени способом, одно над другим, сверху книзу, временной фрагмент из аудиосигнала, его спектрограмму с использованием схематически показанного спектрально-временного изменения "шкалы серого" спектральной энергии, и тональность аудиосигнала, для иллюстративных целей;

Фиг. 2 показывает блок-схему устройства заполнения шумом в соответствии с одним вариантом осуществления;

Фиг. 3 показывает схему спектра, подлежащего заполнению шумом, и функцию, используемую, чтобы спектрально формировать шум, используемый, чтобы заполнять непрерывную спектральную нулевую часть этого спектра, в соответствии с одним вариантом осуществления;

Фиг. 4 показывает схему спектра, подлежащего заполнению шумом, и функцию, используемую, чтобы спектрально формировать шум, используемый, чтобы заполнять непрерывную спектральную нулевую часть этого спектра, в соответствии с одним дополнительным вариантом осуществления;

Фиг. 5 показывает схему спектра, подлежащего заполнению шумом, и функцию, используемую, чтобы спектрально формировать шум, используемый, чтобы заполнять непрерывную спектральную нулевую часть этого спектра, в соответствии с одним еще дополнительным вариантом осуществления;

Фиг. 6 показывает блок-схему модуля заполнения шумом из фиг. 2 в соответствии с одним вариантом осуществления;

Фиг. 7 схематически показывает возможное отношение между определенной тональностью аудиосигнала с одной стороны и возможными функциями, доступными для спектрального формирования непрерывной спектральной нулевой части, с другой стороны в соответствии с одним вариантом осуществления;

Фиг. 8 схематически показывает спектр, подлежащий заполнению шумом, при этом дополнительно показывает функции, используемые, чтобы спектрально формировать шум для заполнения непрерывных спектральных нулевых частей спектра, чтобы проиллюстрировать то, как масштабировать уровень шума в соответствии с одним вариантом осуществления;

Фиг. 9 показывает блок-схему кодера, который может использоваться внутри аудиокодека, применяющего концепцию заполнения шумом, описанную по отношению к фиг. 1 по 8;

Фиг. 10 схематически показывает квантованный спектр, подлежащий заполнению шумом, как кодируется посредством кодера из фиг. 9 вместе с переданной сторонней информацией, именно коэффициентами масштабирования и глобальным уровнем шума, в соответствии с одним вариантом осуществления;

Фиг. 11 показывает блок-схему декодера, соответствующего кодеру из фиг. 9 и включающего в себя устройство заполнения шумом в соответствии с фиг. 2;

Фиг. 12 показывает схему спектрограммы с ассоциированными данными сторонней информации в соответствии с одним вариантом реализации кодера и декодера из фиг. 9 и 11;

Фиг. 13 показывает аудиокодер с преобразованием линейного предсказания, который может включаться в аудиокодек, использующий концепцию заполнения шумом из фиг. 1 по 8, в соответствии с одним вариантом осуществления;

Фиг. 14 показывает блок-схему декодера, соответствующего кодеру из фиг. 13;

Фиг. 15 показывает примеры фрагментов из спектра, подлежащего заполнению шумом;

Фиг. 16 показывает явный пример для функции для формирования шума, заполняемого в некоторую непрерывную спектральную нулевую часть спектра, подлежащего заполнению шумом, в соответствии с одним вариантом осуществления;

Фиг. 17a-d показывают различные примеры для функций для спектрального формирования шума, заполняемого в непрерывные спектральные нулевые части, для разных ширин нулевых частей и разных ширин переходов, используемых для разных тональностей; и

Фиг. 18a показывает блок-схему аудиокодера с перцепционным преобразованием в соответствии с одним вариантом осуществления;

Фиг. 18b показывает блок-схему аудиодекодера с перцепционным преобразованием в соответствии с одним вариантом осуществления;

Фиг. 18c показывает схематическую диаграмму, иллюстрирующую возможный способ достижения спектрально глобального наклона, вводимого в шум заполнения, в соответствии с одним вариантом осуществления.

Везде в последующем описании фигур, одинаковые ссылочные позиции используются для элементов, показанных на этих фигурах, описание, приведенное по отношению к одному элементу на одной фигуре, должно интерпретироваться как переносимое на элемент на другой фигуре, который указывается с использованием такой же ссылочной позиции. Посредством этой меры, обширное и повторяющееся описание избегается насколько возможно, тем самым, описание различных вариантов осуществления концентрируется на различиях друг между другом, нежели описываются все варианты осуществления снова сначала, снова и снова.

Сначала, последующее описание начинается с вариантов осуществления для устройства для выполнения заполнения шумом по спектру аудиосигнала. Далее, представляются разные варианты осуществления для различных аудиокодеков, где такое заполнение шумом может встраиваться, вместе с особенностями, которые могут применяться в соединении с соответствующим представленным аудиокодеком. Следует отметить, что заполнение шумом, описанное далее, может, в любом случае, выполняться на стороне декодирования. В зависимости от кодера, однако, заполнение шумом, как описано далее, также может выполняться на стороне кодирования, как, например, по причинам анализа посредством синтеза. Промежуточный случай, согласно которому модифицированный способ заполнения шумом в соответствии с вариантами осуществления, очерченными ниже, только частично изменяет способ работы кодера, как, например, чтобы определять спектрально глобальный уровень заполнения шумом, также описывается ниже.

Фиг. 1 показывает, для иллюстративных целей, аудиосигнал 10, то есть временное поведение его аудиовыборок, например, выровненную по времени спектрограмму 12 аудиосигнала, которая была получена из аудиосигнала 10, по меньшей мере, среди прочего, посредством подходящего преобразования, такого как преобразование с перекрытиями, проиллюстрированного на 14 иллюстративно для двух последовательных окон 16 преобразования и ассоциированных спектров 18, которое, таким образом, представляет срез из спектрограммы 12 в момент времени, соответствующий середине ассоциированного окна 16 преобразования, например. Примеры для спектрограммы 12 и того, как она получается, дополнительно представлены ниже. В любом случае, спектрограмма 12 подвергается некоторому типу квантования и, таким образом, имеет нулевые части, где спектральные значения, в которых спектрограмма 12 спектрально-временным образом дискретизирована, являются непрерывно нулевыми. Преобразование 14 с перекрытиями может, например, быть критически дискретизированным преобразованием, таким как MDCT. Окна 16 преобразования могут иметь перекрытие, равное 50%, друг с другом, но другие варианты осуществления также являются возможными. Дополнительно, спектрально-временное разрешение, при котором спектрограмма 12 дискретизируется в спектральные значения, может изменяться во времени. Другими словами, временное расстояние между последовательными спектрами 18 спектрограммы 12 может изменяться во времени, и то же применяется к спектральному разрешению каждого спектра 18. В частности, изменение во времени, в отношении временного расстояния между последовательными спектрами 18, может быть обратным к изменению спектрального разрешения спектров. Квантование использует, например, спектрально изменяющийся, адаптивный к сигналу размер шага квантования, изменяющийся, например, в соответствии с огибающей спектра LPC аудиосигнала, описываемой посредством коэффициентов LP, сигнализируемых в потоке данных, в который квантованные спектральные значения спектрограммы 12 со спектрами 18, подлежащими заполнению шумом, кодируются, или в соответствии с коэффициентами масштабирования, определяемыми, в свою очередь, в соответствии с психоакустической моделью, и сигнализируемыми в потоке данных.

Помимо этого, выровненным по времени способом фиг. 1 показывает характеристику аудиосигнала 10 и его временное изменение, именно тональность аудиосигнала. Вообще говоря, "тональность" указывает меру, описывающую то, как сконцентрирована энергия аудиосигнала в некоторой точке времени в соответствующем спектре 18, ассоциированном с этой точкой во времени. Если энергия рассеяна сильно, как, например, в зашумленных временных фазах аудиосигнала 10, то тональность является низкой. Но если энергия, по существу, сконцентрирована в одном или более спектральных пиках, то тональность является высокой.

Фиг. 2 показывает устройство, сконфигурированное с возможностью выполнять заполнение шумом по спектру аудиосигнала, в соответствии с одним вариантом осуществления настоящей заявки. Как будет описываться более подробно ниже, устройство сконфигурировано с возможностью выполнять заполнение шумом в зависимости от тональности аудиосигнала.

Устройство из фиг. 2, в общем, показано с использованием ссылочной позиции 30 и содержит модуль 32 заполнения шумом и модуль 34 определения тональности, который является необязательным.

Фактическое заполнение шумом выполняется посредством модуля 32 заполнения шумом. Модуль 32 заполнения шумом принимает спектр, к которому заполнение шумом должно применяться. Этот спектр проиллюстрирован на фиг. 2 как разреженный спектр 34. Разреженный спектр 34 может быть спектром 18 из спектрограммы 12. Спектры 18 входят в модуль 32 заполнения шумом последовательно. Модуль 32 заполнения шумом подвергает спектр 34 заполнению шумом и выводит "заполненный спектр" 36. Модуль 32 заполнения шумом выполняет заполнение шумом в зависимости от тональности аудиосигнала, как, например, тональности 20 из фиг. 1. В зависимости от обстоятельств, тональность может не быть напрямую доступной. Например, существующие аудиокодеки не обеспечивают явную сигнализацию тональности аудиосигнала в потоке данных, так что если устройство 30 установлено на стороне декодирования, не будет возможным восстанавливать тональность без высокой степени ложной оценки. Например, спектр 34 может, вследствие его разреженности и/или из-за его адаптивного к сигналу изменяющегося квантования, не быть оптимальной основой для оценки тональности.

Соответственно, задачей модуля 34 определения тональности является обеспечивать модуль 32 заполнения шумом оценкой тональности на основе другого указания 38 тональности, как будет описываться более подробно ниже. В соответствии с вариантами осуществления, описанными ниже, указание 38 тональности может быть доступным на сторонах кодирования и декодирования в любом случае, посредством соответствующего параметра кодирования, передаваемого внутри потока данных аудиокодека, внутри которого устройство 30, например, используется.

Фиг. 3 показывает пример для разреженного спектра 34, то есть квантованного спектра, имеющего непрерывные части 40 и 42, состоящие из последовательностей спектрально соседних спектральных значений спектра 34, которые квантованы в нуль. Непрерывные части 40 и 42 являются, таким образом, спектрально раздельными или отдаленными друг от друга посредством, по меньшей мере, одной не квантованной в нуль спектральной линии в спектре 34.

Зависимость от тональности для заполнения шумом, в общем, описанного выше по отношению к фиг. 2, может осуществляться следующим образом. Фиг. 3 показывает временную часть 44, включающую в себя непрерывную спектральную нулевую часть 40, увеличенную на 46. Модуль 32 заполнения шумом сконфигурирован с возможностью заполнять эту непрерывную спектральную нулевую часть 40 способом, зависящим от тональности аудиосигнала, во время, которому спектр 34 принадлежит. В частности, модуль 32 заполнения шумом заполняет непрерывную спектральную нулевую часть шумом, спектрально сформированным с использованием функции, принимающей максимум во внутренней части непрерывной спектральной нулевой части, и имеющей спадающие кнаружи края, абсолютный угол наклона которых отрицательно зависит от тональности. Фиг. 3 иллюстративно показывает две функции 48 для двух разных тональностей. Обе функции являются "унимодальными", то есть принимают абсолютный максимум во внутренней части непрерывной спектральной нулевой части 40 и имеют всего только локальный максимум, который может быть плато или одиночной спектральной частотой. Здесь, локальный максимум принимается функциями 48 и 50 непрерывно в простирающемся интервале 52, то есть плато, расположенное в центре нулевой части 40. Областью определения функций 48 и 50 является нулевая часть 40. Центральный интервал 52 покрывает только центральную часть нулевой части 40 и граничит сбоку с краевой частью 54 на стороне более высокой частоты интервала 52, и с краевой частью 56 более низкой частоты на стороне более низкой частоты интервала 52. Внутри краевой части 54, функции 48 и 52 имеют спадающий край 58, и внутри краевой части 56, поднимающийся край 60. Абсолютный угол наклона может приписываться каждому краю 58 и 60, соответственно, как, например, средний угол наклона внутри краевой части 54 и 56, соответственно. То есть угол наклона, приписанный спадающему краю 58, может быть средним углом наклона соответствующей функции 48 и 52, соответственно, внутри краевой части 54, и угол наклона, приписанный поднимающемуся краю 60, может быть средним углом наклона функции 48 и 52, соответственно, внутри краевой части 56.

Как можно видеть, абсолютное значение угла наклона краев 58 и 60 является более высоким для функции 50, чем для функции 48. Модуль 32 заполнения шумом выбирает заполнять нулевую часть 40 с помощью функции 50 для тональностей, более низких, чем тональности, для которых модуль 32 заполнения шумом выбирает использовать функцию 48 для заполнения нулевой части 40. Посредством этой меры, модуль 32 заполнения шумом избегает кластеризации непосредственной периферии потенциально тональных спектральных пиков спектра 34, как, например, пика 62. Чем меньше абсолютный угол наклона краев 58 и 60, тем дальше шум, заполняемый в нулевую часть 40, находится от ненулевых частей спектра 34, окружающих нулевую часть 40.

Модуль 32 заполнения шумом может, например, осуществлять выбор, чтобы выбирать функцию 48 в случае тональности аудиосигнала, равной , и функцию 50 в случае тональности аудиосигнала, равной , но описание, приведенное дополнительно ниже, показывает, что модуль 32 заполнения шумом может различать больше, чем два разных состояния тональности аудиосигнала, то есть может поддерживать более, чем две разных функции 48, 50 для заполнения некоторой непрерывной спектральной нулевой части и выбирать между ними в зависимости от тональности посредством сюръективного отображения из тональностей в функции.

В качестве незначительного замечания, следует отметить, что конструкция функций 48 и 50, согласно которой они имеют плато во внутреннем интервале 52, к которому примыкают края 58 и 60, чтобы давать результатом унимодальные функции, является только примером. Альтернативно, могут использоваться функции в форме колокола, например, в соответствии с альтернативой. Интервал 52 может альтернативно определяться как интервал, внутри которого функция является более высокой, чем 95% от ее максимального значения.

Фиг. 4 показывает альтернативу для изменения функции, используемой, чтобы спектрально формировать шум, с помощью которого некоторая непрерывная спектральная нулевая часть 40 заполняется посредством модуля 32 заполнения шумом, от тональности. В соответствии с фиг. 4, изменение имеет отношение к спектральной ширине краевых частей 54 и 56 и спадающим кнаружи краям 58 и 60, соответственно. Как показано на фиг. 4, в соответствии с примером из фиг. 4, угол наклона краев 58 и 60 может даже быть независимым от, то есть не изменяться в соответствии с, тональности. В частности, в соответствии с примером из фиг. 4, модуль 32 заполнения шумом устанавливает функцию, с использованием которой спектрально формируется шум для заполнения нулевой части 40, так что спектральная ширина спадающих кнаружи краев 58 и 60 положительно зависит от тональности, то есть для более высоких тональностей, используется функция 48, для которой спектральная ширина спадающих кнаружи краев 58 и 60 является более большой, и для более низких тональностей, используется функция 50, для которой спектральная ширина спадающих кнаружи краев 58 и 60 является более малой.

Фиг. 4 показывает другой пример изменения функции, используемой посредством модуля 32 заполнения шумом для спектрального формирования шума, с помощью которого непрерывная спектральная нулевая часть 40 заполняется: здесь, характеристика функции, которая изменяется с тональностью, является интегралом по внешним четвертям нулевой части 40. Чем более высокой является тональность, тем более большим является интервал. Перед определением интервала, полный интервал функции по полной нулевой части 40 выравнивается/нормализуется, как, например, к 1.

Для описания этого, см. фиг. 5. непрерывная спектральная нулевая часть 40 показана как разделенная на четыре четверти a, b, c, d равного размера, среди которых четверти a и d являются внешними четвертями. Как можно видеть, обе функции 50 и 48 имеют их центр масс во внутренней части, здесь иллюстративно в середине нулевой части 40, но обе из них простираются из внутренних четвертей b, c во внешние четверти a и d. Перекрывающая часть функций 48 и 50, перекрывающая внешние четверти a и d, соответственно, показана просто затененной.

На фиг. 5, обе функции имеют один и тот же интеграл по всей нулевой части 40, то есть по всем четырем четвертям a, b, c, d. Интеграл, например, нормализован к 1.

В этой ситуации, интеграл функции 50 по четвертям a, d является более большим, чем интеграл функции 48 по четвертям a, d и соответственно, модуль 32 заполнения шумом использует функцию 50 для более высоких тональностей и функцию 48 для более низких тональностей, то есть интеграл по внешним четвертям нормализованных функций 50 и 48 отрицательно зависит от тональности.

Для иллюстративных целей, в случае фиг. 5 обе функции 48 и 50 были иллюстративно показаны как постоянные или двоичные функции. Функция 50, например, является функцией, принимающей постоянное значение во всей области определения, то есть всей нулевой части 40, и функция 48 является двоичной функцией, равной нулю на внешних краях нулевой части 40, и принимающей ненулевое постоянное значение между ними. Должно быть ясно, что, вообще говоря, функции 50 и 48 в соответствии с примером из фиг. 5 могут быть любой постоянной или унимодальной функцией, как, например, функциями, соответствующими функциям, показанным на фиг. 3 и 4. Чтобы быть еще более точными, по меньшей мере, одна может быть унимодальной и, по меньшей мере, одна (кусочно-) постоянной и потенциально дополнительная одна какой-либо одной из унимодальной или постоянной.

Хотя тип изменения функций 48 и 50 в зависимости от тональности изменяется, все примеры из фиг. 3 по 5 имеют, в общем, то, что, для увеличения тональности, степень размытия непосредственного окружения тональных пиков в спектре 34 уменьшается или избегается, так что качество заполнения шумом увеличивается, так как заполнение шумом не влияет отрицательно на тональные фазы аудиосигнала и, тем не менее, это дает результатом приятное приближение нетональных фаз аудиосигнала.

До сих пор, описание из фиг. 3 по 5 фокусировалось на заполнении одной непрерывной спектральной нулевой части. В соответствии с вариантом осуществления из фиг. 6, устройство из фиг. 2 сконфигурировано с возможностью идентифицировать непрерывные спектральные нулевые части спектра аудиосигнала и применять заполнение шумом на непрерывных спектральных нулевых частях, таким образом, идентифицированных. В частности, фиг. 6 показывает модуль 32 заполнения шумом из фиг. 2 более подробно, как содержащий модуль 70 идентификации нулевых частей и модуль 72 заполнения нулевых частей. Модуль идентификации нулевых частей осуществляет поиск в спектре 34 непрерывных спектральных нулевых частей, таких как 40 и 42 на фиг. 3. Как уже описано выше, непрерывные спектральные нулевые части могут определяться как последовательности спектральных значений, которые были квантованы в нуль. Модуль 70 идентификации нулевых частей может быть сконфигурирован с возможностью ограничивать идентификацию на высокочастотную спектральную часть спектра аудиосигнала, начинающуюся с, то есть лежащую выше, некоторой начальной частоты. Соответственно, устройство может быть сконфигурировано с возможностью ограничивать выполнение заполнения шумом на такую высокочастотную спектральную часть. Начальная частота, выше которой модуль 70 идентификации нулевых частей выполняет идентификацию непрерывных спектральных нулевых частей, и выше которой устройство сконфигурировано с возможностью ограничивать выполнение заполнения шумом, может быть фиксированной или может изменяться. Например, явная сигнализация в потоке данных аудиосигнала, в который аудиосигнал кодируется посредством его спектра, может использоваться, чтобы сигнализировать начальную частоту, подлежащую использованию.

Модуль 72 заполнения нулевых частей сконфигурирован с возможностью заполнять идентифицированные непрерывные спектральные нулевые части, идентифицированные посредством модуля 70 идентификации, шумом, спектрально сформированным в соответствии с некоторой функцией, как описано выше по отношению к фиг. 3, 4 или 5. Соответственно, модуль 72 заполнения нулевых частей заполняет непрерывные спектральные нулевые части, идентифицированные посредством модуля 70 идентификации, с помощью набора функций в зависимости от ширины соответствующей непрерывной спектральной нулевой части, как, например, количества спектральных значений, которые были квантованы в нуль из последовательности квантованных в нуль спектральных значений соответствующей непрерывной спектральной нулевой части, и тональности аудиосигнала.

В частности, индивидуальное заполнение каждой непрерывной спектральной нулевой части, идентифицированной посредством модуля 70 идентификации, может выполняться посредством модуля 72 заполнения следующим образом: функция устанавливается в зависимости от ширины непрерывной спектральной нулевой части, так что функция ограничивается соответствующей непрерывной спектральной нулевой частью, то есть область определения функции совпадает с шириной непрерывной спектральной нулевой части. Установка функции дополнительно зависит от тональности аудиосигнала, именно способом, описанным выше по отношению к фиг. 3 по 5, так что если тональность аудиосигнала увеличивается, масса функции становится более компактной во внутренней части соответствующей непрерывной нулевой части и отдаленной от краев соответствующей непрерывной спектральной нулевой части. С использованием этой функции, предварительно заполненное состояние непрерывной спектральной нулевой части, согласно которому каждое спектральное значение устанавливается на случайное, псевдослучайное или обеспечиваемое заплатой/скопированное значение, спектрально формируется, именно посредством умножения функции на предварительные спектральные значения.

Было уже очерчено выше, что зависимость заполнения шумом от тональности может различать между более, чем только двумя разными тональностями, как, например, 3, 4 или даже более чем 4. Фиг. 7, например, показывает область возможных тональностей, то есть интервал возможных значений между тональностями, как определяется посредством модуля 34 определения на ссылочной позиции 74. На 76, фиг. 7 иллюстративно показывает набор возможных функций, используемых для спектрального формирования шума, с помощью которого непрерывные спектральные нулевые части могут заполняться. Набор 76, как проиллюстрировано на фиг. 7, является набором экземпляров дискретных функций, взаимно отличающихся друг от друга посредством спектральной ширины или длины области определения и/или формы, то есть компактностью и расстоянием от внешних краев. На 78, фиг. 7 дополни