Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы

Патент 2589309

Авторы

Правообладатели

Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. (DE)

Классы МПК

G10L19/10 - определение или кодирование многоимпульсного возбуждения

Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы

Иллюстрации

Показать все

Изобретение относится к звуковому кодированию и декодированию и связано с кодированием/декодированием звукового сигнала, имеющего гармоническое или речевое содержание, который может быть подвергнут обработке с деформацией по времени. Технический результат - повышение точности кодирования. Кодер включает контроллер функции окна, устройство организации окна, устройство для деформации по времени с заключительной функциональной возможностью проверки качества, преобразователь времени/частоты, стадию TNS или квантизатор кодирующего устройства, при этом контроллер функции окна, устройство для деформации по времени, стадия TNS или дополнительный анализатор шумового наполнения регулируются результатами анализа сигнала, полученными анализатором деформации по времени или классификатором сигнала. Декодер применяет операцию шумового наполнения, используя оценку отрегулированного шумового наполнения в зависимости от гармонической или речевой характеристики звукового сигнала. 3 н. и 4 з.п. ф-лы, 37 ил.

Реферат

Заявляемая группа изобретений относится к звуковому кодированию и декодированию и связана, в частности, с кодированием/декодированием звукового сигнала, имеющего гармоническое или речевое содержание, который может быть подвергнут обработке с деформацией по времени.

В дальнейшем будет дано краткое введение в область звукового кодирования с деформацией по времени (временной деформацией), содержание которого может применяться в сочетании с некоторыми из вариантов изобретения.

В последние годы были разработаны способы преобразования звукового сигнала в представление частотной области и эффективного кодирования этого представления частотной области, например, с учетом перцепционных порогов маскирования. Эта концепция кодирования звукового сигнала особенно эффективна, если длина блока, для которого передается набор кодированных спектральных коэффициентов, значительна, и если только сравнительно небольшое количество спектральных коэффициентов находится намного выше глобального порога маскирования, в то время как большое количество спектральных коэффициентов находится около или ниже глобального порога маскирования, и которыми, таким образом, можно пренебречь (или кодировать с минимальной длиной кода).

Например, косинусоидальные или синусоидальные модулированные перекрывающиеся преобразования часто применяются для кодирования источника, благодаря их свойствам уплотнения энергии. То есть, для гармонических тонов с постоянными основными частотами (основной тон) они концентрируют энергию сигнала на малом числе спектральных компонентов (поддиапазоны), что приводит к эффективному представлению сигнала.

Обычно, основной тон сигнала должен пониматься как самая низкая преобладающая, частота, различимая в спектре сигнала. В общем случае речевой модели, основной тон - частота сигнала возбуждения, модулированного человеческим горлом. Если бы присутствовала только одна единственная основная частота, спектр был бы чрезвычайно прост и включал бы только основную частоту и обертоны. Такой спектр может кодироваться высокоэффективно. Для сигналов с переменным основным тоном, однако, энергия, соответствующая каждому гармоническому компоненту, распространяется по нескольким коэффициентам преобразования, таким образом, приводя к снижению эффективности кодирования.

Чтобы преодолеть это снижение эффективности кодирования, звуковой сигнал, подлежащий кодированию, подвергается эффективной повторной выборке на неравномерной временной сетке. При последующей обработке положения образцов, полученные посредством неравномерной повторной выборки, обрабатываются, как будто они представляют значения на равномерной временной сетке. Эта операция обычно обозначается термином «деформация по времени (временная деформация)». Время выборки может быть благоприятно выбрано в зависимости от временного изменения основного тона, таким образом, что изменение основного тона в версии звукового сигнала с деформацией по времени меньше, чем изменение основного тона в оригинальной версии звукового сигнала (до деформации по времени). Это изменение основного тона может также быть обозначено термином «контур деформации по времени». После деформации по времени звукового сигнала, версия звукового сигнала с деформацией по времени преобразуется в частотную область. Деформация по времени, зависящая от основного тона, обладает эффектом, заключающимся в том, что представление частотной области звукового сигнала с деформацией по времени обычно проявляет уплотнение энергии в намного меньшем числе спектральных компонентов, чем представление частотной области оригинального (без деформации по времени) звукового сигнала.

На стороне декодера представление частотной области звукового сигнала с деформацией по времени преобразуется обратно во временную область, таким образом, что представление временной области звукового сигнала с деформацией по времени доступно на стороне декодера. Однако в представлении временной области звукового сигнала с деформацией по времени, восстановленного на стороне декодера, оригинальные изменения основного тона входного звукового сигнала на стороне кодирующего устройства не включены. Соответственно, применяется другая деформация по времени, осуществляемая посредством повторной выборки восстановленного на стороне декодера представления временной области звукового сигнала с деформацией по времени. Чтобы получить хорошее восстановление в декодере входного звукового сигнала на стороне кодирующего устройства, желательно, чтобы деформация по времени на стороне декодера была, по крайней мере, приблизительно обратной операцией относительно деформации по времени на стороне кодирующего устройства. Чтобы получить подходящую деформацию времени, желательно иметь информацию, доступную в декодере, которая учитывает регулирование деформации по времени на стороне декодера.

Поскольку это обычно требуется для передачи такой информации от кодера звукового сигнала декодеру звукового сигнала, желательно поддерживать скорость передачи информации незначительной, в то же время, обеспечивая надежное восстановление необходимой информации о деформации по времени на стороне декодера.

Ввиду вышеизложенного обсуждения, желательно создать концепцию, которая позволит для скорости передачи информации эффективно применять концепцию деформации по времени в аудио кодере.

Задачей изобретения является создание концепций для улучшения впечатления прослушивания, обеспеченного кодированным звуковым сигналом на основе информации, доступной в аудио кодере с деформацией по времени или в декодере звукового сигнала с деформацией по времени.

Поставленная задача решается за счет преобразователя сигнала активации деформации по времени для обеспечения деформации по времени сигнала активации на основе представления звукового сигнала по п.1, кодера звукового сигнала для кодирования входного звукового сигнала по п.12, способа преобразования сигнала активации деформации по времени по п.14, способа преобразования кодированного представления входного звукового сигнала согласно п.15, или компьютерной программы по п.16 заявляемой формулы изобретения.

Также задачей изобретения является обеспечение улучшенной схемы звукового кодирования/декодирования, которая обеспечивает более высокое качество или более низкую скорость передачи информации (битрейт).

Данная задача решается посредством звукового кодера по пп.17, 26, 32, 37, звукового декодера по п.20, способа звукового кодирования по п.23, п.30, п.35 или п.37, способа декодирования по п.24, или компьютерной программы по п.25,31, 36, или 43.

Варианты реализации согласно изобретению связаны со способами деформации по времени кодера с MDCT-преобразованием. Некоторые осуществления связаны только со средствами кодера. Другие осуществления также связаны со средствами декодера.

Реализацию изобретения обеспечивает преобразователь сигнала активации деформации по времени для обеспечения сигнала активации деформации по времени на основе представления звукового сигнала. Преобразователь сигнала активации деформации по времени включает средства доступа к информации об уплотнении энергии, формируемые для предоставления информации об уплотнении энергии, описывающей уплотнение энергии в представлении преобразованного спектра звукового сигнала с деформацией по времени. Преобразователь сигнала активации деформации по времени также включает компаратор, сконфигурированный таким образом, чтобы сравнить информацию об уплотнении энергии с контрольным значением, и обеспечить сигнал активации деформации по времени в зависимости от результата сравнения.

Эта реализация основана на обнаружении того, что использование функциональных возможностей деформации по времени в кодере звукового сигнала обычно способствует усовершенствованию, в смысле сокращения скорости передачи информации (битрейта) кодированного звукового сигнала, если представление преобразованного спектра звукового сигнала с деформацией по времени включает распределение достаточно уплотненной энергии, в котором энергия концентрируется в одной или нескольких спектральных областях (или спектральных линиях). Это обеспечивается благодаря тому, что успешная деформация по времени способствует эффекту уменьшения скорости передачи информации (битрейта) посредством преобразования размазанного спектра, например, звукового фрейма, в спектр, имеющий один или более заметных пиков, и, следовательно, имеющий более высокое уплотнение энергии, чем спектр оригинального (с невременной деформацией) звукового сигнала.

Относительно этой проблемы следует понимать, что фрейм звукового сигнала, на протяжении которого основной тон звукового сигнала значительно изменяется, включает размазанный спектр. Изменяемый во времени основной тон звукового сигнала имеет эффект преобразования временной области в частотную область, выполняемое на протяжении фрейма звуковой сигнала, приводит к размазанному распределению энергии сигнала по частоте, особенно в более высокой частотной области. Соответственно, представление спектра такого оригинального (с невременной деформацией) звукового сигнала включает низкое уплотнение энергии и обычно не показывает спектральные пики в более высокой частотной части спектра, или только показывает относительно небольшие спектральные пики в более высокой частотной части спектра. Напротив, если деформация по времени успешна (исходя из обеспечения улучшения эффективности кодирования), деформация по времени оригинального звукового сигнала дает в результате звуковой сигнал с деформацией по времени, имеющий спектр с относительно высокими и ясными пиками (особенно, в более высокой частотной части спектра). Это благодаря тому, что звуковой сигнал, имеющий изменяющийся во времени основной тон, преобразуется в звуковой сигнал с деформацией по времени, имеющий меньшее изменение основного тона или даже приблизительно постоянный основной тон. Следовательно, представление спектра звукового сигнала с деформацией по времени (который можно рассматривать как представление преобразованного спектра звукового сигнала с деформацией по времени) включает один или несколько ясных спектральных пиков. Другими словами, размазывание спектра оригинального звукового сигнала (имеющего изменяющийся во времени основной тон) уменьшается посредством успешной операции деформации по времени таким образом, что представление преобразованного спектра звукового сигнала с деформацией по времени включает более высокое уплотнение энергии, чем спектр оригинального звукового сигнала. Однако, деформация по времени не всегда успешна в отношении улучшения эффективности кодирования. Например, деформация по времени не улучшает эффективность кодирования, если входной звуковой сигнал включает большие шумовые компоненты, или, если извлеченный контур деформации по времени неточен.

В связи с этим, информация об уплотнении энергии, предоставленная преобразователем информации об уплотнении энергии, является важным индикатором принятия решения о том, успешна ли деформация по времени в отношении сокращения скорости передачи информации (битрейта).

Осуществление изобретения создает преобразователь сигнала активации деформации по времени для обеспечения сигнала активации деформации по времени на основе представления звукового сигнала. Преобразователь сигнала активации деформации по времени включает два преобразователя представления деформации по времени, формируемые таким образом, чтобы обеспечить два представления того же самого звукового сигнала с деформацией по времени, используя отличную информацию о контуре деформации по времени. Таким образом, преобразователи представления деформации по времени могут формироваться (структурно и/или функционально) таким же образом и использовать тот же самый звуковой сигнал, но различную информацию о контуре деформации по времени. Преобразователь сигнала активации деформации по времени также включает два преобразователя информации об уплотнении энергии, формируемые для предоставления первой информации об уплотнении энергии на основе первого представления деформации по времени, и предоставления второй информации об уплотнении энергии на основе второго представления деформации по времени. Преобразователи информации об уплотнении энергии могут формироваться таким же образом, но использовать различные представления деформации по времени. Кроме того, преобразователь сигнала активации деформации по времени включает компаратор для сравнения двух различных информации об уплотнении энергии и обеспечения сигнала активации деформации по времени в зависимости от результата сравнения.

В предпочтительном варианте реализации изобретения преобразователь информации об уплотнении энергии формируется таким образом, чтобы обеспечить меру спектральной плоскостности, описывающей представление преобразованного спектра звукового сигнала с деформацией по времени как информацию об уплотнении энергии. Было обнаружено, что деформация по времени успешна, в отношении сокращения скорости передачи информации (битрейта), если она преобразовывает спектр входного звукового сигнала в менее плоский спектр деформации по времени, представляющий версию входного звукового сигнала с деформацией по времени. Соответственно, мера спектральной плоскостности может использоваться для того, чтобы решить, не выполняя полный процесс спектрального кодирования, следует ли активизировать или дезактивировать деформацию по времени.

В предпочтительном варианте осуществления преобразователь информации об уплотнении энергии формируется таким образом, чтобы вычислить фактор геометрического значения преобразованного спектра мощности с деформацией по времени и афивметическое значение преобразованного спектра мощности с деформацией по времени для получения меры спектральной плоскостности. Было обнаружено, что этот фактор - мера спектральной плоскостности, которая хорошо приспособлена для описания возможного выигрыша (выгоды) в скорости передачи информации (битрейта), доступного при деформации по времени.

В другом предпочтительном варианте осуществления изобретения преобразователь информации об уплотнении энергии формируется таким образом, чтобы выделить более высокочастотную часть представления преобразованного спектра с деформацией по времени при сравнении с низкочастотной частью представления преобразованного спектра с деформацией по времени, чтобы получить информацию об уплотнении энергии. Эта концепция основывается на обнаружении того, что деформация по времени обычно оказывает намного большее влияние на высокочастотный диапазон, чем на низкочастотный диапазон. Соответственно, доминирующая оценка высокочастотного диапазона подходит для определения эффективности деформации по времени посредством использования меры спектральной плоскостности. Кроме того, обычные звуковые сигналы демонстрируют гармонический контекст (включая гармоники основной частоты), ослабление интенсивности которого происходит с увеличением частоты. Акцент на высокочастотную часть представления преобразованного спектра с деформацией по времени при сравнении с низкочастотной частью представления преобразованного спектра с деформацией по времени также помогает компенсировать это типичное ослабление спектральных линий с увеличением частоты. Чтобы суммировать вышесказанное, акцентированное рассмотрение высокочастотной части спектра способствует увеличению надежности информации об уплотнении энергии, и поэтому позволяет получить более надежное обеспечение сигнала активации деформации по времени.

В другом предпочтительном варианте осуществления изобретения преобразователь информации об уплотнении энергии формируется таким образом, чтобы обеспечить множество диапазоноподобных мер спектральной плоскостности, и чтобы вычислить среднее число множества диапазоноподобных мер спектральной плоскостности, получить информацию об уплотнении энергии. Было обнаружено, что рассмотрение диапазоноподобных мер спектральной плоскостности способствует получению особенно надежной информации о том, эффективна ли деформация по времени относительно уменьшения скорости передачи информации (битрейта) кодированного звукового сигнала. Во-первых, кодирование представления преобразованного спектра с деформацией по времени обычно выполняется диапазоноподобным образом, так что комбинация диапазоноподобных мер спектральной плоскостности хорошо приспосабливается для кодирования, и поэтому предоставляет возможность улучшить скорость передачи информации (битрейт) с хорошей точностью. Далее, диапазоноподобное вычисление мер спектральной плоскостности существенно устраняет зависимость информации об уплотнении энергии от распределения гармоник. Например, даже если высокочастотный диапазон включает относительно маленькую энергию (меньше, чем энергии низкочастотных диапазонов), высокочастотный диапазон может все еще быть перцепционно релевантным. Однако, положительное воздействие деформации по времени (в смысле сокращения размазывания спектральных линий) в -этом высокочастотном диапазоне должно рассматриваться как незначительное, просто из-за малой энергии высокочастотного диапазона, если мера спектральной плоскостности не будет вычисляться диапазоноподобным образом. Напротив, при применении диапазоноподобного вычисления положительное воздействие деформации по времени может быть принято в серьезный расчет, потому что диапазоноподобные меры спектральной плоскостности не зависят от абсолютных энергий в соответствующих частотных диапазонах.

В другом предпочтительном варианте осуществления изобретения преобразователь сигнала активации деформации по времени включает вычислитель контрольного значения, формируемый таким образом, чтобы вычислять меру спектральной плоскостности, описывающей представление спектра звукового сигнала с невременной деформацией для получения контрольного значения. Соответственно, сигнал активации деформации по времени может быть предоставлен на основе сравнения спектральной плоскостности версии входного звукового сигнала с «невременной деформацией» (или «недеформированной») и спектральной плоскостности версии входного звукового сигнала с деформацией по времени.

В другом предпочтительном варианте осуществления изобретения преобразователь информации об уплотнении энергии формируется таким образом, чтобы обеспечить меру перцепционной энтропии, описывающую представление преобразованного спектра звукового сигнала с деформацией по времени как информацию об уплотнении энергии. Эта концепция основывается на обнаружении того, что перцепционная энтропия представления преобразованного спектра с деформацией по времени является хорошей оценкой числа битов (или скорости передачи информации (битрейта)), необходимой для кодирования преобразованного спектра с деформацией по времени. Соответственно, мера перцепционной энтропии представления преобразованного спектра с деформацией по времени - хорошая мера того, можно ли ожидать сокращение скорости передачи информации (битрейта) при деформации по времени, даже ввиду того факта, что дополнительная информация о деформации по времени должна быть закодирована, если используется деформация по времени.

В другом предпочтительном варианте осуществления изобретения преобразователь информации об уплотнении энергии формируется таким образом, чтобы обеспечить меру автокорреляции, описывающую автокорреляцию представления звукового сигнала с деформацией по времени как информацию об уплотнении энергии. Эта концепция основывается на обнаружении того, что эффективность деформации по времени (в отношении сокращения скорости передачи информации (битрейта)) может быть измерена (или, по крайней мере, оценена) на основе сигнала временной области с деформацией по времени (или неравномерной повторной выборки). Было обнаружено, что деформация по времени эффективна, если сигнал временной области с деформацией по времени включает относительно высокую степень периодичности, которая отражается мерой автокорреляции. Напротив, если сигнал временной области с деформацией по времени не включает существенную периодичность, можно прийти к заключению о том, что деформация по времени не эффективна.

Это обнаружение основывается на том факте, что эффективная деформация по времени преобразовывает часть синусоидального сигнала переменной частоты (который не включает периодичность) в часть синусоидального сигнала приблизительно постоянной частоты (который включает высокую степень периодичности). Напротив, если деформация по времени не может обеспечить сигнал временной области, имеющий высокую степень периодичности, можно ожидать, что деформация по времени также не обеспечивает существенной экономии скорости передачи информации (битрейта), которая оправдала бы ее применение.

В предпочтительном варианте осуществления изобретения преобразователь информации об уплотнении энергии формируется таким образом, чтобы определить сумму абсолютных значений нормализованной функции автокорреляции (по множеству значений задержки) представления звукового сигнала с деформацией по времени для получения информации об уплотнении энергии. Было обнаружено, что сложное в вычислительном отношении определение пиков автокорреляции не требует оценки эффективности деформации по времени. Напротив, было обнаружено, что оценка суммирования автокорреляции по (широкому) диапазону значений задержки автокорреляции также способствует получению очень надежных результатов. Это достигается благодаря тому, что деформация по времени фактически преобразует множество компонентов сигнала (например, основная частота и ее гармоника) переменной частоты в периодические компоненты сигнала. Соответственно, автокорреляция такого сигнала с деформацией по времени показывает пики на множестве значений задержки автокорреляции. Таким образом, формирование суммы в вычислительном отношении - эффективный способ извлечения информации об уплотнении энергии из автокорреляции.

В другом предпочтительном варианте осуществления изобретения преобразователь сигнала активации деформации по времени включает вычислитель контрольного значения, формируемый для вычисления контрольного значения на основе спектрального представления звукового сигнала с невременной деформацией или на основе представления звукового сигнала временной области с невременной деформацией. В этом случае, компаратор обычно формируется таким образом, чтобы сформировать значение соотношения, используя информацию об уплотнении энергии, описывающую уплотнение энергии в преобразованном спектре звукового сигнала с деформацией по времени и контрольное значение. Компаратор также формируется таким образом, чтобы сравнивать значение соотношения с одним или несколькими пороговыми значениями, чтобы получить сигнал активации деформации по времени. Было обнаружено, что соотношение между информацией об уплотнении энергии в случае невременной деформации и информацией об уплотнении энергии в случае деформации по времени обеспечивает эффективное в вычислительном отношении, но и достаточно надежное генерирование сигнала активации деформации по времени.

В соответствии с другим предпочтительным вариантом осуществления изобретения создается кодер звукового сигнала для кодирования входного звукового сигнала для получения кодированного представления входного звукового сигнала. Кодер звукового сигнала включает преобразователь с деформацией по времени, формируемый для обеспечения представления преобразованного спектра с деформацией по времени на основе входного звукового сигнала. Кодер звукового сигнала также включает преобразователь сигнала активации деформации по времени, как описано выше. Преобразователь сигнала активации деформации по времени формируется таким образом, чтобы получить входной звуковой сигнал и предоставить информацию об уплотнении энергии таким образом, что информация об уплотнении энергии описывает уплотнение энергии в представлении преобразованного спектра входного звукового сигнала с деформацией по времени. Кодер аудио сигнала включает контроллер, формируемый таким образом, чтобы селективно предоставить, в зависимости от сигнала активации деформации по времени, обнаруженную непостоянную (переменную) часть контура деформации по времени или информацию о деформации по времени, или стандартную постоянную (непеременную) часть контура деформации по времени или информацию о деформации по времени, преобразователю деформации по времени. Таким образом, можно селективно принять или отклонить обнаруженную непостоянную часть контура деформации по времени при дифференцировании представления кодированного звукового сигнала от входного звукового сигнала.

Эта концепция основывается на обнаружении того, что не всегда эффективно вводить информацию о деформации по времени в кодированное представление входного звукового сигнала, потому что требуется значительное число битов для кодирования информации о деформации по времени. Далее, было обнаружено, что информация об уплотнении энергии, которая вычисляется преобразователем сигнала активации деформации по времени, является в вычислительном отношении эффективной мерой принятия решения о том, выгодно ли предоставлять преобразователю деформации по времени найденную переменную (непостоянную) часть контура деформации по времени или стандартный (неизменяющийся, постоянный) контур деформации по времени. Следует заметить, что, когда преобразователь с деформацией по времени включает перекрывающее преобразование, найденная часть контура деформации по времени может использоваться в вычислении двух или нескольких последующих преобразующих блоков. В частности, было обнаружено, что не обязательно полностью кодировать и версию преобразованного спектрального представления входного звукового сигнала с деформацией по времени, использующую вновь найденную переменную часть контура деформации по времени, и версию преобразованного спектрального представления входного звукового сигнала с деформацией по времени, использующую стандартную (непеременную) часть контура деформации по времени, чтобы принять решение о том, учитывает ли деформация по времени выигрыш в скорости передачи информации (битрейт) или нет. Более того, было обнаружено, что оценка уплотнения энергии преобразованного спектрального представления входного звукового сигнала с деформацией по времени формирует надежное основание для принятия решения. Соответственно, необходимая скорость передачи информации (битрейт) может сохраняться незначительной.

В дальнейшем предпочтительном варианте осуществления изобретения кодер звукового сигнала включает выходной интерфейс, формируемый таким образом, чтобы выборочно включать, в зависимости от сигнала активации деформации по времени, информацию о контуре деформации по времени, представляющую найденный переменный контур деформации по времени, в кодированное представление звукового сигнала. Таким образом, может быть получена высокая эффективность кодирования звукового сигнала, независимо от того, приспособлен ли входной сигнал для деформации по времени или нет.

Следующий вариант реализации изобретения относится к способу преобразования сигнала активации деформации по времени на основе звукового сигнала. Способ реализует функциональные возможности преобразователя-сигнала активации деформации по времени и может поддерживаться любым средством и функциональной возможностью, описанной здесь относительно преобразователя сигнала активации деформации по времени.

Другой вариант реализации изобретения относится к способу кодирования входного звукового сигнала для получения кодированного представления входного звукового сигнала. Этот способ может быть реализован любым средством и функциональной возможностью, описанной здесь относительно кодирующего устройства звукового сигнала.

Другой вариант реализации изобретения относится к компьютерным программам для реализации способов, упомянутых здесь.

В соответствии с первым аспектом данного изобретения, анализ звукового сигнала, независимо от того, имеет ли звуковой сигнал гармоническую или речевую характеристику, благоприятно используется для управления обработкой шумового наполнения на стороне кодирующего устройства и/или на стороне декодера. Анализ звукового сигнала легко доступен в системе, в которой используются функциональные возможности деформации по времени, так как эти функциональные возможности деформации по времени обычно включают следящий фильтр высоты тона и/или классификатор сигнала для того, чтобы различать речь с одной стороны и музыку с другой стороны и/или для того, чтобы различать вокализованную речь и невокализованную речь. Так как эта информация доступна в таком контексте без дальнейших затрат, доступная информация успешно используется для управления характеристикой шумового наполнения так, чтобы специально для речевых сигналов шумовое наполнение между гармоническими линиями было уменьшено или, в частности для речевых сигналов, даже устранено. Даже в ситуациях, когда сильный гармонический контекст получен, а речь прямо не обнаружена детектором речи, сокращение шумового наполнения, тем не менее, приведет к более высокому качеству восприятия. Хотя эта характеристика особенно полезна в системе, в которой анализ гармоники/речи выполняется в любом случае, и эта информация, поэтому, доступна без любых дополнительных затрат, управление схемой шумового наполнения, основанное на анализе сигнала, то есть, имеет ли сигнал гармоническую или речевую характеристику или нет, дополнительно полезно, даже когда специфический анализатор сигналов должен быть вставлен в систему, так как качество улучшается без увеличения скорости передачи информации (битрейта) или, напротив, скорость передачи информации (битрейт) уменьшается без потери качества, так как биты, необходимые для кодирования уровня шумового наполнения, уменьшаются, когда уменьшается сам уровень шумового наполнения, который может передаваться от кодирующего устройства к декодеру.

В дальнейшем аспекте данного изобретения результат анализа сигнала, то есть информация о том, является ли сигнал гармоническим сигналом или речевым сигналом, используется для управления обработкой функции окна звукового кодирующего устройства. Было обнаружено, что в ситуации, в которой начинается речевой сигнал или гармонический сигнал, высока возможность того, что прямой кодер переключится с длинных окон на короткие окна. Эти короткие окна, однако, имеют соответственно уменьшенное частотное разрешение, которое, с другой стороны, уменьшило бы эффективность кодирования для сильно гармонических сигналов и, поэтому, увеличило бы число битов, необходимых для кодирования такой части сигнала. Ввиду этого, данное изобретение, рассматриваемое в этом аспекте, использует окна длиннее, чем короткое окно, когда обнаружено начало речевого или гармонического сигнала. Альтернативно, выбираются окна длиной, примерно аналогичной длинным окнам, но с более коротким перекрыванием, чтобы эффективно уменьшить предэхо. В общем, характеристика сигнала, определяющая, имеет ли временной фрейм звукового сигнала гармоническую или речевую характеристику, используется для выбора функции окна для этого временного фрейма.

В соответствии с дальнейшим аспектом данного изобретения, TNS (временное ограничение шума) средство контролируется на основе того, что, основывается ли базовый сигнал на операции деформации по времени или находится в линейной области. Как правило, сигнал, обработанный посредством операции деформации по времени, будет иметь сильный гармонический контекст. Иначе, следящий фильтр высоты тона, связанный со стадией деформации по времени, не будет производить действительный контур основного тона и, в отсутствие такого действительного контура основного тона, функциональные возможности деформации по времени будут дезактивированы для этого временного фрейма звукового сигнала. Однако, гармонические сигналы, обычно, не подходят для обработки TNS. Обработка TNS особенно полезна и дает существенный выигрыш в скорости передачи информации (битрейте)/качестве, когда сигнал, обработанный стадией TNS, имеет почти плоский спектр. Однако, когда вид сигнала тональный, то есть, не плоский, как в случае спектров, имеющих гармонический контекст или вокализованный контекст, выигрыш в качестве/скорости передачи информации (битрейте), обеспеченный инструментом (средством) TNS, будет уменьшен. Поэтому, без изобретательной модификации инструмента TNS части с деформацией по времени обычно не обрабатываются TNS, но будут обрабатываться без фильтрования TNS. С другой стороны, свойство ограничения шума TNS, тем не менее, обеспечивает улучшенное качество, особенно, в ситуациях, когда сигнал изменяется по амплитуде/мощности. В случаях, когда присутствует начало гармонического или речевого сигнала, и когда свойство коммутации блока реализуется так, чтобы вместо этого начала сохранялись длинные окна или, по крайней мере, окна длиннее, чем короткие окна, активация свойства временного ограничения шума этого фрейма приведет к концентрации шума вокруг начала речи, которое эффективно уменьшает предэхо, которое могло бы возникнуть перед началом речи, вследствие квантизации фрейма, происходящей при последующей обработке посредством кодирующего устройства.

В соответствии с дальнейшим аспектом данного изобретения, переменное число линий обрабатывается квантизатором/энтропийным кодером в звуковом кодирующем аппарате, чтобы вычислить переменную полосу пропускания, которая вводится от фрейма к фрейму, вследствие выполнения операции деформации по времени с переменным свойством деформации по времени/контуром деформации. Когда операция деформации по времени приводит к ситуации, что время фрейма (в линейных показателях), включенное во фрейм с деформацией по времени, увеличивается, диапазон пропускания одиночной частотной линии уменьшается, и для постоянного полного диапазона пропускания число частотных линий, подлежащих обработке, должно быть увеличено относительно ситуации невременной деформации. С другой стороны, когда операция деформации по времени приводит к тому, что фактическое время звукового сигнала в области с деформацией по времени уменьшается относительно длины блока звукового сигнала в линейной области, частотный диапазон пропускания одиночной частотной линии увеличивается и, поэтому, число линий, обработанных исходным кодером, должно быть сокращено относительно ситуации невременной деформации, чтобы иметь уменьшенное изменение диапазона пропускания или, оптимально, не иметь никакого изменения полосы пропускания.

Предпочтительные варианты осуществления изобретения в дальнейшем описываются в соответствии со следующими изображениями, на которых:

Фиг.1 содержит изображение блок-схемы преобразователя сигнала активации деформации по времени, в соответствии с одним из вариантов осуществления изобретения;

Фиг.2а содержит изображение блок-схемы кодера звукового сигнала в соответствии с вариантом осуществления изобретения;

Фиг.2b содержит изображение блок-схемы преобразователя сигнала активации деформации по времени, в соответствии с другим вариантом осуществления изобретения;

Фиг.3a содержит графическое представление спектра версии звукового сигнала с невременной деформации;

Фиг.3b содержит графическое представление спектра версии звукового сигнала с деформацией по времени;

Фиг.3c содержит графическое представление индивидуального вычисления мер спектральной плоскостности для различных частотных диапазонов;

Фиг.3d содержит графическое представление вычи