Вычислитель контура временной деформации, кодера аудиосигнала, кодированное представление аудиосигнала, способы и программное обеспечение

Иллюстрации

Показать все

Изобретения относятся к вычислителю контура деформации [предыскажения] шкалы времени, кодеру звукового сигнала, кодированному представлению звукового сигнала, к способам декодированного представления аудиосигнала и кодированного представления аудиосигнала. Изобретение представляет собой вычислитель контура деформации шкалы времени, предназначенный для введения в конструкцию декодера аудиосигнала с целью формирования декодированного представления аудиосигнала на основе кодированного представления аудиосигнала, выполняющий функции приема закодированной информации о коэффициентах деформации, извлечения из нее последовательности значений коэффициентов деформации и расчета значений узлов контура деформации, начиная с исходного значения контура деформации шкалы времени. Отношение значений узлов контура-деформации шкалы времени к начальному значению контура деформации шкалы времени, присвоенному опорному узлу контура деформации шкалы времени, определяются коэффициентами деформации. Вычислитель контура деформации шкалы времени рассчитывает значение данной узловой точки контура деформации, которая отделена от начального узла контура деформации промежуточным узлом контура деформации, исходя из произведения от умножения коэффициентов, которыми являются, с одной стороны, отношение значения начальной точки контура деформации к значению промежуточной узловой точки контура деформации и, с другой стороны, отношение значения промежуточной узловой точки контура деформации к значению данного узла контура деформации. Технический результат: возможность эффективного и точного восстановления контура деформации шкалы времени благодаря тому, что относительное изменение контура деформации времени между последовательно расположенными координатами, как правило, ограничено узким диапазоном значений, при этом контур может быть описан с достаточной точностью с помощью кодируемой информации о коэффициентах деформации шкалы времени. 6 н. и 9 з.п. ф-лы, 19 ил.

Реферат

Варианты технических решений настоящего изобретения относятся к вычислителю контура деформации [предыскажения] шкалы времени. Другие реализации данного изобретения связаны с кодером звукового сигнала. Еще ряд конструктивных решений предлагаемого изобретения имеют отношение к кодированному представлению звукового сигнала. Кроме того, версии осуществления изобретения относятся к способам декодированного представления аудиосигнала и кодированного представления аудиосигнала. Далее, реализации изобретения относятся к компьютерному программному обеспечению.

Некоторые конструктивные решения изобретения связаны со способами функционирования кодера-преобразователя для МДКП (MDCT) с временной деформацией [модифицированное дискретное косинусное преобразование с деформацией временной шкалы].

Ниже предлагается краткое введение в область кодирования звука с предыскажением временной шкалы, концепции которого могут найти приложение в некоторых реализациях изобретения.

В последние годы разработаны методы преобразования звукового сигнала в представление в частотной области и эффективного кодирования такого представления в частотной области, например, с учетом перцептивных порогов маскирования. Такой подход к кодированию акустического сигнала особенно продуктивен, когда фреймы, для которых передается набор кодированных коэффициентов спектрального разложения, имеют большую длину; и когда только сравнительно небольшое количество спектральных коэффициентов - намного выше глобального порога маскирования, в то время как большое количество спектральных коэффициентов находится вблизи или ниже глобального порога маскирования, и ими можно, таким образом, пренебречь (или закодировать с минимальной разрядностью кода).

Например, косинусные или синусные модуляции с наложением часто применяют для кодирования источника благодаря их свойствам уплотнения энергии. Так, для гармонических тонов с постоянными основными частотами (основной тон) они концентрируют энергию сигнала в ограниченном числе спектральных составляющих (подполосы), что позволяет эффективно представлять сигнал.

Главным образом, частоту основного тона (опорную) сигнала понимают как низшую доминантную частоту, различимую в спектре сигнала. Общепринято основным тоном речевой модели считать частоту возбуждающего сигнала, модулируемую человеческой гортанью. Наличие только одной основной частоты делает спектр сверхпростым, состоящим лишь из опорной частоты и обертонов. Кодирование такого спектра очень продуктивно. При этом в сигналах с переменной частотой основного тона энергия, соответствующая каждой гармонической составляющей, распределяется между несколькими коэффициентами преобразования, приводя, таким образом, к снижению эффективности кодирования.

Для преодоления снижения эффективности кодирования кодируемый звуковой сигнал повторно дискретизируют с получением нужного эффекта за счет неравномерности шкалы времени. В дальнейшем позиции отсчетов, полученные при неравномерной передискретизации, обрабатывают, как будто их значения расположены на равномерной шкале времени. Для названия этой процедуры обычно применяют словосочетание "деформация (или предыскажение) временной шкалы". Шаг дискретизации может быть эффективно выбран в зависимости от колебаний частоты основного тона во времени таким образом, что изменение основного тона аудиосигнала в деформированной временной области будет меньшим, чем изменение основного тона в оригинальной версии аудиосигнала (до деформации времени). После предыскажения аудиосигнала во временной области деформированную по времени версию аудиосигнала трансформируют в частотную область. Зависящая от высоты основного тона временная деформация обеспечивает эффект, при котором трансформанта предыскаженного по времени звукового сигнала, как правило, уплотняется до значительно меньшего количества компонент спектра, чем при частотном представлении оригинального звукового сигнала (без деформации шкалы времени).

На стороне декодера представление в частотной области аудиосигнала с предыскажением шкалы времени преобразуют обратно во временную область таким образом, чтобы временное представление аудиосигнала с предыскажением шкалы времени было совместимо со стороной декодера. Однако при представлении во временной области аудиосигнала с временной деформацией, реконструированного на стороне декодера, в нем отсутствуют первоначальные колебания основного тона входного сигнала со стороны кодера. В связи с этим используют еще одну деформацию временной шкалы путем передискретизации реконструированного на стороне декодера временного представления аудиосигнала с предыскажением шкалы времени. Чтобы добиться качественной реконструкции декодером входного сигнала со стороны кодера, необходимо, чтобы деформация шкалы времени на стороне декодера была, по меньшей мере, приблизительно обратной операцией предыскажения шкалы времени на стороне кодера. Чтобы достичь надлежащей деформации шкалы времени, соответствующие управляющие данные должны быть совместимы со стороной декодера, что позволяет управлять деформацией времени на стороне декодера.

Поскольку такие данные, как правило, передаются от кодера аудиосигнала к декодеру аудиосигнала, оптимально, чтобы необходимая для этого скорость передачи данных была низкой, но рассчитанной на адекватное восстановление заданных параметров деформации шкалы времени на стороне декодера.

Ввиду вышесказанного, существует необходимость в концепции, которая позволила бы эффективно восстанавливать данные предыскажения шкалы времени на базе эффективно кодируемого представления данных предыскажения шкалы времени.

Краткое описание изобретения

Конструктивные решения в соответствии с настоящим изобретением направлены на воплощение вычислителя контура предыскажения (деформации) шкалы времени для применения в декодере звукового сигнала с целью формирования декодированного представления аудиосигнала на базе кодированного представления аудиосигнала. Вычислитель контура деформации шкалы времени предназначен для приема кодированных данных о коэффициентах деформации, извлечения из данных о коэффициентах деформации последовательности значений коэффициентов деформации и получения значений узлов контура деформации, считая от начального значения деформации шкалы времени. Отношения значений узлов контура предыскажения шкалы времени (то есть - значений координатных точек контура деформации времени, отличных от начальной узловой точки) к начальному значению контура предыскажения шкалы времени, привязанному к начальной узловой точке этого контура, определяются величинами коэффициентов деформации. Вычислитель контура предыскажения шкалы времени предназначен для расчета значения данного узла контура предыскажения шкалы времени, который отделен от начального узла контура предыскажения шкалы времени промежуточной узловой точкой контура предыскажения шкалы времени, из произведения от умножения коэффициентов, которыми являются, с одной стороны, отношение значения промежуточного узла контура предыскажения шкалы времени к начальному значению контура предыскажения шкалы времени и, с другой стороны, отношение значения данного узла контура предыскажения шкалы времени к значению промежуточной узловой точки контура предыскажения шкалы времени. Ключевой идеей данного варианта реализации изобретения является то, что эффективное кодирование контура предыскажения шкалы времени может быть достигнуто, если отношения последовательных значений узлов контура предыскажения шкалы времени кодируются в форме данных о коэффициентах деформации. Установлено, что относительное изменение (то есть отношение) значений двух последовательных узлов контура предыскажения шкалы времени является величиной, которая может быть эффективно закодирована в битовой форме без серьезного снижения качества реконструкции контура предыскажения шкалы времени. Например, установлено, что отношения значений последовательных узлов контура предыскажения времени, как правило, входят в одну область значений независимо от абсолютного значения контура предыскажения времени, таким образом, кодирование коэффициентов деформации может быть выбрано в независимости от текущего абсолютного значения контура предыскажения временной шкалы. Значения узловых точек контура предыскажения временной шкалы вычисляют путем получения произведения таким образом, что значение новой узловой точки контура предыскажения выводится из значения предыдущей узловой точки контура предыскажения через произведение (то есть умножением). За счет этого задается диапазон относительных разностей величин последовательных узлов контура предыскажения шкалы времени, определяемый кодированными величинами коэффициентов деформации. Таким образом гарантируется отсутствие в контуре предыскажения шкалы времени нежелательных чрезмерных неравномерностей, которые ведут к акустической дисторсии. Кроме того, было установлено, что сложные действия по аппроксимации кривой можно исключить путем вычисления значений последовательных узлов контура деформации шкалы времени через получение произведения. Соответственно, сложность декодера можно сохранить на сравнительно невысоком уровне. В частности, можно значительно сократить объем трудоемких математических действий (допустим, операций деления).

Суммируя вышесказанное, можно сделать вывод, что описанная реализация изобретения дает возможность эффективного и точного восстановления контура деформации шкалы времени благодаря тому, что относительное изменение контура деформации времени между последовательно расположенными координатами, как правило, ограничено узким диапазоном значений, при этом контур может быть описан с достаточной точностью с помощью кодируемой информации о коэффициентах деформации шкалы времени (здесь также кратко обозначенной как данные о коэффициентах деформации), даже если для кодирования величин коэффициентов деформации используется небольшое количество битов (например, 3 бита или 4 бита). Расчет значений узлов контура предыскажения (деформации) шкалы времени в вычислительном отношении эффективен и обеспечивает в психоакустическом плане оптимальную связность контура предыскажения шкалы времени.

В предпочтительной версии исполнения вычислитель контура деформации шкалы времени предусматривает периодический рестарт от начального значения контура деформации шкалы времени. Периодический рестарт от начального значения контура деформации шкалы времени позволяет добиться ограничения диапазона значений контура деформации шкалы времени величинами в области начального значения контура деформации шкалы времени. Следовательно, трудоемкость, задаваемая вычислителю контура деформации шкалы времени, может удерживаться на низком уровне и полностью подконтрольна, поскольку уход значений узловых точек контура деформации времени от начального значения контура деформации времени ограничен областью величин коэффициентов деформации и количеством узловых точек контура деформации шкалы времени между двумя последовательными рестартами. Таким образом, числовое антипереполнение или переполнение могут быть надежно предотвращены, даже если вычислитель контура предыскажения шкалы времени имеет относительно небольшую числовую разрешающую способность или числовой диапазон значений (что предусматривает упрощение технического исполнения).

В предпочтительном варианте осуществления вычислитель контура предыскажения шкалы времени выполняет функцию отображения кодируемых данных о коэффициентах деформации в последовательности величин коэффициентов деформации с использованием правила картирования, которое описывает порядок преобразования множества индексов таблицы кодов коэффициентов деформации в соответствующие величины коэффициентов деформации и которое выбирают таким образом, чтобы это правило картирования содержало множество пар обратных величин коэффициентов деформации, причем так, чтобы произведение двух коэффициентов деформации пары обратных величин коэффициентов деформации лежало в пределах от 0,9997 до 1,0003. Подобный алгоритм кодирования величин коэффициентов деформации позволяет точно представлять контуры предыскажения шкалы времени, которые возвращаются к предыдущему значению. Было установлено, что в некоторых случаях желательно, чтобы контур предыскажения шкалы времени отклонялся на некоторое время от первоначального значения (например, для некоторого множества узлов контура предыскажения шкалы времени), а затем возвращался к первоначальному значению. Было также определено, что, если итоговое значение контура предыскажения времени отклоняется от первоначального значения, могут произойти акустические искажения. Тем не менее, введение пар обратных величин коэффициентов деформации может обеспечить возврат контура предыскажения шкалы времени к его первоначальному значению с очень высокой точностью. Таким образом, предотвращается возникновение потенциальных акустических артефактов, которые могут явиться результатом рассогласования между исходным значением узла контура предыскажения шкалы времени и тем значением его узла, к которому этот контур предыскажения времени возвращается через некоторое время.

В предпочтительном варианте осуществления вычислитель контура предыскажения шкалы времени выполняет функцию отображения кодируемой информации о коэффициентах деформации в последовательности значений коэффициентов деформации с использованием правила картирования, где описывается порядок преобразования множества индексов таблицы кодов коэффициентов деформации в соответствующие величины коэффициентов деформации, где это правило картирования выбирают таким образом, чтобы оно содержало множество пар обратных величин коэффициентов деформации, причем так, чтобы произведение двух коэффициентов деформации пары обратных величин коэффициентов деформации лежало в диапазоне между 0,97 и 1,03. Было сделано заключение, что такой выбор дает возможность достаточно точно описывать контур предыскажения шкалы времени при сохранении битрейта, необходимого для кодирования коэффициента деформации, на достаточно низком уровне.

В предпочтительном варианте осуществления вычислитель контура предыскажения шкалы времени выполняет функцию отображения кодируемой информации о коэффициентах деформации в последовательности значений коэффициентов деформации с использованием правила картирования, где описывается порядок преобразования множества индексов таблицы кодов коэффициентов деформации в соответствующие величины коэффициентов деформации, и где правило картирования выбирают асимметрично, чтобы диапазон восходящих значений коэффициентов деформации был шире, чем диапазон нисходящих значений коэффициентов деформации. Было установлено, что такой вариант правила картирования хорошо адаптирован к характеристикам речи человека и типичных образцов музыки. Следовательно, асимметричный вариант правила картирования обеспечивает оптимальное использование доступного битрейта, что является очень важным критерием в сфере кодирования и декодирования звука.

В предпочтительной версии конструктивного исполнения вычислитель контура предыскажения шкалы времени предназначен для получения протокольных данных, дифференцирующих непеременный (скажем, сглаженный) или переменный (к примеру, несглаженный) контур предыскажения шкалы времени для данного фрейма кодированного представления аудиосигнала, и, в зависимости от протокольных данных, указывающих на переменный или непеременный тип контура предыскажения шкалы времени, для выведения значений узловых точек контура предыскажения шкалы времени для данного фрейма на основании кодированных данных о коэффициентах деформации, или для задания значений узловых точек контура предыскажения шкалы времени для данного фрейма относительно начального значения контура деформации шкалы времени. В данной конструктивной версии передача любых кодированных данных о коэффициентах деформации времени на вычислитель контура деформации шкалы времени может быть отменена для фреймов, где служебная информация указывает на наличие непеременного контура предыскажения шкалы времени. В силу этого, аудиофреймы, заключающие в себе непеременный контур предыскажения шкалы времени (или в которых не может быть распознан переменный контур предыскажения шкалы времени), содержат только соответствующий флажок, обозначающий этот непеременный контур предыскажения шкалы времени (или отсутствие переменного контура предыскажения шкалы времени). И наоборот, аудиофреймы, заключающие в себе переменный контур предыскажения шкалы времени, содержат флажок, указывающий, что контур предыскажения шкалы времени - не непеременный и, в дополнение к этому, кодированную информацию о коэффициентах деформации шкалы времени. Таким образом, в то время как аудиофреймы, включающие в себя переменный контур предыскажения шкалы времени, содержат кроме закодированных данных о коэффициентах деформации времени дополнительный флажок (например, один бит), аудиофреймы, в которых контур предыскажения шкалы времени является непеременным, содержат только флажок (например, один бит), но не включают в себя закодированные данные о коэффициентах деформации. В силу того, что чаще всего значительная доля фреймов содержит непеременный контур предыскажения времени (или переменный контур предыскажения времени в них не может быть идентифицирован), количество битов, необходимых для описания контура предыскажения шкалы времени, как правило, сокращается, если сравнивать со случаями, когда закодированные данные о коэффициентах деформации шкалы времени содержатся в каждом аудиофрейме, даже если во фреймах, которые содержат варьируемый контур предыскажения времени, что число единиц информации увеличивается (например, на один бит).

В предпочтительном конструктивном варианте вычислитель контура предыскажения шкалы времени предназначается для линейной интерполяции между значениями узлов контура предыскажения времени, вырабатывать значения новых интервалов контура предыскажения временной шкалы. Благодаря такой интерполяции достигают повышенной прецизионности при реконструкции контура предыскажения шкалы времени.

В предпочтительной версии исполнения вычислитель контура предыскажения предусматривает итеративное вычисление последовательности значений узлов контура предыскажения шкалы времени, при котором вычислитель контура предыскажения шкалы времени рассчитывает последующее значение узла контура предыскажения шкалы времени от текущего значения узла контура предыскажения шкалы времени путем умножения текущего значения узла контура предыскажения шкалы времени на соответствующий коэффициент деформации шкалы времени. За счет этого достигается эффективное использование значений коэффициентов деформации шкалы времени. В частности, значение узловой точки контура деформации шкалы времени может быть выведено из предыдущего значения узла контура деформации шкалы времени в пошаговом режиме.

Другим техническим решением в соответствии с настоящим изобретением является кодер аудиосигнала, предназначенный для кодированного представления звукового сигнала. Кодер аудиосигнала включает в себя кодер контура предыскажения шкалы времени, характеризующийся тем, что он получает данные контура предыскажения шкалы времени, относящиеся к аудиосигналу, вычисляет отношение последовательных значений узлов контура предыскажения шкалы времени и кодирует отношение последовательных значений узлов контура предыскажения шкалы времени. Кодер аудиосигнала, далее, включает в себя кодер сигнала предыскажения шкалы времени, характеризующийся тем, что он принимает кодированное представление спектра аудиосигнала, учитывая предыскажение временной шкалы, описанное данными контура предыскажения временной шкалы. Кодированное аудиопредставление звукового сигнала содержит кодированное отношение (последовательных значений узлов контура предыскажения шкалы времени) и кодированное представление спектра аудиосигнала. Кодер аудиосигнала согласно данному конструктивному решению формирует кодированное представление звукового сигнала, которое хорошо соответствует требованиям вычислений на стороне кодера контура предыскажения шкалы времени, который был описан выше. В частоности, как правило, обеспечивается возможность кодирования отношения последовательных значений узлов контура предыскажения шкалы времени с большой точностью при использовании небольшого числа битов. Как было рассмотрено выше, отношение последовательных значений узлов контура предыскажения шкалы времени находится чаще всего в одной области значений как для абсолютных величин контура предыскажения шкалы времени, так и для больших абсолютных величин контура предыскажения шкалы времени. Кроме того, расчет отношения последовательных значений узловых точек контура предыскажения шкалы времени может быть выполнен с очень низкой вычислительной трудоемкостью, что упрощает конструкцию кодера аудиосигнала.

В предпочтительном варианте реализации изобретения кодер контура предыскажения шкалы времени выполняет проверку совместимости варьируемого контура предыскажения шкалы времени с данным фреймом аудиосигнала и устанавливает в кодируемом представлении аудиосигнала флажок отсутствия переменного контура предыскажения шкалы времени, если переменный контур предыскажения шкалы времени не совместим с данным фреймом аудиосигнала. В частности, в данном случае флажок, индицирующий наличие варьируемого контура предыскажения шкалы времени, может быть деактивирован (или вновь установлен). Кодер контура предыскажения шкалы времени предусматривает также пропуск ввода кодированных значений коэффициентов в кодируемое представление аудиосигнала, если переменный контур предыскажения времени не совместим с данным фреймом аудиосигнала. В силу этого происходит минимизация битрейта для звуковых сигналов, содержащих значительное количество фреймов, с которыми переменный контур предыскажения шкалы времени не совместим. Здесь необходимо отметить, что переменный контур предыскажения шкалы времени, как правило, не совместим с аудиосигналами, содержащими непеременный контур предыскажения времени, а также с аудиосигналами, из которых извлечение контура предыскажения времени невозможно (или не дает значащий результат). Как уже рассматривалось выше, использование флажка, сигнализирующего наличие или отсутствие переменного контура предыскажения шкалы времени, способствует снижению битрейта, необходимого для кодирования контура предыскажения шкалы времени типичных акустических сигналов.

При осуществлении изобретения формируется кодированное представление аудиосигнала, отображающее звуковой сигнал. Кодированное представление аудиосигнала включает в себя кодированное представление в частотной области, отображающее один или более звуковых каналов, вторично дискретизированных в соответствии с предыскажением временной шкалы. Кодированное представление аудиосигнала также включает в себя кодированное представление контура предыскажения шкалы времени, представляющего деформацию шкалы времени, где кодированное представление контура предыскажения шкалы времени содержит множество кодированных значений коэффициентов временной деформации. Значения коэффициентов временной деформации выражают отношения последовательных значений узловых точек контура предыскажения шкалы времени. Такое кодированное представление аудиосигнала несет информацию о предыскажении шкалы времени в высокоэффективной форме и предполагает использование вышеописанного эффективного вычислителя контура предыскажения шкалы времени.

В предпочтительной версии исполнения изобретения кодированное представление аудиосигнала включает в себя флажок, устанавливаемый в каждом фрейме, для индикации наличия кодированного представления контура предыскажения шкалы времени в соответствующем фрейме.

Еще одной формой осуществления изобретения является способ декодированного представления аудиосигнала на основе кодированного представления аудиосигнала. Способ заключается в приеме кодированных данных о коэффициентах деформации, в вычислении последовательности величин коэффициентов деформации из закодированных данных о коэффициентах деформации и в определении множества значений узловых точек контура деформации с опорой на значение начальной координаты контура деформации. Отношения значений узловых точек контура деформации шкалы времени (координат контура временной деформации, отличных от опорной координаты контура временной деформации) и значение начальной узловой точки контура деформации шкалы времени определяются значениями коэффициентов деформации шкалы времени. Значение конкретной узловой точки контура деформации шкалы времени, которая отделена от начальной узловой точки контура деформации шкалы времени промежуточной узловой точкой контура деформации шкалы времени, вычисляется из произведения от умножения коэффициентов, которыми служат, с одной стороны, отношение значения промежуточной узловой точки контура деформации шкалы времени к начальному значению контура деформации шкалы времени и, с другой стороны, отношение значения данной узловой точки контура деформации шкалы времени к значению промежуточной узловой точки контура деформации шкалы времени. Этот способ имеет такие же преимущества, как и рассмотренный выше вычислитель контура предыскажения шкалы времени, и может быть дополнен такими же свойствами и функциональными возможностями, что и вычислитель контура предыскажения шкалы времени, описанный здесь.

Одной из реализаций настоящего изобретения является способ формирования кодированного представления акустического сигнала. Способ состоит в получении данных контура предыскажения шкалы времени для звукового сигнала, в вычислении отношения последовательных значений узловых точек контура предыскажения шкалы времени и в кодировании отношения последовательных значений узловых точек контура предыскажения шкалы времени. Кроме того, способ состоит в получении кодированного представления спектра звукового сигнала с учетом предыскажения временной шкалы, описанного данными предыскажения шкалы времени. Кодированное представление звукового сигнала включает в себя кодированное отношение и кодированное представление спектра. Этот способ имеет такие же преимущества, как и декодер аудиосигнала, упомянутый выше, и может быть дополнен любыми характеристиками и функциональными возможностями, описанными здесь относительно кодера аудиосигнала.

Другой частью реализации настоящего изобретения является компьютерная программа, предназначенная для осуществления рассматриваемых здесь способов.

Еще одним элементом конструктивного решения данного изобретения является декодер аудиосигнала, включающий в себя вышеупомянутый вычислитель контура деформации шкалы времени. Декодер аудиосигнала может быть дополнен любыми описанными здесь характеристиками и функциональными возможностями.

Краткое описание фигур.

Далее, варианты технических решений в соответствии с предлагаемым изобретением будут описаны со ссылкой на прилагаемые фигуры, где:

на фиг.1 представлена принципиальная блочная схема аудиокодера предыскажения (деформации) шкалы времени;

на фиг.2 представлена принципиальная блочная схема аудиодекодера деформации (предыскажения) шкалы времени;

на фиг.3 представлена принципиальная блочная схема реализации декодера аудиосигнала в соответствии с данным изобретением;

на фиг.4 дана блок-схема осуществления способа формирования декодированного представления аудиосигнала в соответствии с данным изобретением;

на фиг.5 представлен детализированный фрагмент принципиальной блочной схемы реализации декодера аудиосигнала в соответствии с данным изобретением;

на фиг.6 дан детализированный фрагмент блок-схемы осуществления способа формирования декодированного представления аудиосигнала в соответствии с данным изобретением;

на фиг.7а, 7b графически отображен процесс реконструкции контура деформации (предыскажения) шкалы времени при реализации данного изобретения;

на фиг.8 графически отображен другой пример реконструкции контура деформации (предыскажения) шкалы времени в соответствии с данным изобретением;

на фиг.9а и 9b представлены алгоритмы вычисления контура предыскажения (деформации) шкалы времени;

на фиг.9с приведена таблица перевода индексов отношений деформации времени в значения коэффициентов деформации времени;

на фиг.10а и 10b представлены алгоритмы расчета изохроны, шага дискретизации, длины перехода, "первой позиции" и "последней позиции";

на фиг.10с представлены алгоритмы расчета конфигурации окна;

на фиг.10d и 10е представлены алгоритмы приложения окна;

на фиг.10f представлены алгоритмы варьируемой во времени передискретизации;

на фиг.10g графически представлены алгоритмы обработки фреймов после временной деформации и алгоритмы наложения и сложения;

на фиг.11a и 11b даны условные обозначения;

на фиг.12 представлена изохрона, которая может быть извлечена из контура предыскажения (деформации) шкалы времени;

на фиг.13 представлена подробная принципиальная блочная схема устройства формирования контура предыскажения (деформации) в соответствии с данным изобретением;

на фиг.14 представлена принципиальная блочная схема другого варианта решения декодера аудиосигнала в соответствии с данным изобретением;

на фиг.15 представлена принципиальная блочная схема другого варианта решения вычислителя контура предыскажения (деформации) шкалы времени в соответствии с данным изобретением;

на фиг.16а, 16b приведены графики, отображающие процесс вычисления значений узлов деформации шкалы времени в соответствии с данным изобретением;

на фиг.17 представлена принципиальная блочная схема варианта решения кодера аудиосигнала в соответствии с данным изобретением;

на фиг.18 представлена принципиальная блочная схема варианта исполнения декодера аудиосигнала в соответствии с данным изобретением; и

на фиг.19a-19f представлены элементы синтаксиса звукового потока в рамках осуществления настоящего изобретения.

Подробное техническое описание

1. Аудиокодер предыскажения шкалы времени в соответствии с фиг.1

Поскольку предлагаемое изобретение относится к кодированию и декодированию звуковых сигналов с предыскажением временной шкалы, следует кратко проанализировать прототип аудиокодера и аудиодекодера деформации временной шкалы, где может быть применено изобретение.

На фиг.1 представлена принципиальная блочная схема аудиокодера предыскажения шкалы времени, в котором могут быть применены некоторые подходы и конструктивные решения изобретения. Кодер аудиосигнала 100 на фиг.1 предназначен для приема входного аудиосигнала 110 и формирования кодированного представления входного аудиосигнала 110 в виде последовательности фреймов. Аудиокодер 100 включает в себя дискретизатор 104, предназначенный для дискретизации (входного) аудиосигнала 110 с образованием блоков сигнала (отсчетов) 105, используемых как материал для преобразования в частотную область. Далее, аудиокодер 100 включает в себя вычислитель окон преобразования 106, предназначенный для формирования окон масштабирования для отсчетов дискретного представления 105, передаваемого с выхода дискретизатора 104. Эти отсчеты вводятся в оконный преобразователь 108, предназначенный для приложения окон масштабирования к отсчетам дискретного представления 105, генерируемым дискретизатором 104. В некоторых версиях исполнения аудиокодер 100 может дополнительно содержать преобразователь в частотную область 108а, предназначенный для формирования частотного представления (например, в виде коэффициентов преобразования) масштабированных дискретов 105. Составляющие частотного представления могут быть обработаны или переданы дальше в виде кодированного представления аудиосигнала 110.

Кроме того, аудиокодер 100 задействует контур основного тона 112 аудиосигнала 110, который может быть введен в аудиокодер 100 или который может быть сгенерирован аудиокодером 100. Соответственно, аудиокодер 100 может быть произвольно оснащен оценивателем частоты основного тона, предусматривающим вычисление контура основного тона 112. Дискретизатор 104 может обрабатывать непрерывный входной аудиосигнал 110. И наоборот, дискретизатор 104 может обрабатывать уже дискретизированный входной аудиосигнал 110. В последнем случае, дискретизатор 104 может передискретизировать звуковой сигнал 110. Дискретизатор 104, например, может быть рассчитан на предыскажение временной шкалы смежных перекрывающихся аудиоблоков с получением на участке наложения постоянной частоты основного тона или снижения колебаний частоты основного тога внутри каждого входного блока после дискретизации.

Вычислитель окон преобразования 106 рассчитывает окна масштабирования для аудиоблоков в зависимости от предыскажения шкалы времени, выполненного дискретизатором 104. Для этого как опция может быть введен блок установки шага дискретизации 114, задающий дискретизатору правило предыскажения временной шкалы, которое затем также передается на вычислитель окон преобразования 106. Возможен вариант реализации, при котором блок настройки шага дискретизации 114 исключен, а контур основного тона 112 напрямую пересылается на вычислитель окон преобразования 106, который самостоятельно выполняет соответствующие вычисления. Более того, дискретизатор 104 может передавать примененные параметры дискретизации на вычислитель окон преобразования 106 для обеспечения вычисления соответствующих окон масштабирования.

Предыскажение шкалы времени осуществляется таким образом, что контур основного тона дискретизированных аудиоблоков, деформированный по времени и разбитый на отсчеты дискретизатором 104, более устойчив, чем контур основного тона исходного звукового сигнала 110 на входном терминале.

2. Аудиодекодер деформации шкалы времени в соответствии с фиг.2

На фиг.2 представлена принципиальная блочная схема декодера деформированного по шкале времени аудиосигнала 200, предназначенного для обработки первого деформированного по времени и дискретизированного или просто деформированного по времени представления первого и второго фрейма аудиосигнала, состоящего из последовательности фреймов, в которой второй фрейм следует за первым фреймом, и для последующей обработки второго деформированного по времени представления второго фрейма и третьего фрейма, следующего за вторым фреймом в последовательности фреймов. Аудиодекодер 200 включает в себя вычислитель окон преобразования 210, предназначенный для формирования первого окна масштабирования для первого деформированного по времени представления 211a с использованием данных контура основного тона 212 первого и второго фрейма и для формирования второго окна масштабирования для второго деформированного по времени представления 211b с использованием данных контура основного тона второго и третьего фрейма, где окна масштабирования могут иметь одинаковый по количеству набор отсчетов, и где первый набор отсчетов, используемый для затухания первого окна масштабирования, может отличаться от второго набора отсчетов, используемого для наплыва второго окна масштабирования. Далее, аудиодекодер 200 включает в себя оконный преобразователь 216, предназначенный для приложения первого окна масштабирования к первому представлению деформации временной шкалы и для приложения второго окна масштабирования ко второму деформированному по времени представлению. Кроме того, аудиодекодер 200 включает в себя передискретизатор 218, предназначенный для