Декодер звукового сигнала, кодер звукового сигнала, представление кодированного многоканального звукового сигнала, способы и програмное обеспечение

Иллюстрации

Показать все

Изобретение относится к кодированию и декодированию многоканального аудисигнала. Технический результат заключается в улучшении характеристик кодера-преобразователя для модифицированного дискретного косинусного преобразования (МДКП) с временной деформацией, обеспечении эффективного битрейта при сохранении и/или передаче многоканального аудиосигнала. Декодер аудиосигнала предназначен для формирования декодированного представления многоканального аудиосигнала на основе кодированного представления многоканального звукового сигнала, включает в себя декодер деформации шкалы времени для реконструкции деформации шкалы времени множества аудиосигналов, входящих в кодированное представление многоканального аудисигнала. Кодер аудиосигнала формирует кодированное представление многоканального акустического сигнала, включает в свою конструкцию генератор кодированного представления аудиосигнала, в свою очередь, избирательно формирующий представление аудиосигнала, содержащее информацию об общем контуре деформации времени, совокупно характеризующую множество звуковых каналов многоканального акустического сигнала, или кодированное представление аудиосигнала, содержащее информацию об индивидуальных контурах деформации шкалы времени, раздельно характеризующую каждый из множества звуковых каналов, где выбор зависит от отраженного в информации сходства или различия между контурами деформации времени, относящимися к каждому из множества звуковых каналов. 6 н. и 8 з.п. ф-лы, 40 ил.

Реферат

Технические решения предлагаемого изобретения относятся к декодеру аудиосигнала. Также варианты осуществления данного изобретения связаны с кодером звукового сигнала. Ряд конструктивных исполнений по настоящему изобретению имеет отношение к кодированному представлению многоканального аудиосигнала. Кроме того, версии реализации изобретения относятся к способу декодированного представления многоканального аудиосигнала, к способу кодированного представления многоканального аудиосигнала и к компьютерной программе для осуществления указанных способов.

Некоторые конструктивные решения изобретения связаны со способами функционирования кодера-преобразователя для МДКП с временной деформацией [модифицированное дискретное косинусное преобразование с деформацией временной шкалы].

Ниже предлагается краткое введение в область кодирования звука с предыскажением временной шкалы, концепции которого могут найти приложение в некоторых реализациях изобретения.

В последние годы разработаны методы преобразования звукового сигнала в представление в частотной области и эффективного кодирования такого представления в частотной области, например, с учетом перцептивных порогов маскирования. Такой подход к кодированию акустического сигнала особенно продуктивен, когда фреймы, для которых передается набор кодированных коэффициентов спектрального разложения, имеют большую длину; и когда только сравнительно небольшое количество спектральных коэффициентов - намного выше глобального порога маскирования, в то время как большое количество спектральных коэффициентов находится вблизи или ниже глобального порога маскирования, и ими можно, таким образом, пренебречь (или закодировать с минимальной разрядностью кода).

Например, косинусные или синусные модуляции с наложением часто применяют для кодирования источника благодаря их свойствам уплотнения энергии. Так, для гармонических тонов с постоянными основными частотами (основной тон), они концентрируют энергию сигнала в ограниченном числе спектральных составляющих (подполосы), что позволяет эффективно представлять сигнал.

Главным образом, частоту основного тона (опорную) сигнала понимают как низшую доминантную частоту, различимую в спектре сигнала. Общепринято основным тоном речевой модели считать частоту возбуждающего сигнала, модулируемую человеческой гортанью. Наличие только одной основной частоты делает спектр сверхпростым, состоящим лишь из опорной частоты и обертонов. Кодирование такого спектра очень продуктивно. При этом, в сигналах с переменной частотой основного тона энергия, соответствующая каждой гармонической составляющей распределяется между несколькими коэффициентами преобразования, приводя, таким образом, к снижению эффективности кодирования.

Для преодоления снижения эффективности кодирования кодируемый звуковой сигнал повторно дискретизируют с получением нужного эффекта за счет неравномерности шкалы времени. В дальнейшем позиции отсчетов, полученные при неравномерной передискретизации, обрабатывают, как будто их значения расположены на равномерной шкале времени. Для названия этой процедуры обычно применяют словосочетание „деформация (или предыскажение) временной шкалы". Шаг дискретизации может быть эффективно выбран в зависимости от колебаний частоты основного тона во времени таким образом, что изменение основного тона аудиосигнала в деформированной временной области будет меньшим, чем изменение основного тона в оригинальной версии аудиосигнала (до деформации времени). После предыскажения аудиосигнала во временной области деформированную по времени версию аудиосигнала трансформируют в частотную область. Зависящая от высоты основного тона временная деформация обеспечивает эффект, при котором трансформанта предыскаженного по времени звукового сигнала, как правило, уплотняется до значительно меньшего количества компонент спектра, чем при частотном представлении оригинального звукового сигнала (без деформации шкалы времени).

На стороне декодера представление в частотной области аудиосигнала с предыскажением шкалы времени преобразуют обратно во временную область таким образом, чтобы временное представление аудиосигнала с предыскажением шкалы времени было совместимо со стороной декодера. Однако при представлении во временной области аудиосигнала с временной деформацией, реконструированного на стороне декодера, в нем отсутствуют первоначальные колебания основного тона входного сигнала со стороны кодера. В связи с этим используют еще одну деформацию временной шкалы путем передискретизации реконструированного на стороне декодера временного представления аудиосигнала с предыскажением шкалы времени. Чтобы добиться качественной реконструкции декодером входного сигнала со стороны кодера, необходимо, чтобы деформация шкалы времени на стороне декодера была, по меньшей мере, приблизительно обратной операцией предыскажения шкалы времени на стороне кодера. Чтобы достичь надлежащей деформации шкалы времени, соответствующие управляющие данные должны быть совместимы со стороной декодера, что позволяет управлять деформацией времени на стороне декодера.

Поскольку такие данные, как правило, передаются от кодера аудиосигнала к декодеру аудиосигнала, оптимально, чтобы необходимая для этого скорость передачи данных была низкой, но рассчитанной на адекватное восстановление заданных параметров деформации шкалы времени на стороне декодера.

Принимая во внимание вышесказанное, необходимо сформулировать концепцию, предусматривающую обеспечение эффективного битрейта при сохранении и/или передаче многоканального аудиосигнала.

Краткое описание изобретения

Конструктивные решения в соответствии с настоящим изобретением направлены на воплощение декодера аудиосигнала, предназначенного для формирования декодированного представления многоканального аудиосигнала на основе кодированного представления многоканального аудиосигнала. Декодер аудиосигнала включает в свою конструкцию декодер деформации временной шкалы, предназначенный для селективного использования или индивидуальных, специфических для отдельных аудиоканалов, контуров деформации шкалы времени, или объединенного многоканального контура деформации шкалы времени для восстановления деформации временной шкалы множества аудиоканалов в кодированном представлении многоканального аудиосигнала.

Такая аппаратная версия изобретения основана на заключении, что эффективность кодирования различных видов многоканальных аудиосигналов может быть достигнута за счет коммутирования операции запоминания и/или передачи аудиоканала между отдельными контурами деформации времени и объединенными многоканальными контурами деформации времени. Было установлено, что в некоторых случаях в каналах многоканального аудиосигнала основной тон изменяется значительно иначе. Кроме того, было определено, что в других случаях основной тон изменяется примерно одинаково по множеству каналов многоканального аудиосигнала. При наличии подобной разницы между сигналами (или компонентами обособленного аудиосигнала) была установлена возможность повышения эффективности кодирования при условии, что в декодере предусмотрен гибкий выбор (коммутируемый или селективный) контуров деформации времени для реконструкции различных каналов многоканального аудиосигнала между индивидуальными, адаптивными для каждого аудиоканала представлениями контура деформации времени или объединенным многоканальным представлением контура деформации шкалы времени.

В предпочтительной версии исполнения декодер временной деформации должен предусматривать выборочное задействование общего многоканального контура деформации времени для воссоздания временной деформации множества аудиоканалов, для которых доступна индивидуальная закодированная информация спектральной области. Как определено в соответствии с подходом настоящего изобретения, комбинированный многоканальный контур деформации шкалы времени применим для восстановления деформации времени множества аудиоканалов не только, если различные аудиоканалы имеют схожий акустический состав, но и даже если разные аудиоканалы содержат в значительной степени разнородный звуковой контент. Соответственно, признано целесообразным принять объединенную концепцию использования комбинированного многоканального контура деформации времени для расчета индивидуальных кодированных данных спектральной области для разных аудиоканалов. Например, функциональность данной концепции проявляется, когда по первому звуковому каналу проходит представление первой части полифонического музыкального фрагмента, в то время как по второму звуковому каналу воспроизводится вторая часть этого полифонического музыкального фрагмента. Первый аудиосигнал и второй аудиосигнал могут, в частности, отображать звук, порождаемый разными вокалистами или разными инструментами. Соответственно, спектральное представление первого звукового канала может существенно отличаться от спектрального представления второго звукового канала. Допустим, разные звуковые каналы могут иметь различные опорные частоты. Также разные звуковые каналы могут нести несхожие частотные характеристики основной гармоники. Вместе с тем, может проявляться выраженная тенденция почти параллельного варьирования частот основного тона разных аудиоканалов. В таком случае весьма действенным может быть приложение к разным аудиоканалам общей деформация временной шкалы (описываемой совмещенным многоканальным контуром предыскажения времени), даже при том, что эти разные аудиоканалы будут содержать сильно разнящийся аудиоконтент (отличающийся, скажем, опорными частотами и гармоническими спектрами). Тем не менее в других случаях естественно было бы использовать разные варианты деформации временной шкалы для разных аудиоканалов.

В предпочтительном варианте реализации изобретения декодер деформации временной шкалы получает первую порцию кодированной информации области спектра, относящейся к первому из аудиоканалов, и на основе этой информации формирует представление первого звукового канала в деформированной временной области путем преобразования частотной области во временную область. Далее, декодер временной деформации принимает вторую порцию кодированной информации спектральной области, связанную со вторым из аудиоканалов, и на базе этой информации обеспечивает представление второго звукового канала в деформированной временной области путем преобразования частотной области во временную область. При этом вторая очередь кодированной информации спектральной области может отличаться от первой очереди информации спектральной области. Кроме того, декодер временной деформации, опираясь на комбинированный многоканальный контур деформации времени, выполняет неравномерную по времени передискретизацию времядеформированного представления первого аудиоканала или его преобразованной версии с формированием равномерно дискретизированного представления первого аудиоканала, а также, опираясь на тот же комбинированный многоканальный контур деформации времени, выполняет неравномерную по времени передискретизацию времядеформированного представления второго звукового канала или его преобразованной версии с формированием равномерно дискретизированного представления второго аудиоканала.

Другое предпочтительное техническое решение декодера временной деформации предполагает выделение совокупного многоканального временного контура из информации о совокупном многоканальном контуре предыскажения шкалы времени. Помимо этого, декодер временной деформации предусматривает индивидуальное конфигурирование на базе первой очереди кодированной информации о форме окна первой, специфической для данного канала формы окна, соответствующей первому из аудиоканалов, и индивидуальное конфигурирование на базе второй очереди кодированной информации о форме окна второй, специфической для данного канала формы окна, соответствующей второму из аудиоканалов. Далее, декодер деформации временной шкалы предусматривает приложение окна первой конфигурации к представлению первого звукового канала в деформированной временной области, получение в преобразованном виде времядеформированного представления первого звукового канала, а также - приложение окна второй конфигурации к представлению второго звукового канала в деформированной временной области и получение в преобразованном виде времядеформированного представления второго звукового канала. В данном случае декодером деформации времени для времядеформированных представлений первого и второго звукового канала могут быть использованы окна различной геометрии в зависимости от поступившей индивидуальной, специфической для каждого канала информации о геометрии окна.

Установлено, что в некоторых случаях рекомендуется при подготовке операции предыскажения звукового сигнала применять взвешивающие окна разной конфигурации к разным звуковым сигналам, даже если в основе процедуры предыскажения времени лежит общий контур деформации шкалы времени. Например, может существовать переход между фреймом, содержащим контур деформации времени, общий для двух аудиоканалов, и следующим фреймом, содержащим разные контуры деформации времени для этих двух аудиоканалов. Однако контур деформации времени одного из этих двух аудиоканалов в следующем фрейме может быть неизменяющимся продолжением общего контура деформации времени текущего фрейма, в то время как контур деформации времени другого аудиоканала в следующем фрейме может измениться относительно общего контура деформации времени в текущем фрейме. Таким образом, для одного из аудиоканалов может быть использована форма окна, заданная для неменяющегося контура временной деформации, в то время как для другого аудиоканала может быть применена форма окна, рассчитанная для переменного контура деформации шкалы времени. Отсюда следует, что в расчет могут быть приняты разные формы поведения аудиоканалов.

При другом конструктивном исполнении в декодере деформации времени для взвешивания представлений во временной области первого и второго звуковых каналов могут быть применены общее масштабирование времени, которое определяется единым многоканальным контуром деформации времени, и окна разной конфигурации. Было установлено, что даже если для оконного взвешивания разных аудиоканалов перед деформацией временной шкалы используются окна различных конфигураций, адаптация временного масштабирования контура деформации должна выполняться параллельно во избежание ухудшения слухового восприятия.

В другую аппаратную версию изобретения введен кодер звукового сигнала, генерирующий кодированное представление многоканального аудиосигнала. В конструкцию кодера акустического сигнала включен генератор кодированного представления аудиосигнала, который селективно формирует или представление звукового сигнала, содержащее общую информацию о контурах предыскажения шкалы времени, совокупно относящуюся к множеству аудиоканалов многоканального акустического сигнала, или кодированное представление аудиосигнала, содержащее индивидуальную информацию о контурах предыскажения шкалы времени, обособленно связанную с каждым из множества акустических каналов, что зависит от содержания информации, описывающего сходство или различие между контурами предыскажения шкалы времени, связанными со множеством звуковых каналов. В основе подобной реализации лежит наблюдение, что часто многие каналы многоканального акустического сигнала содержат похожие характеристики изменений основного тона. Следовательно, в некоторых случаях целесообразно вводить в кодированное представление многоканального аудиосигнала обобщенную информацию о контуре деформации времени, совокупно связанную с множеством звуковых каналов. За счет этого может быть повышена эффективность кодирования многих сигналов. Тем не менее было установлено, что для других типов сигнала (или даже для других составляющих сигнала) использовать такие общие данные деформации времени не рекомендуется. В силу этого эффективное кодирование сигнала может быть достигнуто, если кодер звукового сигнала будет распознавать сходство или различие между контурами деформации, относящимися к разным аудиоканалами. При этом определено, что следует учитывать индивидуальные контуры деформации времени, так как большое количество сигналов в значительной степени по-разному представлены во временной области или в частотной области, хотя имеют похожие контуры предыскажения шкалы времени. В связи с этим оценивание контура предыскажения шкалы времени рассматривается как новый критерий установления сходства сигналов, который служит источником данных, дополняющих информацию, получаемую только из анализа временных или частотных представлений множества аудиосигналов.

В предпочтительном варианте осуществления генератор кодированного представления аудиосигнала использует совокупную информацию о контуре деформации времени для получения деформированной в масштабе времени версии первого из аудиоканалов и для получения деформированной в масштабе времени версии второго из аудиоканалов. Далее, генератор кодированного представления аудиосигнала формирует первую очередь индивидуальных кодированных спектральных характеристик для первого из аудиоканалов, базируясь на времядеформированной версии первого звукового канала, и формирует вторую очередь индивидуальных кодированных спектральных характеристик для второго звукового канала, базируясь на времядеформированной версии второго из аудиоканалов. Такое техническое решение основано на вышеупомянутом заключении, что звуковые каналы могут иметь сильно отличающийся аудиоконтент, даже если их контуры деформации времени очень похожи. В связи с этим рекомендуется задействовать разные виды данных спектральной области, относящихся к разным аудиоканалам, даже если временная шкала этих аудиоканалов деформирована в соответствии с общими данными деформации времени. Другими словами, в основе этого технического решения лежит заключение о том, что нет строгого соответствия между сходством контуров деформации шкалы времени и аналогией представлений в частотной области различных аудиоканалов.

В другом предпочтительном конструктивном варианте кодер предназначен для обеспечения информации общего контура деформации таким образом, чтобы общий контур деформации представлял собой среднее от индивидуальных контуров деформации, характеризующих канал первого аудиосигнала и канал второго аудиосигнала.

В другой предпочтительной версии реализации изобретения генератор кодированного представления аудиосигнала обеспечивает встраивание протокольных данных в структуру кодированного представления многоканального аудиосигнала таким образом, что эти данные в каждом аудиофрейме показывают, присутствуют ли параметры деформации времени для фрейма и представлена ли для фрейма информация об общем контуре деформации времени. Сообщение о наличии данных деформации времени в конкретном фрейме обеспечивает возможность ограничения битрейта, необходимого для передачи параметров деформации временной шкалы. Было установлено, что, как правило, передача информации, описывающей множество значений контура деформации шкалы времени во фрейме, необходима, если к данному фрейму было применено предыскажение времени. Однако наряду с этим было установлено, что для многих фреймов применение предыскажения времени не дает никакие преимущества. Тем не менее расчеты показали, что рациональнее индицировать, допустим, с помощью дополнительного бита данных, наличие данных деформации времени для фрейма. Применяя такую маркировку, можно отказаться от передачи лишнего объема данных деформации шкалы времени (обычно, содержащих множество значений контура деформации шкалы времени), экономя таким образом двоичные разряды.

Следующий вариант осуществления изобретения выполняет функцию создания кодированного представления многоканального аудиосигнала. Представление многоканального аудиосигнала содержит в себе кодированное частотное представление множества аудиоканалов, деформированных по временной шкале в соответствии с общим предыскажением времени. Наряду с этим, представление многоканального аудиосигнала имеет в своем составе кодированное представление информации об общем контуре деформации времени, совокупно характеризующей аудиоканалы и общее предыскажение времени.

В предпочтительной форме исполнения кодированное представление в частотной области содержит закодированную информацию частотной области о множестве аудиоканалов, имеющих разнообразный акустический контент. Кроме того, кодированное представление данных общего контура деформации относится ко множеству аудиоканалов с различным звуковым содержимым.

В соответствии с концепцией изобретения реализуется способ формирования декодированного представления многоканального аудиосигнала на базе кодированного представления многоканального аудиосигнала. В данный метод может быть введена любая из характеристик и функциональных возможностей, описанных здесь и относящихся также к аппаратному воплощению.

Еще одним из осуществлений изобретения является способ формирования кодированного представления многоканального аудиосигнала. В данный метод может быть введена любая из характеристик и функциональных возможностей, описанных здесь и относящихся также к аппаратному воплощению.

Кроме указанных, к формам реализации данного изобретения относится компьютерная программа для осуществления вышеназванных способов.

Краткое описание фигур.

Далее, варианты технических решений в соответствии с предлагаемым изобретением будут описаны со ссылкой на прилагаемые фигуры, где:

на фиг.1 представлена принципиальная блочная схема аудиокодера предыскажения (деформации) шкалы времени;

на фиг.2 представлена принципиальная блочная схема аудиодекодера деформации (предыскажения) шкалы времени;

на фиг.3 представлена принципиальная блочная схема реализации декодера аудиосигнала в соответствии с данным изобретением;

на фиг.4 дана блок-схема осуществления способа формирования декодированного представления аудиосигнала в соответствии с данным изобретением;

на фиг.5 представлен детализированный фрагмент принципиальной блочной схемы реализации декодера аудиосигнала в соответствии с данным изобретением;

на фиг.6 дан детализированный фрагмент блок-схемы осуществления способа формирования декодированного представления аудиосигнала в соответствии с данным изобретением;

на фиг.7а, 7b графически отображен процесс реконструкции контура деформации (предыскажения) шкалы времени при реализации данного изобретения;

на фиг.8 графически отображен другой пример реконструкции контура деформации (предыскажения) шкалы времени в соответствии с данным изобретением;

на фиг.9а и 9b представлены алгоритмы вычисления контура предыскажения (деформации) шкалы времени;

на фиг.9с приведена таблица перевода индексов отношений деформации времени в значения коэффициентов деформации времени;

на фиг.10а и 10b представлены алгоритмы расчета изохроны, шага дискретизации, длины перехода, „первой позиции" и „последней позиции";

на фиг.10с представлены алгоритмы расчета конфигурации окна;

на фиг.10d и 10е представлены алгоритмы приложения окна;

на фиг.10f представлены алгоритмы варьируемой во времени передискретизации;

на фиг.10g графически представлены алгоритмы обработки фреймов после временной деформации и алгоритмы наложения и сложения;

на фиг.11а и 11b даны условные обозначения;

на фиг.12 представлена изохрона, которая может быть извлечена из контура предыскажения (деформации) шкалы времени;

на фиг.13 представлена подробная принципиальная блочная схема устройства формирования контура предыскажения(деформации) в соответствии с данным изобретением;

на фиг.14 представлена принципиальная блочная схема другого варианта решения декодера аудиосигнала в соответствии с данным изобретением;

на фиг.15 представлена принципиальная блочная схема другого варианта решения вычислителя контура предыскажения (деформации) шкалы времени в соответствии с данным изобретением;

на фиг.16а, 16b приведены графики, отображающие процесс вычисления значений узлов

деформации шкалы времени в соответствии с данным изобретением;

на фиг.17 представлена принципиальная блочная схема варианта решения кодера

аудиосигнала в соответствии с данным изобретением;

на фиг.18 представлена принципиальная блочная схема варианта исполнения декодера

аудиосигнала в соответствии с данным изобретением; и

на фиг.19a-19f представлены элементы синтаксиса звукового потока в рамках осуществления настоящего изобретения;

Подробное техническое описание

1. Аудиокодер предыскажения шкалы времени в соответствии с фиг.1

Поскольку предлагаемое изобретение относится к кодированию и декодированию звуковых сигналов с предыскажением временной шкалы, следует кратко проанализировать прототип аудиокодера и аудиодекодера деформации временной шкалы, где может быть применено изобретение.

На фиг.1 представлена принципиальная блочная схема аудиокодера предыскажения шкалы времени, в котором могут быть применены некоторые подходы и конструктивные решения изобретения. Кодер аудиосигнала 100 на фиг.1 предназначен для приема входного аудиосигнала 110 и формирования кодированного представления входного аудиосигнала 110 в виде последовательности фреймов. Аудиокодер 100 включает в себя дискретизатор 104, предназначенный для дискретизации (входного) аудиосигнала 110 с образованием блоков сигнала (отсчетов) 105, используемых как материал для преобразования в частотную область. Далее, аудиокодер 100 включает в себя вычислитель окон преобразования 106, предназначенный для формирования окон масштабирования для отсчетов дискретного представления 105, передаваемого с выхода дискретизатора 104. Эти отсчеты вводятся в оконный преобразователь 108, предназначенный для приложения окон масштабирования к отсчетам дискретного представления 105, генерируемым дискретизатором 104. В некоторых версиях исполнения аудиокодер 100 может дополнительно содержать преобразователь в частотную область 108а, предназначенный для формирования частотного представления (например, в виде коэффициентов преобразования) масштабированных дискретов 105. Составляющие частотного представления могут быть обработаны или переданы дальше в виде кодированного представления аудиосигнала 110.

Кроме того, аудиокодер 100 задействует контур основного тона 112 аудиосигнала 110, который может быть введен в аудиокодер 100 или который может быть сгенерирован аудиокодером 100. Соответственно, аудиокодер 100 может быть произвольно оснащен оценивателем частоты основного тона, предусматривающим вычисление контура основного тона 112. Дискретизатор 104 может обрабатывать непрерывный входной аудиосигнал 110. И наоборот, дискретизатор 104 может обрабатывать уже дискретизированный входной аудиосигнал 110. В последнем случае, дискретизатор 104 может передискретизировать звуковой сигнал 110. Дискретизатор 104, например, может быть рассчитан на предыскажение временной шкалы смежных перекрывающихся аудиоблоков с получением на участке наложения постоянной частоты основного тона или снижения колебаний частоты основного тога внутри каждого входного блока после дискретизации.

Вычислитель окон преобразования 106 рассчитывает окна масштабирования для аудиоблоков в зависимости от предыскажения шкалы времени, выполненного дискретизатором 104. Для этого как опция может быть введен блок установки шага дискретизации 114, задающий дискретизатору правило предыскажения временной шкалы, которое затем также передается на вычислитель окон преобразования 106. Возможен вариант реализации, при котором блок настройки шага дискретизации 114 исключен, а контур основного тона 112 напрямую пересылается на вычислитель окон преобразования 106, который самостоятельно выполняет соответствующие вычисления. Более того, дискретизатор 104 может передавать примененные параметры дискретизации на вычислитель окон преобразования 106 для обеспечения вычисления соответствующих окон масштабирования.

Предыскажение шкалы времени осуществляется таким образом, что контур основного тона дискретизированных аудиоблоков, деформированный по времени и разбитый на отсчеты дискретизатором 104, более устойчив, чем контур основного тона исходного звукового сигнала 110 на входном терминале.

2. Аудиодекодер деформации шкалы времени в соответствии с фиг.2

На фиг.2 представлена принципиальная блочная схема декодера деформированного по шкале времени аудиосигнала 200, предназначенного для обработки первого деформированного по времени и дискретизированного или просто деформированного по времени представления первого и второго фрейма аудиосигнала, состоящего из последовательности фреймов, в которой второй фрейм следует за первым фреймом, и для последующей обработки второго деформированного по времени представления второго фрейма и третьего фрейма, следующего за вторым фреймом в последовательности фреймов. Аудиодекодер 200 включает в себя вычислитель окон преобразования 210, предназначенный для формирования первого окна масштабирования для первого деформированного по времени представления 211а с использованием данных контура основного тона 212 первого и второго фрейма и для формирования второго окна масштабирования для второго деформированного по времени представления 211b с использованием данных контура основного тона второго и третьего фрейма, где окна масштабирования могут иметь одинаковый по количеству набор отсчетов и где первый набор отсчетов, используемый для затухания первого окна масштабирования, может отличаться от второго набора отсчетов, используемого для наплыва второго окна масштабирования. Далее, аудиодекодер 200 включает в себя оконный преобразователь 216, предназначенный для приложения первого окна масштабирования к первому представлению деформации временной шкалы и для приложения второго окна масштабирования ко второму деформированному по времени представлению. Кроме того, аудиодекодер 200 включает в себя передискретизатор 218, предназначенный для выполнения обратной деформации временной шкалы первого масштабированного деформированного по времени представления с целью формирования первого дискретного представления с использованием данных контура основного тона первого и второго фрейма и для обратной деформации временной шкалы второго масштабированного представления с целью формирования второго дискретного представления с использованием данных контура основного тона второго и третьего фрейма таким образом, что фрагмент первого дискретного представления, соответствующий второму фрейму, включает в себя контур основного тона, в пределах заданной области допустимых значений равный контуру основного тона фрагмента второго дискретного представления, соответствующего второму фрейму. Для генерации окна масштабирования вычислитель окон преобразования 210 получает или непосредственно контур основного тона 212, или данные деформации временной шкалы от вспомогательного блока установки шага дискретизации 220, который принимает контур основного тона 212 и который рассчитывает стратегию обратной деформации шкалы времени таким образом, чтобы позиции на линейной временной шкале отсчетов, относящихся к участкам наложения, были идентичны или почти идентичны и равноудалены, выравнивая основной тон на участках перекрывания; при этом факультативно длины участков затухания в перекрываемых зонах окон, разновеликие до выполнения обратной деформации временной шкалы, после обратной деформации шкалы времени становятся равными.

Дополнительно аудиодекодер 200 имеет в своем составе вспомогательный сумматор 230, предназначенный для сложения фрагмента первого дискретного представления, соответствующего второму фрейму, и фрагмента второго дискретного представления, соответствующего второму фрейму, с получением реконструированного представления второго фрейма аудиосигнала в качестве выходного сигнала 242. Первое представление с деформацией временной шкалы и второе представление с деформацией временной шкалы в одной из аппаратных версий могут быть переданы как входной сигнал на аудиодекодер 200. В другом конструктивном исполнении аудиодекодер 200 может, по усмотрению, включать в себя обратный частотный преобразователь 240, который рассчитывает первое и второе деформированные по времени представления на основе частотных представлений первого и второго деформированных по времени представлений, поступающих на вход обратного частотного преобразователя 240.

3. Декодер деформированного по времени аудиосигнала в соответствии с фиг.3

Ниже рассматривается упрощенная конструкция декодера аудиосигнала. На фиг.3 представлена принципиальная блочная схема такого упрощенного декодера звукового сигнала 300. Декодер аудиосигнала 300 получает кодированное представление аудиосигнала 310 и на его основе формирует декодированное представление аудиосигнала 312, причем кодированное представление аудиосигнала 310 содержит данные эволюции контура предыскажения шкалы времени. Декодер аудиосигнала 300 включает в себя вычислитель контура деформации шкалы времени 320, генерирующий данные контура деформации шкалы времени 322 на основе данных эволюции контура предыскажения шкалы времени, описывающих прохождение во времени траектории контура предыскажения временной шкалы и входящих в кодированное представление аудиосигнала 310. При извлечении параметров контура деформации шкалы времени 322 из данных эволюции предыскажения времени 316 (312) вычислитель контура деформации шкалы времени 320 многократно выполняет рестарт от заданного начального значения контура деформации шкалы времени, что будет подробно описано далее. Вследствие таких перезапусков в контуре деформации шкалы времени могут возникнуть скачки (ступенчатые изменения, превышающие шаг кодированных данных эволюции предыскажения времени 312). Далее, декодер аудиосигнала 300 включает в себя блок перемасштабирования (рескейлер - см. Internet) данных контура деформации шкалы времени 330, предназначенный для перемасштабирования, по меньшей мере, части данных контура деформации шкалы времени 322 для предотвращения, сокращения или устранения скачков рестартов, возникших при вычислении контура деформации временной шкалы, в перемасштабированной версии 332 контура деформации шкалы времени.

Декодер аудиосигнала 300 также включает в себя декодер деформации 340, предназначенный для формирования декодированного представления аудиосигнала 312 на основе кодированного представления аудиосигнала 310 с использованием перемасштабированной версии 332 контура деформации шкалы времени.

Рассматривая декодер аудиосигнала 300 в контексте декодирования аудиосигнала с деформированной шкалой времени, следует отметить, что кодированное представление аудиосигнала 310 может содержать кодированное представление коэффициентов преобразования 211, а также кодированное представление контура основного тона 212 (называемого также контуром деформации (предыскажения) шкалы времени). Вычислитель контура деформации шкалы времени 320 и блок перемасштабирования данных контура деформации шкалы времени 330 предусматривают возможность реконструкции представления контура основного тона 212 в форме перемасштабированной версии 332 контура деформации шкалы времени. Декодер деформации 340 может, например, принять на себя выполнение функций оконного преобразования 216, передискретизации 218, установки частоты дискретизации 220 и задания формы окна 210. Кроме того, декодер деформации 340 может, в частности, в качестве опции включать в свои фу