Устройство обработки аудиосигнала, способ обработки аудиосигнала и программа обработки аудиосигнала

Иллюстрации

Показать все

Изобретение относится к обработке аудиосигналов. Технический результат – уменьшение разрыва аудио при восстановлении пакета в начальной точке аудио и повышение субъективного качества аудио. Устройство обработки аудиосигнала содержит обнаружитель разрыва, сконфигурированный для определения появления разрыва исходя из внезапного повышения амплитуды декодированного аудио, полученного путем декодирования первого пакета аудио, который принят корректно после появления потери пакета, и корректор разрыва для корректирования разрыва декодированного аудио. 12 н. и 10 з.п. ф-лы, 32 ил.

Реферат

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

[0001] Настоящее изобретение относится к устройству обработки аудиосигнала, способу обработки аудиосигнала и программе обработки аудиосигнала, предназначенным для обработки аудиосигнала.

УРОВЕНЬ ТЕХНИКИ

[0002] В передаче кодированного и пакетизированного аудиосигнала через сеть Интернет с помощью телефонии по IP-протоколу (протокол Internet), пакет может быть потерян из-за перегрузки в сети или подобного (это явление будет именоваться в дальнейшем "потеря пакетов"). При появлении потери пакетов теряются необходимые коды аудио, приводя к неудаче в декодировании аудио, тем самым вызывая разрыв (непрерывности) аудио. Технологией для предотвращения разрыва аудио, обусловленного потерей пакетов, является технология маскирования потери пакетов аудио. Технология маскирования потери пакетов аудио разработана, чтобы обнаруживать потерю пакетов и генерировать соответствующий потерянному пакету псевдо аудиосигнал (который будет именоваться в дальнейшем "сигнал маскирования").

[0003] Если используемой методикой кодирования аудио является методика выполнения кодирования аудио с обновлением при этом внутренних состояний кодера/декодера, параметры кодирования, которые подлежат приему изначально, не получают, и таким образом методика маскирования потери пакета аудио также включает в себя выполнение обновления внутренних состояний декодера при помощи искусственно формируемых параметров.

[0004] Кодирование по способу CELP (линейное предсказание с кодовым возбуждением) широко используется в качестве методики для выполнения кодирования аудио с обновлением при этом внутреннего состояния кодера/декодера. В кодировании CELP принята авторегрессионная модель, и сигнал e(n) возбуждения фильтруют полюсным синтезирующим фильтром a(i), чтобы синтезировать аудиосигнал. То есть, аудиосигнал s(n) синтезируют согласно уравнению ниже. В уравнении ниже a(i) представляет коэффициенты линейного предсказания (коэффициенты LP (линейное предсказание)), и степень, подлежащая использованию, имеет значение, такое как P=16.

[Математическое уравнение 1]

[0005] В кодировании по CELP сохраняемые внутренние состояния включают в себя параметры ISF (спектральная частота иммитанса) в качестве математически эквивалентного представления коэффициентов линейного предсказания и прошлый сигнал возбуждения. При появлении потери пакета параметры формируются искусственно, и возникает отклонение от исходных параметров, которые получили бы путем декодирования. Несогласованность (нестабильность) синтезированного аудио, обусловленная отклонением параметров, воспринимается слушателем как шум, каковое значительно ухудшает субъективное качество.

[0006] Параграфы ниже представят конфигурацию и работу декодера аудио для выполнения маскирования потери пакетов аудио, используя пример, где кодирование по CELP используется в качестве способа кодирования аудио.

[0007] Схема конфигурации и работа декодера аудио показаны на Фиг.1 и Фиг.2. Как показано на Фиг.1, декодер 1 аудио имеет в составе обнаружитель 11 потери пакета, декодер 12 кода аудио, генератор 13 сигнала маскирования и буфер 14 внутренних состояний.

[0008] Обнаружитель 11 потери пакета, при корректном приеме пакета аудио, посылает управляющий сигнал и коды аудио, включенные в пакет аудио, на декодер 12 кода аудио (нормальный прием: ДА на этапе S100 на Фиг.2). После этого, декодер 12 кода аудио выполняет декодирование кодов аудио и обновление внутренних состояний, как описано ниже (этапы S200 и S400 на Фиг.2). С другой стороны, обнаружитель 11 потери пакета при неудаче корректного приема пакета аудио посылает управляющий сигнал на генератор 13 сигнала маскирования (потеря пакета: НЕТ на этапе S100 на Фиг.2). После этого, генератор 13 сигнала маскирования генерирует сигнал маскирования и обновляет внутренние состояния, как описано ниже (этапы S300 и S400 на Фиг.2). Процессы этапов S100-S400 на Фиг.2 повторяют до конца связи (или пока этап S500 не приведет к определению ДА).

[0009] Коды аудио включают в себя, по меньшей мере, кодированные параметры ISF

[Математическое уравнение 2]

,

кодированные задержки Tjp основного тона для первого - четвертого подкадров, кодированные коэффициенты усиления gjp адаптивной кодовой книги для первого - четвертого подкадров, кодированные коэффициенты усиления gjc фиксированной кодовой книги для первого - четвертого подкадров и кодированные векторы cj(n) фиксированной кодовой книги для первого - четвертого подкадров. Параметры ISF могут быть заменены параметрами LSF (частота спектральных линий), которые являются математически эквивалентным их представлением. Хотя обсуждение ниже использует параметры ISF, такое же обсуждение также может быть справедливым для случая использования параметров LSF.

[0010] Буфер внутренних состояний включает в себя прошлые параметры ISF

[Математическое уравнение 3]

,

и, в качестве эквивалентного представления

[Математическое уравнение 4]

,

параметры ISP (спектральная пара иммитанса)

[Математическое уравнение 5]

,

параметры разности ISF

[Математическое уравнение 6]

,

прошлые задержки Tjp основного тона, прошлые коэффициенты усиления gjp адаптивной кодовой книги, прошлые коэффициенты усиления gjc фиксированной кодовой книги и адаптивную кодовую книгу u(n). В зависимости от принципа проектного решения определено, сколько подкадров прошлых параметров должно быть включено. В настоящем описании полагают, что один кадр включает в себя четыре подкадра, но может быть принято другое значение в зависимости от принципа проектного решения.

[0011] <Случай нормального приема>

Фиг.3 показывает примерную функциональную конфигурацию декодера 12 кода аудио. Как показано на этой Фиг.3, декодер 12 кода аудио имеет в составе декодер 120 ISF, процессор 121 обеспечения стабильности, вычислитель 122 коэффициентов LP, вычислитель 123 адаптивной кодовой книги, декодер 124 фиксированной кодовой книги, декодер 125 коэффициентов усиления, синтезатор 126 вектора возбуждения, постфильтр 127 и синтезирующий фильтр 128. Следует отметить, однако, что постфильтр 127 не является обязательным составляющим элементом. На Фиг.3 для удобства пояснения буфер 14 внутренних состояний обозначен двухточечной линией внутри декодера 12 кода аудио. Однако буфер 14 внутренних состояний не включается в состав декодера 12 кода аудио, а в действительности является непосредственно буфером 14 внутренних состояний, показанным на Фиг.1. То же является справедливым в схемах конфигурации декодера кода аудио в дальнейшем.

[0012] Схема конфигурации вычислителя 122 коэффициентов LP показана на Фиг.4, и последовательность обработки для вычисления коэффициентов LP из кодированных параметров ISF показана на Фиг.5. Как показано на Фиг.4, вычислитель 122 коэффициентов LP имеет в составе преобразователь 122A ISF-ISP, интерполятор 122B ISP и преобразователь 122C ISP-LPC.

[0013] Сначала описываются функциональная конфигурация и ее работа, связанная с процессом вычисления коэффициентов LP из кодированных параметров ISF (Фиг.5).

[0014] Декодер 120 ISF декодирует кодированные параметры ISF, чтобы получить параметры разности ISF

[Математическое уравнение 7]

и вычисляет параметры ISF

[Математическое уравнение 8]

в соответствии со следующим уравнением (этап S1 на Фиг.5). Здесь, meani представляет векторы средних значений, полученные предварительно путем обучения или подобного.

[Математическое уравнение 9]

[0015] Здесь описывается пример использования предсказания на основе MA (скользящего среднего) для вычисления параметров ISF, но также является возможным принять конфигурацию, чтобы выполнять вычисление параметров ISF, используя предсказание на основе AR (авторегрессионной модели), как описано ниже. Здесь, параметры ISF непосредственно предшествующего кадра обозначены через

[Математическое уравнение 10]

и весовые коэффициенты предсказания AR - через ρi.

[Математическое уравнение 11]

[0016] Процессор 121 обеспечения стабильности выполняет обработку согласно уравнению ниже с тем, чтобы установить расстояние не менее чем 50 Гц между элементами параметров ISF для того, чтобы гарантировать стабильность фильтра (этап S2 на Фиг.5). Параметры ISF указывают линейчатый спектр, представляющий форму огибающей спектра звукового сигнала, и если расстояние между ними уменьшается, то пики спектра становятся больше, вызывая резонанс. По этой причине становится необходимым процесс, чтобы гарантировать стабильность для предотвращения, что коэффициентов усиления на пиках спектра становятся слишком большими. Здесь, min_dist представляет минимальное расстояние ISF, и isf_min представляет минимальное значение ISF, необходимое для обеспечения безопасности расстояния min_dist. Значение isf_min последовательно обновляют путем прибавления расстояния min_dist к значению соседнего ISF. С другой стороны, isf_max представляет максимальное значение ISF, необходимое для обеспечения безопасности расстояния min_dist. Значение isf_max последовательно обновляют путем вычитания расстояния min_dist из значения соседнего ISF.

[Математическое уравнение 12]

[0017] Преобразователь 122A ISF-ISP в вычислителе 122 коэффициентов LP преобразовывает

[Математическое уравнение 13]

в параметры ISP

[Математическое уравнение 14]

в соответствии со следующим уравнением (этап S3 на Фиг.5). Здесь, C является константой, определенной предварительно.

[Математическое уравнение 15]

[0018] Интерполятор 122B ISP вычисляет параметры ISP для соответственных подкадров из прошлых параметров ISP

[Математическое уравнение 16]

,

включенных в буфер 14 внутренних состояний, и предшествующих параметров ISP

[Математическое уравнение 17]

в соответствии с уравнением ниже (этап S4 на Фиг.5). Могут использоваться другие коэффициенты для интерполяции.

[Математическое уравнение 18]

[0019] Преобразователь 122C ISP-LPC преобразовывает параметры ISP для соответственных подкадров в коэффициенты LP

[Математическое уравнение 19]

(этап S5 на Фиг.5). Конкретная процедура преобразования, подлежащая использованию, может быть процедурой обработки, описанной в Непатентной литературе 1. Число подкадров, включенных в упреждающий сигнал, предполагается равным 4 при этом, но число подкадров может отличаться в зависимости от принципа проектного решения.

[0020] Затем описываются другие конфигурации и операции в декодере 12 кода аудио.

[0021] Вычислитель 123 адаптивной кодовой книги декодирует кодированные задержки основного тона, чтобы вычислить задержки TjP основного тона для первого - четвертого подкадров. Затем, вычислитель 123 адаптивной кодовой книги использует адаптивную кодовую книгу u(n), чтобы вычислить векторы адаптивной кодовой книги для соответственных подкадров в соответствии с уравнением ниже. Векторы адаптивной кодовой книги вычисляют путем интерполирования адаптивной кодовой книги u(n) фильтром Int(i) с конечной импульсной характеристикой (КИХ-фильтром). Здесь длина адаптивной кодовой книги обозначена через Nadapt. Фильтр Int(i), используемый для интерполяции, является КИХ-фильтром предварительно определенной длины 2l+1, и L' представляет объем выборки подкадров. При использовании интерполяционного фильтра Int(i), задержки основного тона можно использовать с точностью десятичных разрядов. Относительно подробностей интерполяционного фильтра можно обратиться к способу, описанному в Непатентной литературе 1.

[Математическое уравнение 20]

[0022] Декодер 124 фиксированной кодовой книги декодирует кодированные векторы фиксированной кодовой книги, чтобы извлечь векторы фиксированной кодовой книги cj(n) для первого - четвертого подкадров.

[0023] Декодер 125 коэффициентов усиления декодирует кодированные коэффициенты усиления адаптивной кодовой книги и кодированные коэффициенты усиления фиксированной кодовой книги, чтобы получить коэффициенты усиления адаптивной кодовой книги и коэффициенты усиления фиксированной кодовой книги для первого - четвертого подкадров. Например, декодирование коэффициентов усиления адаптивной кодовой книги и коэффициентов усиления фиксированной кодовой книги может выполняться посредством, например, приведенного ниже способа, описанного в Непатентной литературе 1. Поскольку приведенный ниже способ, описанный в Непатентной литературе 1, не использует межкадровое предсказание, как используется в кодировании коэффициентов усиления в адаптивном многоскоростном широкополосном кодеке (AMR-WB), это может повысить стойкость к потере пакетов.

[0024] Например, декодер 125 коэффициентов усиления извлекает коэффициенты усиления фиксированной кодовой книги в соответствии с последовательностью обработки ниже.

[0025] Во-первых, декодер 125 коэффициентов усиления вычисляет энергию вектора фиксированной кодовой книги. Здесь, длина подкадра задается как Ns.

[Математическое уравнение 21]

[0026] Затем, декодер 125 коэффициентов усиления декодирует параметр векторно-квантованого коэффициента усиления, чтобы извлечь коэффициент усиления адаптивной кодовой книги

[Математическое уравнение 22]

и квантованный коэффициент усиления фиксированной кодовой книги

[Математическое уравнение 23]

.

Он затем вычисляет коэффициент предсказания усиления фиксированной кодовой книги, как описано ниже, из квантованного коэффициента усиления фиксированной кодовой книги и вышеуказанной энергии вектора фиксированной кодовой книги.

[Математическое уравнение 24]

[0027] В заключение, декодер 125 коэффициентов усиления декодирует коэффициент предсказания

[Математическое уравнение 25]

и умножает его на коэффициент предсказания усиления, чтобы получить коэффициенты усиления фиксированной кодовой книги.

[Математическое уравнение 26]

[0028] Синтезатор 126 вектора возбуждения умножает вектор адаптивной кодовой книги на коэффициент усиления адаптивной кодовой книги и умножает вектор фиксированной кодовой книги на коэффициент усиления фиксированной кодовой книги, и вычисляет их сумму, чтобы получить сигнал возбуждения, как выражено следующим уравнением.

[Математическое уравнение 27]

[0029] Постфильтр 127 подвергает векторы сигналов возбуждения, например, операциям постобработки, таким как процессы повышения основного тона, повышения шума и повышения низкой частоты. Повышение основного тона, повышение шума и повышение низкой частоты могут осуществляться с использованием способов, описанных в Непатентной литературе 1.

[0030] Синтезирующий фильтр 128 синтезирует декодированный сигнал с сигналом возбуждения в качестве ведущего источника звука путем обратной фильтрации с линейным предсказанием.

[Математическое уравнение 28]

[0031] Если в кодере вносятся предыскажения, выполняют компенсацию предыскажений.

[Математическое уравнение 29]

[0032] С другой стороны, если предыскажения не вводятся в кодере, компенсацию предыскажений не выполняют.

[0033] Параграфы ниже будут иллюстрировать работу относительно обновления внутреннего состояния.

[0034] Чтобы интерполировать параметр по появлению потери пакета, вычислитель 122 коэффициентов LP обновляет внутренние состояния параметров ISF векторами, вычисленными согласно следующему уравнению.

[Математическое уравнение 30]

[0035] Здесь, ωi(-j) представляет параметры ISF j предшествующих кадров, которые сохранены в буфере. ωiC представляет параметры ISF в интервалах речи, полученные предварительно путем обучения или подобного. β является константой и может быть значением, например, 0,75, которым значение не обязательно ограничивается. ωiC и β могут быть изменяющимися по индексу для выражения характеристики целевого кадра кодирования, например, как в маскировании ISF, описанном в Непатентной литературе 1.

[0036] Кроме того, вычислитель 122 коэффициентов LP также обновляет внутренние состояния параметров разности ISF в соответствии со следующим уравнением.

[Математическое уравнение 31]

[0037] Синтезатор 126 вектора возбуждения обновляет внутренние состояния векторами сигнала возбуждения в соответствии с уравнением ниже.

[Математическое уравнение 32]

[0038] Кроме того, синтезатор 126 вектора возбуждения обновляет внутренние состояния параметров усиления согласно следующему уравнению.

[Математическое уравнение 33]

[0039] Вычислитель 123 адаптивной кодовой книги обновляет внутренние состояния параметров задержек основного тона согласно следующему уравнению.

[Математическое уравнение 34]

Область значений j задается как , но могут выбираться другие значения в качестве области значений j в зависимости от принципов проектного решения.

[0040] <Случай потери пакета>

Фиг.6 изображает примерную функциональную конфигурацию генератора 13 сигнала маскирования. Как показано на этой Фиг.6, генератор 13 сигнала маскирования имеет в составе интерполятор 130 коэффициентов LP, интерполятор 131 задержки основного тона, интерполятор 132 коэффициентов усиления, генератор 133 шумового сигнала, постфильтр 134, синтезирующий фильтр 135, вычислитель 136 адаптивной кодовой книги и синтезатор 137 вектора возбуждения. Следует отметить, однако, что постфильтр 134 не является обязательным составляющим элементом.

[0041] Интерполятор 130 коэффициентов LP вычисляет

[Математическое уравнение 35]

согласно следующему уравнению. В этом отношении ωi(-j) представляет параметры ISF j предшествующих кадров, которые сохранены в буфере.

[Математическое уравнение 36]

В этом уравнении,

[Математическое уравнение 37]

представляет внутренние состояния параметров ISF, вычисленных при нормальном приеме пакета. α также является константой и может иметь значение, например, 0,9, каковым значение обязательно не ограничивается. α может быть изменяющимся по индексу для выражения характеристики целевого кадра кодирования, например, как в маскировании ISF, описанном в Непатентной литературе 1.

[0042] Процедура получения коэффициентов LP из параметров ISF является такой же, как выполняемая в случае нормального приема пакета.

[0043] Интерполятор 131 задержки основного тона использует параметры внутреннего состояния о задержках основного тона

[Математическое уравнение 38]

,

чтобы вычислять предсказанные значения задержки основного тона

[Математическое уравнение 39]

.

Конкретная процедура обработки, подлежащая использованию, может быть способом, раскрытым в Непатентной литературе 1.

[0044] Чтобы интерполировать коэффициенты усиления фиксированной кодовой книги, интерполятор 132 коэффициентов усиления может использовать способ согласно уравнению ниже, как описано в Непатентной литературе 1.

[Математическое уравнение 40]

[0045] Генератор 133 шумового сигнала генерирует белый шум для векторов такой же длины, как векторы фиксированной кодовой книги, и использует результирующий шум для векторов фиксированной кодовой книги.

[0046] Действия постфильтра 134, синтезирующего фильтра 135, вычислителя 136 адаптивной кодовой книги и синтезатора 137 вектора возбуждения являются одинаковыми с таковыми в вышеуказанном случае нормального приема пакета.

[0047] Обновление внутреннего состояния является таким же, как выполняемое в случае нормального приема пакета, кроме обновления параметров разности ISF. Обновление параметров ISF выполняют в соответствии со следующим уравнением посредством интерполятора 130 коэффициентов LP.

[Математическое уравнение 41]

Перечень ссылок

Патентная литература

[0048] Патентная литература 1: Международная публикация WO 2002/035520

Патентная литература 2: Международная публикация WO 2008/108080

Непатентная литература

[0049] Непатентная литература 1: Рекомендации G.718 Международного союза электросвязи - сектора телекоммуникаций (ITU-T), июнь 2008

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Техническая задача изобретения

[0050] Как описано выше, поскольку кодирование по CELP предусматривает внутренние состояния, ухудшение качества звука происходит из-за отклонения значений между параметрами, получаемыми интерполяциями, реализуемыми при потере пакетов, и параметрами, которые использовались бы для декодирования. В частности, относительно параметров ISF, выполняется внутрикадровое/межкадровое кодирование с предсказанием, и таким образом имеется проблема, что влияние потери пакета продолжается даже после восстановления после потери пакета.

[0051] Более конкретно, проблему внезапного повышения энергии идентифицируют в первом кадре после восстановления после потери пакета, происходящей вблизи начальной порции аудио. Это обусловлено следующей причиной: то есть, в начальной порции аудио, где энергия сигнала возбуждения становится высокой, импульсная характеристика для коэффициентов LP, вычисленных из коэффициентов ISF, полученных путем процесса интерполяции при потере пакета, имеет более высокое усиление, чем таковое, которое первоначально ожидалось для декодера. Это воспринимается, согласно стандарту субъективного качества, как неприятный разрыв непрерывности аудио.

[0052] Способ, описанный в Патентной литературе 1, формирует интерполированные коэффициенты ISF для потерянного кадра. Однако поскольку параметры ISF формируются посредством процесса нормального декодирования для первого кадра после восстановления после потери, это не устраняет внезапное повышение энергии.

[0053] С другой стороны, способ, описанный в Патентной литературе 2, передает параметр регулировки усиления (энергию нормированной разности предсказания), полученный на стороне кодирования, и использует его для регулировки энергии на стороне декодирования, посредством этого управляя энергией сигнала возбуждения для кадра потерянного пакета и давая возможность предотвращения внезапного повышения энергии.

[0054] Фиг.7 изображает примерную функциональную конфигурацию декодера 1X аудио, реализованного по технологии Патентной литературы 2, и Фиг.8 изображает примерную функциональную конфигурацию генератора 13X сигнала маскирования. В Патентной литературе 2 пакет аудио включает в себя вспомогательную информацию, по меньшей мере, энергию нормированной разности предсказания в дополнение к параметрам, описанным в общепринятом способе.

[0055] Декодер 15 энергии нормированной разности предсказания, обеспеченный в генераторе 1X аудиосигнала, декодирует вспомогательную информацию энергии нормированной разности предсказания из принятого пакета аудио, чтобы вычислить опорную энергию нормированной разности предсказания, и выводит ее на генератор 13X сигнала маскирования.

[0056] Поскольку составляющие элементы генератора 13X сигнала маскирования, отличные от блока 138 регулировки нормированной разности предсказания, являются одинаковыми с таковыми в вышеуказанной общепринятой технологии, только блок 138 регулировки нормированной разности предсказания будет описан ниже.

[0057] Блок 138 регулировки нормированной разности предсказания вычисляет энергию нормированной разности предсказания из коэффициентов LP, выводимых интерполятором 130 коэффициентов LP. Затем, блок 138 регулировки нормированной разности предсказания вычисляет коэффициент регулировки усиления синтезирующего фильтра, используя энергию нормированной разности предсказания, и опорную энергию разности предсказания. В заключение, блок 138 регулировки нормированной разности предсказания умножает сигнал возбуждения на коэффициент регулировки усиления синтезирующего фильтра и выводит результат на синтезирующий фильтр 135.

[0058] Вышеописанная методика по Патентной литературе 2 может управлять энергией сигнала маскирования по появлению потери пакета таким же образом, как выполняемый в нормальном приеме. Однако трудно обеспечить битовую скорость, необходимую для передачи вышеупомянутого параметра регулировки усиления в процессе кодирования аудио с низкой битовой скоростью. Кроме того, поскольку это является обработкой в генераторе сигнала маскирования, трудно рассматривать внезапное изменение энергии, вызванное несогласованностью параметров ISF в кадре восстановления.

[0059] Задача настоящего изобретения состоит, следовательно, в уменьшении разрыва аудио, который может происходить при восстановлении после потери пакета в начальной точке аудио, и посредством этого - в повышении субъективного качества.

Решение технической задачи изобретения

[0060] Устройство обработки аудиосигнала согласно одному варианту осуществления настоящего изобретения содержит: обнаружитель разрыва, сконфигурированный, чтобы определять появление разрыва, происходящего с внезапным повышением амплитуды декодированного аудио, полученного путем декодирования первого пакета аудио, который принят корректно после появления потери пакета; и корректор разрыва, сконфигурированный, чтобы корректировать разрыв декодированного аудио.

[0061] Обнаружитель разрыва может определять появление разрыва декодированного аудио с помощью энергии сигнала возбуждения.

[0062] Обнаружитель разрыва может обнаруживать появление разрыва декодированного аудио с помощью квантованных коэффициентов усиления кодовой книги, используемых для вычисления сигнала возбуждения.

[0063] Устройство обработки аудиосигнала может дополнительно содержать: декодер вспомогательной информации, сконфигурированный для декодирования переданной от кодера вспомогательной информации для определения появления разрыва, и обнаружитель разрыва может определять появление разрыва декодированного аудио, используя декодированную вспомогательную информацию, и выводить в виде кода вспомогательной информации посредством декодера вспомогательной информации.

[0064] Корректор разрыва может корректировать параметры ISF или параметры LSF (именуемые в дальнейшем "параметры ISF/LSF") согласно результату определения появления разрыва.

[0065] Более конкретно, корректор разрыва может увеличивать расстояние между элементами параметров ISF/LSF, задаваемое для обеспечения стабильности синтезирующего фильтра, согласно результату определения появления разрыва.

[0066] В этот момент корректор разрыва может увеличить расстояние между элементами параметров ISF/LSF, задаваемое для обеспечения стабильности синтезирующего фильтра, чтобы сделать его большим, чем обычное расстояние, задаваемое для обеспечения стабильности.

[0067] Для расстояния между элементами параметров ISF/LSF, задаваемого для обеспечения стабильности синтезирующего фильтра, корректор разрыва может использовать расстояние, которое получают посредством равного деления параметров ISF/LSF на таковые предварительно определенной длины.

[0068] Кроме того, корректор разрыва может заменить часть или все из параметров ISF/LSF предварительно определенными векторами.

[0069] Устройство обработки аудиосигнала согласно одному варианту осуществления настоящего изобретения содержит: квантователь ISF/LSF, сконфигурированный для квантования параметров ISF/LSF; блок маскирования ISF/LSF, сконфигурированный, чтобы формировать маскирующие параметры ISF/LSF, которые являются информацией маскирования для параметров ISF/LSF; обнаружитель разрыва, сконфигурированный, чтобы определять появление разрыва, имеющего место в первом пакете аудио, который принят корректно после появления потери пакета, используя расстояния между квантованными параметрами ISF/LSF, полученными в процессе квантования квантователем ISF/LSF, и маскирующими параметрами ISF/LSF, сформированными блоком маскирования ISF/LSF; и кодер вспомогательной информации, сконфигурированный для кодирования вспомогательной информации для определения появления разрыва.

[0070] Устройство обработки аудиосигнала согласно одному варианту осуществления настоящего изобретения содержит: обнаружитель разрыва, сконфигурированный, чтобы определять появление разрыва, имеющего место в первом пакете аудио, который принят корректно после появления потери пакета; кодер вспомогательной информации, сконфигурированный для кодирования вспомогательной информации для определения появления разрыва; и квантователь ISF/LSF, сконфигурированный для использования прошлых квантованных параметров разности ISF/LSF для квантования ISF/LSF в данном кадре, когда обнаружитель разрыва не определяет появление разрыва, и предотвращения использования прошлых квантованных параметров разности ISF/LSF для квантования ISF/LSF в данном кадре, когда обнаружитель разрыва определяет появление разрыва.

[0071] Устройство обработки аудиосигнала согласно одному варианту осуществления настоящего изобретения содержит: декодер вспомогательной информации, сконфигурированный для декодирования и вывода вспомогательной информации для определения появления разрыва, имеющего место в первом пакете аудио, который принят корректно после появления потери пакета; корректор разрыва, сконфигурированный, чтобы корректировать разрыв декодированного аудио; и декодер ISF/LSF, сконфигурированный, чтобы использовать прошлые квантованные параметры разности ISF/LSF для вычисления ISF/LSF в релевантном кадре, когда вспомогательная информация от декодера вспомогательной информации не указывает появление разрыва, и для предотвращения использования прошлых квантованных параметров разности ISF/LSF для вычисления ISF/LSF в релевантном кадре, когда вспомогательная информация от декодера вспомогательной информации указывает появление разрыва.

[0072] Устройство обработки аудиосигнала может принять конфигурацию, в которой устройство обработки аудиосигнала дополнительно содержит: определитель состояния приема, сконфигурированный, чтобы определять состояния приема пакетов для предварительно определенного числа прошлых кадров; корректор разрыва к тому же корректирует разрыв на основе результата определения состояний приема пакетов в дополнение к результату определения появления разрыва.

[0073] Теперь, устройство обработки аудиосигнала согласно одному варианту осуществления настоящего изобретения может быть рассмотрено в качестве изобретения, связанного со способом обработки аудиосигнала, и в качестве изобретения, связанного с программой обработки аудиосигнала, и может быть описано, как изложено ниже.

[0074] Способ обработки аудиосигнала согласно одному варианту осуществления настоящего изобретения является способом обработки аудиосигнала, подлежащим исполнению устройством обработки аудиосигнала, содержащим: этап определения появления разрыва декодированного аудио, имеющего место с внезапным повышением амплитуды декодированного аудио, полученного путем декодирования первого пакета аудио, который принят корректно после появления потери пакета; и этап корректирования разрыва декодированного аудио.

[0075] Способ обработки аудиосигнала согласно одному варианту осуществления настоящего изобретения является способом обработки аудиосигнала, подлежащим исполнению устройством обработки аудиосигнала, содержащим: этап квантования параметров ISF/LSF; этап формирования маскирующих ISF/LSF параметров, которые являются информацией маскирования для параметров ISF/LSF; этап определения появления разрыва, имеющего место в первом пакете аудио, который принят корректно после появления потери пакета, используя расстояния между квантованными параметрами ISF/LSF, полученными в процессе квантования квантователя ISF/LSF, и сформированными маскирующими параметрами ISF/LSF; и этап кодирования вспомогательной информации для определения появления разрыва.

[0076] Способ обработки аудиосигнала согласно одному варианту осуществления настоящего изобретения является способом обработки аудиосигнала, подлежащим исполнению устройством обработки аудиосигнала, содержащим: этап определения появления разрыва, имеющего место в первом пакете аудио, который принят корректно после появления потери пакета; этап кодирования вспомогательной информации для определения появления разрыва; и этап использования прошлых квантованных параметров разности ISF/LSF для квантования ISF/LSF в данном кадре, когда появление разрыва не определяют, и предотвращения использования прошлых квантованных параметров разности ISF/LSF для квантования ISF/LSF в релевантном кадре, когда определено появление разрыва.

[0077] Способ обработки аудиосигнала согласно одному варианту осуществления настоящего изобретения является способом обработки аудиосигнала, подлежащим исполнению устройством обработки аудиосигнала, содержащим: этап декодирования и вывода вспомогательной информации для определения появления разрыва декодированного аудио, имеющего место в первом пакете аудио, который принят корректно после появления потери пакета; этап корректирования разрыва декодированного аудио; и этап использования прошлых квантованных параметров разности ISF/LSF для вычисления ISF/LSF в данном кадре, когда вспомогательная информация не указывает появление разрыва, и предотвращения использования прошлых квантованных параметров разности ISF/LSF для вычисления ISF/LSF в данном кадре, когда вспомогательная информация указывает появление разрыва.

[0078] Программа обработки аудиосигнала согласно одному варианту осуществления настоящего изобретения является программой обработки аудиосигнала, которая программирует компьютер для работы в качестве: обнаружителя разрыва, выполненного с возможностью определять появление разрыва декодированного аудио, имеющего место с внезапным повышением амплитуды декодированного аудио, полученного путем декодирования первого пакета аудио, который принят корректно после появления потери пакета; и корректора разрыва, выполненного с возможно