2651217 - Устройство, способ и соответствующая компьютерная программа для генерации сигнала маскирования ошибок с использованием компенсации мощности

Устройство, способ и соответствующая компьютерная программа для генерации сигнала маскирования ошибок с использованием компенсации мощности

Иллюстрации

Показать все

Изобретение относится к аудиокодированию, в частности к аудиокодированию, основанному на LPC-подобной обработке в контексте кодовых книг. Технический результат – обеспечение улучшенной концепции для генерации сигнала маскирования ошибок. Устройство для генерации сигнала маскирования ошибок содержит: генератор представления LPC для генерации заменяющего представления LPC; вычислитель усиления для вычисления информации об усилении по представлениям LPC; компенсатор для компенсации влияния усиления заменяющего представления LPC с использованием информации об усилении и синтезатор LPC для фильтрации информации кодовой книги с использованием заменяющего представления LPC для получения сигнала маскирования ошибок, при этом компенсатор выполнен с возможностью умножения на весовые коэффициенты информации кодовой книги или выходного сигнала синтезирования LPC. 3 н. и 12 з.п. ф-лы, 19 ил.

Реферат

Настоящее изобретение относится к аудиокодированию, и в частности к аудиокодированию, основанному на LPC-подобной обработке в контексте кодовых книг.

Перцепционные аудио кодеры часто используют кодирование с линейным предсказанием (LPC) для моделирования речевого тракта человека и для уменьшения степени избыточности, который может быть смоделирован с помощью параметров LPC. Остаток LPC, который получается путем фильтрации входного сигнала с помощью фильтра LPC, далее моделируется и передается путем его представления с помощью одной, двух или более кодовых книг (примерами являются: адаптивная кодовая книга, кодовая книга глоттальных импульсов, инновационная кодовая книга, кодовая книга переходов, гибридные кодовые книги, состоящие из прогнозирующих и преобразующих частей).

В случае потери кадра теряется сегмент речевых/аудиоданных (обычно 10 мс или 20 мс). Чтобы сделать эту потерю как можно менее различимой на слух, применяются различные методики маскирования. Эти методики обычно состоят из экстраполяции прошлых, принятых данных. Эти данные могут быть: усилениями кодовых книг, векторами кодовых книг, параметрами для моделирования кодовых книг и коэффициентов LPC. Во всей технологии маскирования, известной в области техники, набор коэффициентов LPC, который используется для синтеза сигнала, или повторяется (на основе последнего хорошего набора) или экстра-/интерполируется.

ITU G.718 [1]: параметры LPC (представленные в области ISF) экстраполируются во время маскирования. Экстраполяция включает в себя два этапа. Во-первых, вычисляется долговременный целевой вектор ISF. Этот долговременный целевой вектор ISF является взвешенным средним (с фиксированным весовым коэффициентом beta)

• вектора ISF, представляющего собой среднее последних трех известных векторов ISF, и

• автономного натренированного вектора ISF, который представляет собой долговременную среднюю спектральную форму.

Этот долговременный целевой вектор ISF затем интерполируется с помощью последнего правильно принятого вектора ISF, один раз на кадр, с использованием изменяющегося во времени фактора alpha, чтобы обеспечить плавный переход от последнего принятого вектора ISF к долговременному целевому вектору ISF. Полученный в результате вектор ISF затем преобразуется обратно в область LPC, чтобы cгенерировать промежуточные этапы (ISF передаются каждые 20 мс, интерполяция генерирует набор LPC каждые 5 мс). LPC затем используются для синтезирования выходного сигнала путем фильтрации результата сложения адаптивной и фиксированной кодовой книги, которые усиливаются с помощью соответствующих усилений кодовой книги перед сложением. Фиксированная кодовая книга содержит шумы во время маскирования. В случае последовательной потери кадров адаптивная кодовая книга подается в качестве обратной связи без прибавления фиксированной кодовой книги. Альтернативно, может подаваться в качестве обратной связи суммарный сигнал, как это сделано в AMR-WB [5].

В [2] описывается схема маскирования, которая использует два набора коэффициентов LPC. Один набор коэффициентов LPC получается на основании последнего хорошего полученного кадра, другой набор параметров LPC получается на основании первого хорошего полученного кадра, но предполагается, что сигнал развивается в обратном направлении (по направлению к прошлому). Затем предсказание выполняется в двух направлениях, одно по направлению к будущему и одно по направлению к прошлому. Поэтому генерируются два представления отсутствующего кадра. Наконец, оба сигнала умножаются на весовые коэффициенты (взвешиваются) и усредняются перед проигрыванием.

Фиг. 8 показывает технологию маскирования ошибок в соответствии с предшествующим уровнем техники. Адаптивная кодовая книга 800 предоставляет информацию адаптивной кодовой книги усилителю 808, который применяет усиление g_pкодовой книги к информации от адаптивной кодовой книги 800_.Выход усилителя 808 присоединен к входу объединителя 810. Кроме того, генератор 804 статистического шума вместе с фиксированной кодовой книгой 802 предоставляет информацию кодовой книги дополнительному усилителю g_c. Усилитель g_c, указанный под номером позиции 806, применяет коэффициент g_c усиления_,который является усилением фиксированной кодовой книги, к информации, предоставленной фиксированной кодовой книгой 802 вместе с генератором 804 статистического шума. Выход усилителя 806 затем дополнительно подается на вход объединителя 810. Объединитель810 складывает результат обеих кодовых книг, усиленных соответствующими усилениями кодовых книг, для получения объединенного сигнала, который затем подается на вход синтезирующего блока 814 LPC. Синтезирующий блок 814 LPC управляется заменяющим представлением, которое генерируется, как описано выше.

Эта процедура предшествующего уровня техники имеет определенные недостатки.

Чтобы учесть изменяющиеся характеристики сигнала или чтобы огибающая LPC сходилась к свойствам, подобным фоновому шуму, LPC изменяется во время маскирования путем экстра/интерполяции с некоторыми другими векторами LPC. Возможность точно управлять энергией во время маскирования отсутствует. Хотя есть шанс управлять усилениями различных кодовых книг, LPC будет неявно влиять на общий уровень или энергию (даже зависящую от частоты).

Может предусматриваться постепенное затухание до определенного уровня энергии (например, уровня фонового шума) во время пакетной потери кадров. Это невозможно с существующим уровнем техники, даже при управлении усилениями кодовых книг.

Невозможно постепенно уменьшить шумные части сигнала до фонового шума, при это сохраняя возможность синтезировать тональные части с теми же самыми спектральными свойствами, как перед потерей кадров.

Задачей настоящего изобретения является обеспечение улучшенной концепции для генерации сигнала маскирования ошибок.

Эта задача решается с помощью устройства для генерации сигнала маскирования ошибок по п. 1, способа генерации сигнала маскирования ошибок по п. 14 или компьютерной программы по п. 15 формулы изобретения.

В одном аспекте настоящего изобретения устройство для генерации сигнала маскирования ошибок содержит генератор представления LPC для генерации первого заменяющего представления LPC и отличающегося второго заменяющего представления LPC. Кроме того, обеспечен синтезатор LPC для фильтрации информации первой кодовой книги с использованием первого заменяющего представления LPC для получения первого заменяющего сигнала и для фильтрации информации второй отличающейся кодовой книги с использованием второго заменяющего представления LPC для получения второго заменяющего сигнала. Выходные сигналы синтезатора LPC объединяются объединителем заменяющих сигналов, объединяющим первый заменяющий сигнал и второй заменяющий сигнал для получения сигнала маскирования ошибок.

Первая кодовая книга является предпочтительно адаптивной кодовой книгой для обеспечения информации первой кодовой книги, а вторая кодовая книга является предпочтительно фиксированной кодовой книгой для обеспечения информации второй кодовой книги. Другими словами, первая кодовая книга представляет собой тональную часть сигнала, а вторая или фиксированная кодовая книга представляет собой шумовую часть сигнала и поэтому может рассматриваться как шумовая кодовая книга.

Информация первой кодовой книги для адаптивной кодовой книги генерируется с использованием среднего значения последних хороших представлений LPC, последнего хорошего представления и значения постепенного затухания. Кроме того, представление LPC для второй или фиксированной кодовой книги генерируется с использованием последнего хорошего представления LPC, значения постепенного затухания и оценки шумов. В зависимости от реализации оценка шумов может быть фиксированным значением, автономно натренированным значением, или оно может адаптивно получаться из сигнала, предшествующего ситуации маскирования ошибок.

Предпочтительно, выполняется вычисление усиления LPC для вычисления влияния заменяющего представления LPC, и эта информация затем используется для выполнения компенсации так, чтобы мощность или громкость или, в общем, связанная с амплитудой мера синтезированного сигнала была аналогична соответствующему синтезированному сигналу перед операцией маскирования ошибок.

В дополнительном аспекте устройство для генерации сигнала маскирования ошибок содержит генератор представления LPC для генерации одного или нескольких заменяющих представлений LPC. Кроме того, обеспечен вычислитель усиления для вычисления информации об усилении по представлению LPC, и затем дополнительно обеспечен компенсатор для компенсации влияния усиления заменяющего представления LPC, и эта компенсация усиления выполняется с использованием операции усиления, обеспеченной вычислителем усиления. Синтезатор LPC затем фильтрует информацию кодовой книги с использованием заменяющего представления LPC для получения сигнала маскирования ошибок, при этом компенсатор выполнен с возможностью умножения на весовой коэффициент информации кодовой книги перед синтезом с помощью синтезатора LPC или умножения на весовой коэффициент выходного сигнала синтезирования LPC. Таким образом, любое заметное влияние, связанное с усилением, или мощностью, или амплитудой в начале ситуации маскирования ошибок уменьшается или устраняется.

Эта компенсация полезна не только для индивидуальных представлений LPC, как отмечено в упомянутом выше аспекте, но также полезна в случае использования только одиночного заменяющего представления LPC вместе с одиночным синтезатором LPC.

Значения усиления определяются путем вычисления импульсных характеристик последнего хорошего представления LPC и заменяющего представления LPC и, в частности, путем вычисления среднеквадратичного (rms) значения по импульсной характеристике соответствующего представления LPC за некоторое время, которое лежит в пределах между 3 и 8 мс и предпочтительно равно 5 мс.

В одной реализации фактическое значение усиления определяется путем деления нового rms значения, то есть rms значения для заменяющего представления LPC, на rms значение хорошего представления LPC.

Предпочтительно, одиночное или несколько заменяющих представлений LPC вычисляются с использованием оценки фонового шума, которая предпочтительно является оценкой фонового шума, полученной по декодируемым в настоящий момент сигналам, в отличие от просто заранее определенной оценки шумов автономно натренированного вектора.

В дополнительном аспекте устройство для генерации сигнала содержит генератор представления LPC для генерации одного или нескольких заменяющих представлений LPC и синтезатор LPC для фильтрации информации кодовой книги с использованием заменяющего представления LPC. Дополнительно обеспечен блок оценки шумов для оценки шумов во время приема хороших аудиокадров, и эта оценка шумов зависит от хороших аудиокадров. Генератор представления выполнен с возможностью использования оценки шумов, полученной блоком оценки шумов, при генерации заменяющего представления LPC.

Спектральное представление прошлого декодированного сигнала обрабатывается для обеспечения спектрального представления шумов или целевого представления. Спектральное представление шумов преобразуется в представление LPC шумов, и представление LPC шумов является, предпочтительно, таким же типом представления LPC, как и заменяющее представление LPC. Векторы ISF являются предпочтительными для конкретных процедур обработки, связанных с LPC.

Оценка получается путем применения подхода минимальной статистики с оптимальным сглаживанием к прошлому декодированному сигналу. Эта спектральная оценка шумов затем преобразуется в представление во временной области. Затем выполняется рекурсия Левинсона-Дарбина с использованием первого числа сэмплов представления во временной области, где число сэмплов равно порядку LPC. Затем, из результата рекурсии Левинсона-Дарбина получаются коэффициенты LPC, и этот результат, наконец, преобразуется в вектор. Аспект использования индивидуальных представлений LPC для индивидуальных кодовых книг, аспект использования одного или нескольких представлений LPC с компенсацией усиления и аспект использования оценки шумов при генерации одного или нескольких представлений LPC, причем эта оценка не является автономно натренированным вектором, а является оценкой шумов, полученной из прошлого декодированного сигнала, могут применяться по индивидуальности для получения улучшения относительно предшествующего уровня техники.

Кроме того, эти индивидуальные аспекты также могут комбинироваться друг с другом, так что, например, могут комбинироваться первый аспект и второй аспект, или могут комбинироваться первый аспект и третий аспект, или могут комбинироваться друг с другом второй аспект и третий аспект для обеспечения еще более улучшенных рабочих характеристик относительно предшествующего уровня техники. Еще более предпочтительно, все три аспекта могут комбинироваться друг с другом для получения улучшений по сравнению с предшествующим уровнем техники. Таким образом, даже при том, что аспекты описываются индивидуальными фигурами, все аспекты могут быть применены в комбинации друг с другом, как можно видеть со ссылкой на прилагаемые фигуры и описание.

Далее описываются предпочтительные варианты осуществления настоящего изобретения относительно прилагаемых чертежей, на которых:

фиг. 1a иллюстрирует вариант осуществления первого аспекта;

фиг. 1b иллюстрирует использование адаптивной кодовой книги;

фиг. 1c иллюстрирует использование фиксированной кодовой книги в случае нормального режима или режима маскирования;

фиг. 1d иллюстрирует блок-схему последовательности операций для вычисления первого заменяющего представления LPC;

фиг. 1e иллюстрирует блок-схему последовательности операций для вычисления второго заменяющего представления LPC;

фиг. 2 иллюстрирует общий вид декодера с контроллером маскирования ошибок и блоком оценки шумов;

фиг. 3 иллюстрирует подробное представление синтезирующих фильтров;

фиг. 4 иллюстрирует предпочтительный вариант осуществления, комбинирующий первый и второй аспект;

фиг. 5 иллюстрирует дополнительный вариант осуществления, комбинирующий первый и второй аспекты;

фиг. 6 иллюстрирует вариант осуществления, комбинирующий первый и второй аспекты;

фиг. 7a иллюстрирует вариант осуществления для выполнения компенсации усиления;

фиг. 7b иллюстрирует блок-схему последовательности операций для выполнения компенсации усиления;

фиг. 8 иллюстрирует генератор сигнала маскирования ошибок предшествующего уровня техники;

фиг. 9 иллюстрирует вариант осуществления в соответствии со вторым аспектом с компенсацией усиления;

фиг. 10 иллюстрирует дополнительную реализацию варианта осуществления на фиг. 9;

фиг. 11 иллюстрирует вариант осуществления третьего аспекта с использованием блока оценки шумов;

фиг. 12a иллюстрирует предпочтительную реализацию для вычисления оценки шумов;

фиг. 12b иллюстрирует дополнительную предпочтительную реализацию для вычисления оценки шумов; и

фиг. 13 иллюстрирует вычисление одиночного заменяющего представления LPC или индивидуальных заменяющих представлений LPC для индивидуальных кодовых книг c использованием оценки шумов и с применением операции постепенного затухания.

Предпочтительные варианты осуществления настоящего изобретения относятся к управлению уровнем выходного сигнала посредством усилений кодовых книг независимо от любого изменения усиления, вызванного экстраполированным LPC, и управлению спектральной формой, моделируемой с помощью LPC, отдельно для каждой кодовой книги. С этой целью для каждой кодовой книги применяются отдельные LPC и применяется средство компенсации для компенсации любого изменения усиления LPC во время маскирования.

Варианты осуществления настоящего изобретения, как они определены в различных аспектах или в комбинированных аспектах, имеют преимущество обеспечения высокого субъективного качества речи/аудио в случае неправильного приема и неприема вообще на стороне декодера одного или нескольких пакетов данных.

Кроме того, предпочтительные варианты осуществления компенсируют разности усиления между последовательными LPC во время маскирования, которые могут возникать из-за изменения с течением времени коэффициентов LPC, и поэтому не допускаются нежелательные изменения уровня сигнала.

Кроме того, преимущество вариантов осуществления заключается в том, что во время маскирования используются два или более набора коэффициентов LPC, чтобы независимо влиять на спектральное поведение вокализированных и невокализованных частей речи, а также тональных и шумоподобных частей аудио.

Все аспекты настоящего изобретения обеспечивают улучшенное субъективное качество звука.

В соответствии с одним аспектом этого изобретения происходит точное управление энергией во время интерполяции. Любое усиление, которое вносится при изменении LPC, компенсируется.

В соответствии с другим аспектом этого изобретения используются индивидуальные наборы LPC для каждого из векторов кодовой книги. Каждый вектор кодовой книги фильтруется с помощью его соответствующего LPC, и индивидуальные фильтрованные сигналы только после этого суммируются для получения синтезированного вывода. В противоположность этому технология существующего уровня техники сначала складывает все векторы возбуждения (генерируемые из различных кодовых книг) и только потом подает сумму на вход одному фильтру LPC.

В соответствии с другим аспектом оценка шумов не используется, например, в качестве автономно натренированного вектора, а фактически получается из прошлых декодированных кадров, так что после определенного количества ошибочных или пропущенных пакетов/кадров получается затухание к фактическому фоновому шуму, а не к какому-либо предварительно заданному спектру шума. Это, в частности, приводит к благосклонному отношению со стороны пользователя, но также к факту, что даже когда возникает ситуация ошибки, сигнал, обеспеченный декодером после определенного числа кадров, связан с предшествующим сигналом. Однако сигнал, обеспеченный декодером в случае определенного числа потерянных или ошибочных кадров, является сигналом, абсолютно не связанным с сигналом, обеспеченным декодером перед ситуацией ошибки.

Применение компенсации усиления для зависящего от времени усиления LPC обеспечивает следующие преимущества:

Это компенсирует любое усиление, которое вносится при изменении LPC.

Следовательно, уровнем выходного сигнала можно управлять с помощью усилений различных кодовых книг. Это обеспечивает предварительно заданное затухание путем устранения любого нежелательного влияния со стороны интерполированного LPC.

Использование отдельного набора коэффициентов LPC для каждой кодовой книги, используемой во время маскирования, обеспечивает следующие преимущества:

Это создает возможность влиять на спектральную форму тональных и шумоподобных частей сигнала по-отдельности.

Это дает возможность воспроизводить вокализированную часть сигнала почти без изменений (например, это желательно для гласных), в то время как шумовая часть может быстро сходиться к фоновому шуму.

Это дает возможность замаскировать вокализированные части, и постепенно ослаблять вокализированную часть с произвольной скоростью постепенного затухания (например, скоростью постепенного затухания, зависящей от характеристик сигнала), при этом одновременно сохраняя фоновый шум во время маскирования. Кодеки существующего уровня техники обычно страдают от очень чистого вокализированного маскирующего звука.

Это обеспечивает средство для гладкого постепенного затухания до фонового шума во время маскирования путем постепенного уменьшения тональных частей без изменения спектральных свойств и постепенного затухания шумоподобных частей до огибающей фонового спектра.

Фиг. 1a иллюстрирует устройство для генерации сигнала 111 маскирования ошибок. Устройство содержит генератор 100 представления LPC для генерации первого заменяющего представления и дополнительно для генерации второго заменяющего представления LPC. Как указано на фиг. 1a, первое заменяющее представление подается на вход синтезатора LPC 106 для фильтрации информации первой кодовой книги, выводимой первой кодовой книгой 102, такой как адаптивная кодовая книга 102, для получения первого заменяющего сигнала на выходе блока 106. Кроме того, второе заменяющее представление, генерируемое генератором 100 представления LPC, подается на вход синтезатора LPC для фильтрации информации второй отличающейся кодовой книги, предоставленной второй кодовой книгой 104, которая является, например, фиксированной кодовой книгой, для получения второго заменяющего сигнала на выходе блока 108. Оба заменяющих сигнала затем подаются на вход объединителя 110 заменяющих сигналов для объединения первого заменяющего сигнала и второго заменяющего сигнала для получения сигнала 111 маскирования ошибок. Оба синтезатора 106, 108 LPC могут быть реализованы в одном блоке синтезатора LPC или могут быть реализованы как отдельные фильтры синтезатора LPC. В других реализациях процедуры обоих синтезаторов LPC могут быть реализованы с помощью двух фильтров LPC, фактически реализованных и функционирующих параллельно. Однако синтезирование LPC также может быть синтезирующим фильтром LPC и некоторым управлением, так что синтезирующий фильтр LPC обеспечивает выходной сигнал для информации первой кодовой книги и первого заменяющего представления, а затем, вслед за этой первой операцией, управление обеспечивает информацию второй кодовой книги и второе заменяющее представление синтезирующему фильтру для получения второго заменяющего сигнала последовательным образом. Другие реализации для синтезатора LPC, помимо одиночного или нескольких синтезирующих блоков, очевидны для специалистов в области техники.

Как правило, выходные сигналы синтезирования LPC являются сигналами во временной области, и объединитель 110 заменяющих сигналов выполняет объединение синтезированных выходных сигналов путем выполнения синхронизированного посэмплового (выборка за выборкой) сложения. Однако, другие объединения, такие как посэмпловое (выборка за выборкой) взвешенное сложение или сложение в частотной области или любое другое объединение сигналов, также может выполняться объединителем 110 заменяющих сигналов.

Кроме того, первая кодовая книга 102 показана содержащей адаптивную кодовую книгу, а вторая кодовая книга 104 показана содержащей фиксированную кодовую книгу. Однако первая кодовая книга и вторая кодовая книга могут быть любыми кодовыми книгами, такими как кодовая книга с предсказанием в качестве первой кодовой книги и шумовая кодовая книга в качестве второй кодовой книги. Однако другие кодовые книги могут быть кодовыми книгами глоттальных импульсов, инновационными кодовыми книгами, кодовыми книгами переходов, гибридными кодовыми книгами, состоящими из прогнозирующих и преобразующих частей, кодовыми книгами для индивидуальных речевых генераторов, таких как мужчины/женщины/дети, или кодовые книги для различных звуков, например, звуков животных и т.д.

Фиг. 1b иллюстрирует представление адаптивной кодовой книги. Адаптивная кодовая книга обеспечена контуром 120 обратной связи и принимает, в качестве входа, запаздывание 118 основного тона. Запаздывание основного тона может быть декодированным запаздыванием основного тона в случае хорошего полученного кадра/пакета. Однако, если обнаружена ситуация ошибки, указывающая на ошибочный или пропущенный кадр/пакет, то запаздывание 118 основного тона маскирования ошибки обеспечивается декодером и подается на вход адаптивной кодовой книги. Адаптивная кодовая книга 102 может быть реализована как память, хранящая подаваемые обратно выходные значения, обеспеченные через линию 120 обратной связи, и, в зависимости от примененного запаздывания 118 основного тона, определенное количество пробных значений выводится адаптивной кодовой книгой.

Далее фиг. 1c иллюстрирует фиксированную кодовую книгу 104. В случае нормального режима фиксированная кодовая книга 104 принимает индекс кодовой книги и в ответ на индекс кодовой книги фиксированной кодовой книгой обеспечивается некоторая запись кодовой книги 114 в качестве информации кодовой книги. Однако, если определен режим маскирования, индекс кодовой книги не доступен. Затем активируется генератор 112 шума, обеспеченный в фиксированной кодовой книге 104, который обеспечивает шумовой сигнал в качестве информации 116 кодовой книги. В зависимости от реализации генератор шума может обеспечивать случайный индекс кодовой книги. Однако является предпочтительным, чтобы генератор шума фактически обеспечивал шумовой сигнал, а не случайный индекс кодовой книги. Генератор 112 шума может быть реализован как некоторый аппаратный или программный генератор шума, или может быть реализован как таблицы шумов, или некоторая «дополнительная» запись в фиксированной кодовой книге, которая имеет форму шума. Кроме того, возможны комбинации упомянутых выше процедур, то есть запись шумовой кодовой книги вместе с некоторой последующей обработкой.

Фиг. 1d иллюстрирует предпочтительную процедуру для вычисления первого заменяющего представление LPC в случае ошибки. Этап 130 иллюстрирует вычисление среднего значения представлений LPC двух или более последних хороших кадров. Предпочтительно трех последних хороших кадров. Таким образом, среднее значение по трем последним хорошим кадрам вычисляется в блоке 130 и предоставляется блоку 136. Далее сохраненная информация LPC последнего хорошего кадра обеспечивается на этапе 132 и дополнительно предоставляется блоку 136. Далее в блоке 134 определяется коэффициент 134 постепенного затухания. Затем, в зависимости от последней хорошей информации LPC, в зависимости от среднего значения информации LPC последнего хорошего кадра и в зависимости от коэффициента постепенного затухания блока 134 вычисляется первое заменяющее представление 138.

В существующем уровне техники применяется только одно LPC. Для нового предложенного способа каждый вектор возбуждения, который генерируется адаптивной или фиксированной кодовой книгой, фильтруется с помощью своего собственного набора коэффициентов LPC. Получение индивидуальных векторов ISF происходит следующим образом:

Набор А коэффициентов (для фильтрации адаптивной кодовой книги) определяется следующей формулой:

(блок 136),

где является изменяющимся во времени адаптивным коэффициентом постепенного затухания, который может зависеть от устойчивости сигнала, класса сигнала и т.д. является коэффициентами ISF, где x обозначает номер кадра относительно конца текущего кадра: x=-1 обозначает первый потерянный ISF, x=-2 последний хороший, x=-3 предпоследний хороший и так далее. Это приводит к постепенному затуханию LPC, которое используется для фильтрации тональной части, начиная с последнего правильно полученного кадра к среднему LPC (усредненному по трем последним хорошим 20 мс кадрам). Чем больше кадров теряется, тем ближе будет ISF, который используется во время маскирования, к этому краткосрочному среднему вектору ISF ().

Фиг. 1e иллюстрирует предпочтительную процедуру для вычисления второго заменяющего представления. В блоке 140 определяется оценка шумов. Затем, в блоке 142, определяется коэффициент постепенного затухания. Дополнительно, в блоке 144, обеспечивается последний хороший кадр, который является информацией LPC, которая была ранее сохранена. Затем, в блоке 146, вычисляется второе заменяющее представление. Предпочтительно, набор B коэффициентов (для фильтрации фиксированной кодовой книги) определяется с помощью следующей формулы:

(блок 146),

где является набором коэффициентов ISF, полученным из оценки фонового шума, и является зависящим от времени коэффициентом скорости постепенного затухания, который предпочтительно зависит от сигнала. Целевая спектральная форма получается путем отслеживания прошлого декодированного сигнала в области FFT (энергетический спектр) с использованием подхода минимальной статистики с оптимальным сглаживанием, аналогичным [3]. Эта оценка FFT преобразуется в представление LPC путем вычисления автокорреляции путем выполнения обратного FFT, а затем использования рекурсии Левинсона-Дарбина для вычисления коэффициентов LPC с использованием первых N сэмплов обратного FFT, где N является порядком LPC. Это LPC затем преобразуется в область ISF для получения Альтернативно, если такое отслеживание фоновой спектральной формы не доступно, целевая спектральная форма может также быть получена на основании любой комбинация автономно натренированного вектора и краткосрочного спектрального среднего, как это сделано в G.718 для общей целевой спектральной формы.

Предпочтительно, коэффициенты A и α_B постепенного затухания определяются в зависимости от декодируемого аудиосигнала, то есть в зависимости от декодируемого аудиосигнала до возникновения ошибки. Коэффициент постепенного затухания может зависеть от стабильности сигнала, класса сигнала и т.д. Таким образом, если определяется, что сигнал является довольно шумным сигналом, то коэффициент постепенного затухания определяется таким образом, что коэффициент постепенного затухания уменьшается, время от времени, более быстро по сравнению с ситуацией, в которой сигнал является довольно тональным. В этой ситуации коэффициент постепенного затухания уменьшается от одного временного кадра к следующему временному кадру на меньшее значение. Это гарантирует, что постепенное затухание от последнего хорошего кадра до среднего значения последних трех хороших кадров произойдет более быстро в случае шумных сигналов по сравнению с нешумными или тональными сигналами, в которых скорость постепенного затухания меньше. Аналогичные процедуры могут выполняться для классов сигналов. Для вокализированных сигналов постепенное затухание может выполняться медленнее, чем для невокализированных сигналов или для музыкальных сигналов, некоторая скорость постепенного затухания может быть уменьшена при сравнении с дополнительными характеристиками сигнала, и могут применяться соответствующие определения коэффициента постепенного затухания.

Как обсуждалось в контексте фиг. 1e, для информации второй кодовой книги может быть вычислен другой коэффициент α_B постепенного затухания. Таким образом, различные записи кодовой книги могут быть обеспечены различной скоростью постепенного затухания. Таким образом, постепенное затухание до оценки шумов как f^cng может быть установлено отличающимся от скорости постепенного затухания от представления ISF последнего хорошего кадра до среднего представления ISF, как указано в блоке 136 на фиг. 1d.

Фиг. 2 иллюстрирует общий вид предпочтительной реализации. Входная линия принимает, например, от беспроводного входного интерфейса или кабельного интерфейса, пакеты или кадры аудиосигнала. Данные во входной линии 202 предоставляются декодеру 204 и одновременно контроллеру 200 маскирования ошибок. Контроллер маскирования ошибок определяет, является ли принятый пакет или кадры ошибочными или отсутствующими. Если это определено, контроллер маскирования ошибок подает управляющее сообщение на вход декодера 204. В реализации на фиг. 2 сообщение «1» в линии CTRL управления сигнализирует, что декодер 204 должен функционировать в режиме маскирования. Однако, если контроллер маскирования ошибок не находит ситуации ошибки, то линия CTRL управления передает сообщение «0», указывающее нормальный режим декодирования, как указано в таблице 210 на фиг. 2. Декодер 204 дополнительно соединен с блоком 206 оценки шумов. Во время нормального режима декодирования блок 206 оценки шумов принимает декодированный аудиосигнал через линию 208 обратной связи и определяет оценку шумов из декодированного сигнала. Однако, когда контроллер маскирования ошибок указывает изменение из нормального режима декодирования в режим маскирования, блок 206 оценки шумов обеспечивает оценку шумов для декодера 204, в результате чего декодер 204 может выполнить маскирование ошибки, как было описано в предшествующих и последующих фигурах. Таким образом, блок 206 оценки шумов дополнительно управляется линией CTRL управления от контроллера маскирования ошибок для переключения из нормального режима оценки шумов в нормальном режиме декодирования в работу с предоставлением оценки шумов в режиме маскирования.

Фиг. 4 иллюстрирует предпочтительный вариант осуществления настоящего изобретения в контексте декодера, такого как декодер 204 на фиг. 2, имеющего адаптивную кодовую книгу 102 и дополнительно имеющего фиксированную кодовую книгу 104. В нормальном режиме декодирования, указываемом с помощью данных «0» линии управления, как обсуждалось в контексте таблицы 210 на фиг. 2, декодер работает как изображено на фиг. 8, когда элементом 804 пренебрегают. Таким образом, правильно принятый пакет содержит индекс фиксированной кодовой книги для управления фиксированной кодовой книгой 802, усиление g_cфиксированной кодовой книги для управления усилителем 806 и усиление g_pадаптивной кодовой книги для управления усилителем 808. Кроме того, адаптивная кодовая книга 800 управляется с помощью переданного запаздывания основного тона, и переключатель 812 соединен так, что выход адаптивной кодовой книги подается обратно на вход адаптивной кодовой книги. Кроме того, коэффициенты для синтезирующего фильтра 804 LPC получаются из переданных данных.

Однако, если контроллером 202 маскирования ошибок на фиг. 2 обнаружена ситуация маскирования ошибки, инициируется процедура маскирования ошибки, в которой, в отличие от нормальной процедуры, обеспечиваются два синтезирующих фильтра 106, 108. Кроме того, запаздывание основного тона для адаптивной кодовой книги 102 генерируется устройством маскирования ошибки. Дополнительно, усиление g_p адаптивной кодовой книги и усиление g_cфиксированной кодовой книги также синтезируются с помощью процедуры маскирования ошибки, как известно в области техники, чтобы правильно управлять усилителями 402, 404.

Кроме того, в зависимости от класса сигнала, контроллер 409 управляет переключателем 405, чтобы либо подавать обратно объединение обоих выходных сигналов кодовых книг (после применения соответствующего усиления кодовой книги), либо только подавать обратно выход адаптивной кодовой книги.

В соответствии с вариантом осуществления, данные для синтезирующего фильтра А 106 LPC и данные для синтезирующего фильтра B 108 LPC генерируются генератором 100 представления LPC на фиг. 1a, и, дополнительно, усилителями 406, 408 выполняется коррекция усиления. С этой целью вычисляются коэффициенты g_A и g_B компенсации усиления для того, чтобы правильно управлять усилителями 408, 406 так, чтобы любое влияние усиления, генерируемого представлением LPC, было устранено. Наконец, выходные сигналы синтезирующих фильтров A, B LPC, обозначенных с помощью номеров позиций 106 и 108, объединяется объединителем 110, в результате чего получается сигнал маскирования ошибок.

Далее обсуждается переключение из нормального режима в режим маскирования с одной стороны и из режима маскирования обратно в нормальный режим.

Переход от одного общего к нескольким отдельным LPC при переключении из декодирования чистого канала к маскированию не вызывает каких-либо разрывов, поскольку состояние памяти последнего хорошего LPC может использоваться для инициал

Устройство, способ и соответствующая компьютерная программа для генерации сигнала маскирования ошибок с использованием компенсации мощности

Патент 2651217