2648953 - Наполнение шумом без побочной информации для celp-подобных кодеров

Наполнение шумом без побочной информации для celp-подобных кодеров

Иллюстрации

Показать все

Изобретение относится к средствам для кодирования аудио. Технический результат заключается в повышении качества кодирования аудио. Аудиодекодер для предоставления декодированной аудиоинформации на основе закодированной аудиоинформации, содержащей коэффициенты линейного предсказания, содержит средство регулирования отклонения, сконфигурированное для регулирования отклонения фонового шума с использованием информации об отклонении; ядро декодера, сконфигурированное для декодирования аудиоинформации текущего кадра с использованием коэффициентов линейного предсказания текущего кадра для получения декодированного основного выходного сигнала кодера; и средство вставки шума, сконфигурированное для добавления отрегулированного фонового шума к текущему кадру, чтобы выполнить наполнение шумом, при этом средство регулирования отклонения сконфигурировано для получения информации об отклонении с помощью вычисления приращения g коэффициентов линейного предсказания текущего кадра. 6 н. и 11 з.п. ф-лы, 11 ил.

Реферат

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСТИСЯ ИЗОБРЕТЕНИЕ

Варианты осуществления изобретения относятся к аудиодекодеру, который предоставляет декодированную аудиоинформацию на основе закодированной аудиоинформации, содержащей коэффициенты линейного предсказания (LPC), к способу предоставления декодированной аудиоинформации на основе закодированной аудиоинформации, содержащей коэффициенты линейного предсказания (LPC), к компьютерной программе для выполнения такого способа, при этом компьютерная программа работает на компьютере, и к аудиосигналу или носителю данных, на котором сохранен такой аудиосигнал, где аудиосигнал обработан с помощью такого способа.

УРОВЕНЬ ТЕХНИКИ

Цифровые речевые кодеры с низкой скоростью передачи битов (битрейтом), основанные на принципе кодирования с линейным предсказанием с кодовым возбуждением (CELP), как правило страдают от артефактов разреженного сигнала, когда скорость передачи битов падает ниже приблизительно 0,5-1 бита на отсчет, что приводит к несколько искусственному, металлическому звуку. Низкоскоростные артефакты особенно ясно слышны, когда входящий сигнал речи загрязнен фоновым шумом окружающей среды: фоновый шум будет ослаблен во время участков, содержащих активную речь. Настоящее изобретение описывает схему вставки шума для кодеров, использующих алгоритм (A)CELP (линейное предсказание с возбуждением алгебраическим кодом), таких как AMR-WB [1] и G.718 [4, 7], которая, аналогично способам наполнения шумом, используемым в кодерах с преобразованием сигнала, таких как xHE-AAC [5, 6], добавляет выход генератора случайного шума в декодированный речевой сигнал, для воспроизведения фонового шума.

Международная публикация WO 2012/110476 A1 демонстрирует концепцию кодирования, которая основана на линейном предсказании и использует преобразование шума в спектральной области. Спектральная декомпозиция входящего аудиосигнала в спектрограмму, содержащую спектральную последовательность, используется как для вычисления коэффициента линейного предсказания, так и в качестве входа для преобразования частотной области, основанного на коэффициентах линейного предсказания. Согласно цитируемому документу аудиокодер содержит анализатор линейных предсказаний, анализирующий входящий аудиосигнал для того, чтобы вычислить оттуда коэффициенты линейного предсказания. Преобразователь частотной области аудиокодера сконфигурирован спектрально преобразовать текущий спектр спектральной последовательности спектрограммы на основе коэффициентов линейного предсказания полученных из анализатора линейных предсказаний. Квантованный и спектрально преобразованный спектр вставляется в поток данных наряду с информацией о коэффициентах линейного предсказания, использованных в спектральном преобразовании так, чтобы при декодировании можно было выполнить обратное преобразование и деквантизацию. Модуль временного преобразования шума также может присутствовать для выполнения временного преобразования шума.

Ввиду известного уровня техники сохраняется потребность в усовершенствованном аудиодекодере, усовершенствованном способе, усовершенствованной компьютерной программе для выполнения такого способа, и усовершенствованном аудиосигнале или носителе данных, на котором сохранен такой аудиосигнал, где аудиосигнал обработан с помощью такого способа. Точнее, желательно найти такие решения, которые усовершенствуют качество звука аудиоинформации, передаваемой в закодированном битовом потоке.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Ссылочные символы в формуле изобретения и в подробном описании предпочтительных вариантов осуществления изобретения были добавлены только для улучшения читабельности и никоим образом не подразумеваются как ограничения.

Задача изобретения решается посредством аудиодекодера, который предоставляет декодированную аудиоинформацию на основе закодированной аудиоинформации, содержащей коэффициенты линейного предсказания (LPC), причем аудиодекодер содержит средство регулирования отклонения, сконфигурированное для регулирования отклонения шума, используя коэффициенты линейного предсказания текущего кадра для получения информации об отклонении, и средство вставки шума, сконфигурированное для добавления шума к текущему кадру в зависимости от информации об отклонении, полученной средством вычисления (вычислителем) отклонения. Кроме того, задача настоящего изобретения решается посредством способа предоставления декодированной аудиоинформации на основе закодированной аудиоинформации, содержащей коэффициенты линейного предсказания (LPC), при этом способ содержит регулирование отклонения шума, используя коэффициенты линейного предсказания текущего кадра, для получения информации об отклонении, и добавление шума к текущему кадру в зависимости от полученной информации об отклонении.

В качестве второго отвечающего изобретению технического решения, изобретение предлагает аудиодекодер, который предоставляет декодированную аудиоинформацию на основе закодированной аудиоинформации, содержащей коэффициенты линейного предсказания (LPC), причем аудиодекодер содержит средство оценки уровня шума, сконфигурированное для оценки уровня шума для текущего кадра, используя коэффициенты линейного предсказания по меньшей мере одного предыдущего кадра, для получения информации об уровне шума, и средство вставки шума, сконфигурированное для добавления шума к текущему кадру в зависимости от информации об уровне шума, полученной средством оценки уровня шума. Более того, задача настоящего изобретения решается посредством способа предоставления декодированной аудиоинформации на основе закодированной аудиоинформации, содержащей коэффициенты линейного предсказания (LPC), при этом способ содержит оценку уровня шума текущего кадра, используя коэффициенты линейного предсказания по меньшей мере одного предыдущего кадра для получения информации об уровне шума, и добавление шума к текущему кадру в зависимости от информации об уровне шума, полученной путем оценки уровня шума. Кроме того, задача изобретения решается посредством компьютерной программой для выполнения такого способа, при этом компьютерная программа работает на компьютере, а также посредством аудиосигнала или носителя данных, на котором сохранен такой аудиосигнал, где аудиосигнал обработан с помощью такого способа.

Предложенные решения исключают необходимость предоставления побочной информации в битовом потоке CELP для того, чтобы регулировать шум, предоставляемый на стороне декодера во время процесса наполнения шумом. Это означает, что количество данных, передаваемых с битовым потоком, может быть уменьшено, в то время как качество вставляемого шума может быть только увеличено на основе коэффициентов линейного предсказания кадров, декодируемых в настоящий момент или декодированных прежде. Другими словами, побочная информация, касающаяся шума, которая увеличила бы количество данных, передаваемых с битовым потоком, может быть исключена. Изобретение позволяет создать цифровой кодер с низкой скоростью передачи битов и способ, который может потреблять меньший диапазон частот относительно битового потока и предоставлять улучшенное качество фонового шума по сравнению с решениями предшествующего уровня техники.

Предпочтительно, чтобы аудиодекодер содержал средство определения типа кадра, которое определяет тип кадра текущего кадра, при этом средство определения типа кадра выполнено с возможностью активации средства регулирования отклонения, которое регулирует отклонение шума, когда тип кадра текущего кадра определен как относящийся к типу речи. В некоторых вариантах осуществления, средство определения типа кадра сконфигурировано для определения того, относится ли кадр к кадру типа речи, когда кадр закодирован ACELP или CELP. Преобразование шума согласно отклонению текущего кадра может обеспечивать более естественный фоновый шум и может уменьшать нежелательные эффекты сжатия звука относительно фонового шума желаемого сигнала, закодированного в битовом потоке. Так как эти нежелательные эффекты и артефакты сжатия часто становятся заметны в отношении фонового шума речевой информации, может быть полезно увеличить качество шума, добавляемого к таким кадрам типа речи посредством регулирования отклонения шума до добавления шума к текущему кадру. Соответственно, средство вставки шума может быть сконфигурировано для добавления шума к текущему кадру, только если текущий кадр является кадром речевого сигнала, так как это может уменьшить рабочую нагрузку на стороне декодера, только если кадры речевого сигнала обрабатываются наполнением шумом.

В предпочтительном варианте осуществления изобретения, средство регулирования отклонения сконфигурировано для использования результата анализа первого порядка коэффициентов линейного предсказания текущего кадра для получения информации об отклонении. Посредством использования такого анализа коэффициентов линейного предсказания первого порядка, становится возможным исключить побочную информацию для описания шума в битовом потоке. Более того, регулирование добавляемого шума может быть основано на коэффициентах линейного предсказания текущего кадра, которые в любом случае должны быть переданы с битовым потоком для того, чтобы сделать возможным декодирование аудиоинформации текущего кадра. Это означает, что коэффициенты линейного предсказания текущего кадра преимущественно используются повторно в процессе регулирования отклонения шума. Более того, анализ первого порядка достаточно прост, чтобы вычислительная сложность аудиодекодера не увеличивалась значительно.

В некоторых вариантах осуществления изобретения, средство регулирования отклонения сконфигурировано для получения информации об отклонении, с помощью вычисления приращения g коэффициентов линейного предсказания текущего кадра в качестве анализа первого порядка. Более предпочтительно, приращение g задается по формуле , где a_k - коэффициенты LPC текущего кадра. В некоторых вариантах осуществления, два или более коэффициентов LPC a_k используются при вычислении. Предпочтительно, всего используется 16 коэффициентов LPC, так что k=0....15. В вариантах осуществления изобретения, битовый поток может быть закодирован с более или менее, чем 16 коэффициентами LPC. Так как коэффициенты линейного предсказания текущего кадра явно присутствуют в битовом потоке, информация об отклонении может быть получена без использования побочной информации, таким образом, уменьшая количество данных, передаваемых в битовом потоке. Добавляемый шум может быть отрегулирован только посредством использования коэффициентов линейного предсказания, которые необходимы для декодирования закодированной аудиоинформации.

Предпочтительно, средство регулирования отклонения сконфигурировано для получения информации об отклонении с помощью вычисления передаточной функции прямой реализации фильтра для текущего кадра. Вычисления такого типа достаточно просты и не нуждаются в большой вычислительной мощности со стороны декодера. Приращение g может быть легко вычислено из коэффициентов LPC текущего кадра, как показано выше. Это позволяет улучшать качество шума для цифровых кодеров с низкой скоростью передачи данных, при этом используя исключительно данные битового потока, необходимые для декодирования закодированной аудиоинформации.

В предпочтительном варианте осуществления изобретения, средство вставки шума сконфигурировано для применения информации об отклонении текущего кадра к шуму для того, чтобы отрегулировать отклонение шума до добавления шума к текущему кадру. Если средство вставки шума сконфигурировано соответствующим образом, может быть создан упрощенный аудиодекодер. Сначала применив информацию об отклонении и затем добавив отрегулированный шум к текущему кадру, может быть предложен простой и эффективный способ работы аудиодекодера предоставлен.

В варианте осуществления изобретения, аудиодекодер, более того, содержит средство оценки уровня шума, сконфигурированное для оценки уровня шума текущего кадра, используя коэффициенты линейного предсказания по меньшей мере одного предыдущего кадра для получения информации об уровне шума, и средство вставки шума, сконфигурированное для добавления шума к текущему кадру в зависимости от информации об уровне шума, полученной средством оценки уровня шума. Таким способом, качество фонового шума и, таким образом, качество всей передачи звуковых сигналов может быть увеличено, так как шум, добавляемый к текущему кадру, может быть отрегулирован согласно уровню шума, который вероятно присутствует в текущем кадре. Например, если высокий уровень шума ожидается в текущем кадре, потому что высокий уровень шума был оценен из предыдущих кадров, средство вставки шума может быть сконфигурировано для повышения уровня шума, добавляемого к текущему кадру, до его добавления к текущему кадру. Таким образом, добавляемый шум может быть отрегулирован для того, чтобы не быть ни слишком тихим, ни слишком громким в сравнении с ожидаемым уровнем шума текущего кадра. Такое регулирование, также, не основано на выделенной побочной информации в битовом потоке, но только использует информацию о необходимых данных, передаваемых в битовый поток, в данном случае коэффициент линейного предсказания по меньшей мере одного предыдущего кадра, который также предоставляет информацию об уровне шума в предыдущем кадре. Таким образом, предпочтительно, чтобы шуму, добавляемому к текущему кадру, придавалась форма, используя выведенный из g отклонение, и чтобы его масштабировали с учетом оценки уровня шума. Наиболее предпочтительно, чтобы отклонение и уровень шума, добавляемого к текущему кадру, регулировались, когда текущий кадр относится к речевому типу. В некоторых вариантах осуществления, отклонение и/или уровень шума, добавляемого к текущему кадру, также регулируются, когда текущий кадр относится к типу обычного звука, например, типу TCX (возбуждение с преобразованием кода) или DTX (прерывистая передача).

Предпочтительно, аудиодекодер содержит средство определения типа кадра, которое определяет тип кадра текущего кадра, при этом средство определения типа кадра выполнено с возможностью распознавать, относится ли тип кадра текущего кадра к типу речи или к типу обычного звука для того, чтобы оценка уровня шума могла быть выполнена в зависимости от типа кадра текущего кадра. Например, средство определения типа кадра может быть сконфигурировано для определения, является ли текущий кадр кадром CELP или ACELP, который является типом речевого кадра, или кадром TCX/MDCT (модифицированное дискретное косинус-преобразование) или DTX, которые являются типами обычного звукового кадра. Так как эти форматы кодирования следуют разным принципам, желательно определять тип кадра до выполнения оценки уровня шума, чтобы подходящие вычисления могли быть выбраны в зависимости от типа кадра.

В некоторых вариантах осуществления изобретения аудиодекодер приспособлен вычислять первую информацию, представляющую спектрально бесформенное возбуждение текущего кадра, и вычислять вторую информацию, касающуюся спектрального масштабирования текущего кадра, для вычисления отношения первой информации и второй информации для получения информации об уровне шума. Таким способом, информация об уровне шума может быть получена без использования какой бы то ни было побочной информации. Таким образом, скорость передачи битов кодера может сохраняться низкой.

Предпочтительно, аудиодекодер приспособлен для декодирования сигнала возбуждения текущего кадра и для вычисления его среднего квадратичного e_rms из представления временной области текущего кадра в качестве первой информации для получения информации об уровне шума, при условии, что текущий кадр относится к типу речи. Для данного варианта осуществления предпочтительно, чтобы аудиодекодер был адаптирован функционировать соответствующим образом, если текущий кадр имеет тип CELP или ACELP. Спектрально выровненный сигнал возбуждения (в области восприятия) декодируется из битового потока и используется для обновления оценки уровня шума. Среднее квадратичное e_rms сигнала возбуждения текущего кадра вычисляется после считывания битового потока. Вычисления такого типа могут не нуждаться в высокой вычислительной мощности и, таким образом, даже могут быть выполнены аудиодекодерами с низкими вычислительными мощностями.

В предпочтительном варианте осуществления аудиодекодер приспособлен для вычисления пикового уровня p передаточной функции фильтра LPC текущего кадра как второй информации, таким образом используя коэффициенты линейного предсказания для получения информации об уровне шума, при условии, что текущий кадр относится к типу речи. Вновь, предпочтительно, чтобы текущий кадр имел тип CELP или ACELP. Вычисление пикового уровня p достаточно экономно, и путем повторного использования коэффициентов линейного предсказания текущего кадра, которые также используются для декодирования аудиоинформации, содержащейся в данном кадре, побочная информация может быть исключена, и тихий фоновый шум может быть усилен без повышения скорости передачи данных в битовом потоке.

В предпочтительном варианте осуществления изобретения, аудиодекодер приспособлен для вычисления спектрального минимума m_f текущего аудиокадра, путем вычисления отношения среднего квадратичного e_rms и пикового уровня p, для получения информации об уровне шума, при условии, что текущий кадр относится к типу речи. Данное вычисление достаточно простое и может предоставить числовое значение, которое может быть полезно при оценке уровня шума по диапазону многочисленных аудиокадров. Таким образом, спектральный минимум m_f последовательности текущих аудиокадров может быть использован для оценки уровня шума в течении периода времени, покрываемого данной последовательностью аудиокадров. Это может позволить получать хорошую оценку уровня шума текущего кадра, вместе с тем сохраняя сложность достаточно низкой. Пиковый уровень p предпочтительно вычисляется, используя формулу , в которой a_k - это коэффициенты линейного предсказания, при k=0....15 предпочтительно. Таким образом, если кадр содержит 16 коэффициентов линейного предсказания, p в некоторых вариантах осуществления вычисляется путем суммирования амплитуд предпочтительно 16 a_k.

Предпочтительно, аудиодекодер приспособлен для декодирования бесформенного MDCT-возбуждения текущего кадра и для вычисления его средних квадратичных e_rms из представления спектральной области текущего кадра для получения информации об уровне шума в качестве первой информации, если текущий кадр относится к типу обычного звука. Это является предпочтительным вариантом осуществления изобретения всякий раз, когда текущий кадр не является кадром речевого сигнала, но является кадром обычного звука. Представление спектральной области в кадрах MDCT или DTX в значительной степени эквивалентно представлениям временной области в кадрах речевого сигнала, например, кадры CELP или (A)CELP. Отличие состоит в том, что MDCT не принимает во внимание теорему Парсеваля. Таким образом, предпочтительно среднее квадратичное e_rms для кадра обычного звука вычисляется аналогично среднему квадратичному e_rms для кадров речевого сигнала. Затем, предпочтительно вычисляются эквиваленты коэффициентов LPC кадров обычного звука, как изложено в WO 2012/110476 A1, например, используя энергетический спектр MDCT, который относится к квадрату значений MDCT на шкале Барка. В альтернативном варианте осуществления, диапазон частот энергетического спектра MDCT может иметь постоянную ширину, так что шкала спектра соответствует линейной шкале. С такой линейной шкалой вычисленные эквиваленты коэффициентов LPC похожи на коэффициенты LPC в представлении временной области того же кадра, как, например, вычисленные для кадров ACELP или CELP. Более того, предпочтительно чтобы, если текущий кадр относится к типу обычного звука, пиковый уровень p передаточной функции фильтра LPC текущего кадра, который был вычислен из кадра MDCT, как изложено в WO 2012/110476 A1, вычислялся как вторая информация, таким образом используя коэффициенты линейного предсказания для получения информации об уровне шума, при условии, что текущий кадр относится к типу обычного звука. Затем, если текущий кадр относится к типу обычного звука, предпочтительно вычислять спектральный минимум текущего аудиокадра, путем вычисления отношения среднего квадратичного e_rms и пикового уровня p, для получения информации об уровне шума, при условии, что текущий кадр относится к типу обычного звука. Таким образом, отношение, описывающее спектральный минимум m_f текущего аудиокадра, может быть получено независимо от того, относится ли текущий кадр к типу речи или к типу обычного звука.

В предпочтительном варианте осуществления, аудиодекодер приспособлен ставить в очередь отношение, полученное из текущего аудиокадра в средстве оценки уровня шума, независимо от типа кадра, средство оценки уровня шума содержит хранилище уровня шума для двух или более отношений, полученных из различных аудиокадров. Это может быть полезным, если аудиодекодер приспособлен переключаться между декодированием кадров речевого сигнала и декодированием кадров обычного звука, например, когда применяется унифицированное декодирование речи и аудиос малой задержкой (LD-USAC, EVS). Таким способом, средний уровень шума множества кадров может быть получен независимо от типа кадра. Предпочтительно, хранилище уровня шума может удерживать десять или более отношений, полученных из десяти или более предыдущих аудиокадров. Например, хранилище уровня шума может содержать участки памяти для отношений 30 кадров. Таким образом, уровень шума может быть вычислен для длительного времени, предшествующего текущему кадру. В некоторых вариантах осуществления, отношение может ставиться в очередь только в средстве оценки уровня шума, когда текущий кадр определен как относящийся к типу речи. В других вариантах осуществления, отношение может ставится в очередь только в средстве оценки уровня шума, когда текущий кадр определен как относящийся к типу обычного звука.

Предпочтительно, средство оценки уровня шума приспособлено для оценки уровня шума на основе статистического анализа двух или более отношений различных аудиокадров. В варианте осуществления изобретения, аудиодекодер приспособлен использовать слежение за спектральной плотностью мощности шума, основанное на минимальной средней квадратичной погрешности, для статистического анализа отношений. Такое слежение описано в публикации Hendriks, Heusdens и Jensen [2]. Если способ согласно [2] будет применяться, аудиодекодер приспособлен для использования квадратного корня отслеживаемой величины при статистическом анализе, как в настоящем случае амплитуда спектра ищется напрямую. В другом варианте осуществления изобретения, минимум статистики, известной из [3], используется для анализа двух или более отношений различных аудиокадров.

В предпочтительном варианте осуществления, аудиодекодер содержит ядро декодера, сконфигурированное для декодирования аудиоинформации текущего кадра, используя коэффициент линейного предсказания текущего кадра для получения декодированного выходного сигнала основного кодера, и средство вставки шума добавляет шум в зависимости от коэффициента линейного предсказания, использованного при декодировании аудиоинформации текущего кадра, и/или использованных при декодировании аудиоинформации одного или более предыдущих кадров. Таким образом, средство вставки шума использует такие же коэффициенты линейного предсказания, что используются при декодировании аудиоинформации текущего кадра. Побочная информация для инструктирования средства вставки шума может быть исключена.

Предпочтительно, аудиодекодер содержит фильтр компенсации предыскажений для компенсации предыскажений текущего кадра, аудиодекодер выполнен с возможностью применения фильтра компенсации предыскажений к текущему кадру после того, как средством вставки шума добавлен шум в текущий кадр. Так как компенсация предыскажений является БИХ-усилением (усилением с бесконечной импульсной характеристикой) первого порядка низких частот, это дает возможность для БИХ-фильтрации резких верхних частот с низкой сложностью в отношении добавляемого шума с устранением слышимых артефактов шума при низких частотах.

Предпочтительно, аудиодекодер содержит генератор шума, причем генератор шума приспособлен для генерации шума, который добавляется к текущему кадру средством вставки шума. Генератор шума, включенный в аудиодекодер, может обеспечивать более удобный аудиодекодер, так как не нужен внешний генератор шума. В альтернативном варианте, шум может быть предоставлен внешним генератором шума, который может быть соединен с аудиодекодером через интерфейс. Например, специальные типы генераторов шума могут быть применены, в зависимости от фонового шума, который должен быть усилен в текущем кадре.

Предпочтительно, генератор шума сконфигурирован для генерации случайного белого шума. Такой шум в достаточной мере напоминает обычные фоновые шумы, и такой генератор шума может быть легко предоставлен.

В предпочтительном варианте осуществления изобретения, средство вставки шума сконфигурировано для добавления шума в текущий кадр при условии, что скорость передачи битов закодированной аудиоинформации меньше, чем 1 бит на отсчет. Предпочтительно скорость передачи битов закодированной аудиоинформации меньше, чем 0,8 бит на отсчет. Даже еще более предпочтительно, чтобы средство вставки шума было сконфигурировано для добавления шума в текущий кадр при условии, что скорость передачи битов закодированной аудиоинформации меньше, чем 0,5 бит на отсчет.

В предпочтительном варианте осуществления, аудиодекодер сконфигурирован для использования кодера, который основан на одном или более кодерах AMR-WB, G.718 или LD-USAC (EVS), чтобы декодировать закодированную аудиоинформацию. Это хорошо известные и широко распространенные кодеры (A)CELP, в которых дополнительное использование таких способов наполнения шумом может быть весьма полезно.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Варианты осуществления настоящего изобретения в последующем описаны по фигурам.

Фиг. 1 показывает первый вариант осуществления аудиодекодера согласно настоящему изобретению;

Фиг. 2 показывает первый способ выполнения декодирования аудио согласно настоящему изобретению, который может быть выполнен аудиодекодером согласно Фиг. 1;

Фиг. 3 показывает второй вариант осуществления аудиодекодера согласно настоящему изобретению;

Фиг. 4 показывает второй способ выполнения декодирования аудио согласно настоящему изобретению, который может быть выполнен аудиодекодером согласно Фиг. 3;

Фиг. 5 показывает третий вариант осуществления аудиодекодера согласно настоящему изобретению;

Фиг. 6 показывает третий способ выполнения декодирования аудио согласно настоящему изобретению, который может быть выполнен аудиодекодером согласно Фиг. 5;

Фиг. 7 показывает иллюстрацию способа вычисления спектральных минимумов m_f для оценки уровня шума;

Фиг. 8 показывает схему, иллюстрирующую выведение отклонения из коэффициентов LPC; и

Фиг. 9 показывает схему, иллюстрирующую, каким образом эквиваленты фильтра LPC определяется из энергетического спектра MDCT.

ПОДРОБНОЕ ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ

Изобретение описано подробно в отношении фигур с 1 по 9. Изобретение никоим образом не подразумевается ограниченным показанными и описанными вариантами осуществления.

Фиг. 1 показывает первый вариант осуществления аудиодекодера согласно настоящему изобретению. Аудиодекодер приспособлен для предоставления декодированной аудиоинформации на основе закодированной аудиоинформации. Аудиодекодер сконфигурирован для использования кодера, который может быть основан на AMR-WB, G.718 и LD-USAC (EVS), чтобы декодировать закодированную аудиоинформацию. Закодированная аудиоинформация содержит коэффициенты линейного предсказания (LPC), которые могут быть индивидуально обозначены как коэффициенты a_k. Аудиодекодер содержит средство регулирования отклонения, сконфигурированное для регулирования отклонения шума, используя коэффициенты линейного предсказания текущего кадра для получения информации об отклонении, и средство вставки шума, сконфигурированное для добавления шума к текущему кадру в зависимости от информации об отклонении, полученной вычислителем отклонения. Средство вставки шума сконфигурировано для добавления шума в текущий кадр при условии, что скорость передачи битов закодированной аудиоинформации меньше, чем 1 бит на отсчет. Более того, средство вставки шума может быть сконфигурировано для добавления шума в текущий кадр при условии, что текущий кадр является кадром речевого сигнала. Таким образом, шум может быть добавлен в текущий кадр для того, чтобы улучшить общее качество звука декодированной аудиоинформации, которое может быть ухудшено из-за артефактов кодирования, что особенно касается фонового шума в речевой информации. Когда отклонение шума отрегулировано с учетом отклонения текущего аудиокадра, общее качество звука может быть улучшено независимо от побочной информации в битовом потоке. Таким образом, количество данных, передаваемых с битовым потомком, может быть уменьшено.

Фиг. 2 показывает первый способ выполнения декодирования аудио согласно настоящему изобретению, который может быть выполнен аудиодекодером согласно Фиг. 1. Технические подробности аудиодекодера, изображенного на Фиг. 1, описаны вместе с признаками способа. Аудиодекодер приспособлен для чтения битового потока закодированной аудиоинформации. Аудиодекодер содержит средство определения типа кадра, которое определяет тип кадра текущего кадра, средство определения типа кадра выполнено с возможностью активации средства регулирования отклонения, которое регулирует отклонение шума, когда тип кадра текущего кадра определен как относящийся к типу речи. Таким образом, аудиодекодер определяет тип кадра текущего аудиокадра посредством применения средства определения типа кадра. Если текущий кадр является кадром ACELP, то средство определения типа кадра активирует средство регулирования отклонения. Средство регулирования отклонения сконфигурировано для использования результата анализа первого порядка коэффициентов линейного предсказания текущего кадра для получения информации об отклонении. Более точно, средство регулирования отклонения вычисляет приращение g, используя формулу , в качестве анализа первого порядка, где a_k - это коэффициенты LPC текущего кадра. Фиг. 8 показывает схему, иллюстрирующую выведение отклонения из коэффициентов LPC. Фиг. 8 показывает два кадра слова "see". Для буквы "s", которая содержит большое количество высоких частот, отклонение поднимается. Для букв "ee", которые содержат большое количество низких частот, отклонение опускается. Отклонение спектра, показанный на Фиг. 8, - это передаточная функция прямой реализации фильтра , g определяется как указано выше. Таким образом, средство регулирования отклонения использует LPC коэффициенты, полученные из битового потока и использованные для декодирования закодированной аудиоинформации. Побочная информация может быть исключена соответствующим образом, что может уменьшить количество данных, передаваемых с битовым потоком. Более того, средство регулирования отклонения сконфигурировано для получения информации об отклонении, с помощью вычисления передаточной функции прямой реализации фильтра . Соответственно, средство регулирования отклонения вычисляет отклонение аудиоинформации в текущем кадре, вычисляя передаточную функцию прямой реализации фильтра , с помощью предварительно вычисленного приращения g. После того, как информации об отклонении получена, средство регулирования отклонения регулирует отклонение шума, добавляемого к текущему кадру, в зависимости от информации об отклонении текущего кадра. После чего отрегулированный шум добавляется к текущему кадру. Более того, на Фиг. 2 не показано, что аудиодекодер содержит фильтр компенсации предыскажений для компенсации предыскажений текущего кадра, аудиодекодер выполнен с возможностью применения фильтра компенсации предыскажений к текущему кадру после того, как средством вставки шума добавлен шум в текущий кадр. После компенсации предыскажений кадра, которая также служит в качестве БИХ-фильтрации резких верхних частот с низкой сложностью в отношении добавленного шума, аудиодекодер предоставляет декодированную аудиоинформацию. Таким образом, способ согласно Фиг. 2 позволяет увеличивать качество звука аудиоинформации посредством регулирования отклонения шума, добавляемого к текущему кадру для того, чтобы улучшить качество фонового шума.

Фиг. 3 показывает второй вариант осуществления аудиодекодера согласно настоящему изобретению. Аудиодекодер также приспособлен для предоставления декодированной аудиоинформации на основе закодированной аудиоинформации. Аудиодекодер также сконфигурирован для использования кодера, который может быть основан на AMR-WB, G.718 и LD-USAC (EVS), чтобы декодировать закодированную аудиоинформацию. Закодированная аудиоинформация также содержит коэффициенты линейного предсказания (LPC), которые могут быть индивидуально обозначены как коэффициенты a_k. Аудиодекодер согласно второму варианту осуществления содержит средство оценки уровня шума, сконфигурированное для оценки уровня шума текущего кадра, используя коэффициенты линейного предсказания по меньшей мере одного предыдущего кадра для получения информации об уровне шума, и средство вставки шума, сконфигурированное для добавления шума к текущему кадру в зависимости от информации об уровне шума, полученной средством оценки уровня шума. Средство вставки шума сконфигурировано для добавления шума в текущий кадр при условии, что скорость передачи битов закодированной аудиоинформации меньше, чем 0,5 бит на отсчет. Более того, средство вставки шума сконфигурировано для добавления шума в текущий кадр при условии, что текущий кадр является кадром речевого сигнала. Таким образом, шум также может быть добавлен в текущий кадр для того, чтобы улучшить общее качество звука декодированной аудиоинформации, которое может быть ухудшено из-за артефактов кодирования, что особенно касается фонового шума в речевой информации. Когда уровень шума в шуме отрегулирован с учетом уровня шума по меньшей мере одного предыдущего аудиокадра, общее качество звука может быть улучшено независимо от побочной информации в битовом потоке. Таким образом, количество данных, передаваемых с битовым потомком, может быть уменьшено.

Фиг. 4 показывает второй способ выполнения декодирования аудио согласно настоящему изобретению, который может быть выполнен аудиодекодером согласно Фиг. 3. Технические подробности аудиодекодера, изображенного на Фиг. 3, описаны вместе с признаками способа. Согласно Фиг. 4, аудиодекодер сконфигурирован для чтения битового потока для того, чтобы определять тип кадра текущего кадра. Более того, аудиодекодер содержит средство определения типа кадра, которое определяет тип кадра текущего кадра, средство определения типа кадра выполнено с возможностью распознавать, относится ли тип кадра текущего кадра к типу речи или к типу обычного звука, для того чтобы оценка уровня шума могла быть выполнена в зависимости от типа кадра текущ

Наполнение шумом без побочной информации для celp-подобных кодеров

Патент 2648953