2335809 - Аудиокодирование

Аудиокодирование

Иллюстрации

Показать все

Изобретение относится к аудиокодированию и, в частности, к аудиокодированию, которое позволяет кодировать аудиосигналы с коротким временем задержки. Сущность изобретения состоит в том, чтобы исключить известную процедуру, заключающуюся в интерполяции относительно коэффициентов фильтра и величины усиления для получения интерполированных величин для промежуточных аудиозначений, причем кодирование может быть осуществлено не интерполяцией величины усиления, а использованием предельного значения мощности, полученного из порогового значения маскирования, предпочтительно, как область ниже квадрата величины порогового значения маскирования, для каждого узла, то есть для каждой передаваемой параметризации, с последующим выполнением интерполяции между этими предельными значениями мощности в соседних узлах, например линейной интерполяции. Как на стороне кодера, так и на стороне декодера величина усиления может быть затем вычислена по промежуточному предельному значению мощности, полученному таким образом, чтобы шум квантования, вызываемый квантованием с постоянной частотой перед последующей фильтрацией на стороне декодера, находился ниже предельного значения мощности или соответствовал ему после последующей фильтрации. Технический результат - обеспечение при кодировании снижения прослушиваемых аудиопомех. 5 н. и 11 з.п. ф-лы, 15 ил.

Реферат

Изобретение, в общем, относится к аудиокодированию и, в частности, к аудиокодированию, которое позволяет кодировать аудиосигналы с коротким временем задержки.

В настоящее время наиболее известен способ сжатия аудио согласно стандарту MPEG-1 Layer III. При использовании этого способа сжатия дискретные значения или аудиозначения аудиосигнала кодируются для получения кодированного сигнала с потерями. Другими словами, при сжатии уменьшаются, или, в идеале, исключаются несущественные и избыточные компоненты исходного аудиосигнала. С этой целью с помощью психоакустической модели распознают одновременное и временное маскирование, то есть, в зависимости от аудиосигнала вычисляется или определяется временное изменение порогового значения маскирования, которое обозначает уровень тональных сигналов определенной частоты, воспринимаемых слухом человека. Эта информация, в свою очередь, используется для кодирования сигнала путем квантования спектральных значений аудиосигнала более точным или менее точным способом, или вообще не используется, в зависимости от порогового значения маскирования, и интегрирования для получения кодированного сигнала.

Возможности применения способов сжатия аудио, таких как, например, формат MP3, ограничены, когда аудиоданные необходимо передавать через канал передачи данных с ограниченной скоростью передачи битов, с одной стороны, в сжатой форме, но, с другой стороны, с как можно меньшим временем задержки. В некоторых вариантах применения время задержки не играет роли, например, при архивировании аудиоинформации. Однако когда требуется передавать аудиосигналы, критичные по времени, например, во время телеконференций, в беспроводных громкоговорителях или микрофонах, необходимы аудиокодеры с малым временем задержки, которые иногда называют "кодерами со сверхнизкой задержкой". Для таких областей применения, в статье Schuller G. Et al. "Perceptual Audio Coding using Adaptive Pre- and Post-Filters and Lossless Compression", IEEE Transactions on Speech and Audio Processing, vol. 10, no. 6, сентябрь 2002 г., стр. 379-390, предложено аудиокодирование, при котором уменьшение не существенных компонентов и уменьшение избыточности выполняется не на основе одного преобразования, а с использованием двух отдельных преобразований.

Ниже, со ссылкой на Фиг.12 и 13, будет описан этот принцип. Кодирование начинается с аудиосигнала 902, дискретизация которого уже была проведена и, который, таким образом, уже присутствует как последовательность 904 аудиозначений 906 или дискретных значений, в котором временный порядок аудиозначений 906 обозначен стрелкой 908. Пороговое значение слуха вычисляется с помощью психоакустической модели для последовательных блоков аудиозначений 906, характеризуемых нарастающей нумерацией, такой как "блок №". На Фиг.13, например, показана схема, на которой представлен график «а» частотного спектра блока сигналов из 128 аудиозначений 906, и график «b» порогового значения маскирования, которое было вычислено по психоакустической модели в логарифмических единицах. Пороговое значение маскирования обозначает, как указано выше, уровень, до которого данная частота остается неслышимой для человеческого уха, а именно все тоны, находящиеся ниже порогового значения b маскирования. На основе пороговых значений слышимости, вычисленных для каждого блока, обеспечивается уменьшение несущественных компонентов путем управления параметризируемым фильтром, который установлен после квантователя. Параметризация для параметризируемого фильтра вычисляется таким образом, чтобы его частотный отклик соответствовал обратной величине порогового значения маскирования. Такая параметризация обозначена на Фиг.12, как x_#(i).

После фильтрации аудиозначений 906, выполняется квантование с постоянным размером шага, например, с использованием операции округления до следующего целого числа. Шумы квантования, возникающие при этом, представляют собой белый шум. На стороне декодера отфильтрованный сигнал "повторно преобразуется" снова с помощью параметризируемого фильтра, передаточная функция которого устанавливается в соответствии с величиной его собственного порогового значения маскирования. С помощью этой операции не только снова фильтруется отфильтрованный сигнал, но также регулируются шумы квантования на стороне декодера в соответствии с формой порогового значения маскирования. Для того чтобы шумы квантования как можно более точно соответствовали пороговому значению маскирования, величина«a_#» усиления,применяемая к отфильтрованному сигналу перед квантованием, вычисляется на стороне кодера для каждого установленного параметра или для каждой параметризации. Для выполнения повторного преобразования на стороне декодера величина «а» усиления и параметризация «x» передаются в кодер как дополнительная информация 910, вместе с действительными основными данными, а именно квантованными отфильтрованными аудиозначениями 912. Для уменьшения 914 избыточности этих данных, то есть, дополнительной информации 910 и основных данных 912, они подвергаются сжатию без потерь, а именно энтропийному кодированию, в результате чего обеспечивается кодированный сигнал.

В указанной выше статье в качестве размера блоков предложено использовать 128 дискретных значений 906. Это позволяет обеспечить относительно короткую задержку, равную 8 мс, при частоте дискретизации 32 кГц. Со ссылкой на подробную реализацию в статье также указано, что для увеличения эффективности кодирования дополнительной информации дополнительная информация, а именно коэффициентыx_# и а_#, передаются только в том случае, если происходят достаточные изменения по сравнению с параметром, переданным ранее, то есть если изменения превышают определенное пороговое значение. Кроме того, описано, что реализация предпочтительным образом выполняется так, чтобы текущий установленный параметр не применялся непосредственно ко всем дискретным значениям, принадлежащим соответствующему блоку, но вместо этого использовалась линейная интерполяция коэффициентов x_# фильтра для исключения слышимых ложных сигналов. Для выполнения линейной интерполяции коэффициентов фильтра предложено использовать решетчатую структуру фильтра, чтобы предотвратить возникновение нестабильности. В случае, когда требуется получить кодированный сигнал с управляемой скоростью передачи битов, в статье также предлагается избирательно усиливать или ослаблять фильтрованный сигнал, масштабированный коэффициентом усиления, зависимым от времени, причем этот коэффициент не равен 1, в результате чего возникают слышимые помехи, но при этом скорость передачи битов можно уменьшить в тех частях аудиосигнала, которые трудно поддаются кодированию.

Хотя схема аудиокодирования, описанная в указанной выше статье, уже уменьшает время задержки в достаточной степени для многих вариантов применения, проблема указанной выше схемы состоит в том, что из-за требований обеспечения передачи порогового значения маскирования или передаточной функции фильтра на стороне кодера, который далее называется предварительным фильтром, канал передачи относительно сильно загружен, даже при передаче коэффициентов фильтра только в случае превышений заданного порогового значения.

Другой недостаток приведенной выше схемы кодирования состоит в том, что поскольку пороговое значение маскирования или его инверсное значение необходимо сделать доступным на стороне декодера путем передачи установленного параметраx_#, необходимо принимать компромиссное решение между наименьшей возможной скоростью передачи битов или высокой степенью сжатия, с одной стороны, и наиболее точной возможной аппроксимацией или параметризацией порогового значения маскирования или его инверсного значения, с другой стороны. Таким образом, шумы квантования, отрегулированные по отношению к пороговому значению маскирования с помощью описанной выше схемы аудиокодирования, неизбежно будут превышать пороговое значение маскирования в некоторых частотных диапазонах, в результате чего возникают воспринимаемые слушателем аудиопомехи. На Фиг.13, например, показан в виде графика «c» параметризованный частотный отклик параметризируемого фильтра на стороне декодера. Как можно видеть, здесь присутствуют области, где функция передачи фильтра на стороне декодера, который далее называется последующим фильтром, превышает пороговое значение «b» маскирования. Эта проблема усиливается в результате того, что параметризация передается только периодически при достаточном изменении значений параметризации и с использованием интерполяции между ними. Интерполяция коэффициентов «x_#» фильтра, как предложено в статье, сама по себе приводит к возникновению слышимых помех, когда величина усиления «а_#» поддерживается постоянной от узла к узлу или от новой параметризации к следующей параметризации. Даже если предлагаемую в статье интерполяцию также применить для величины «a_#»дополнительной информации, то есть, к переданному коэффициенту усиления, то в аудиосигнале, поступающем на сторону декодера, могут оставаться прослушиваемые аудиопомехи.

Другая проблема схемы аудиокодирования в соответствии с Фиг.12 и 13 состоит в том, что отфильтрованный сигнал может, из-за частотной избирательной фильтрации, принимать непредсказуемую форму, когда, в частности в результате случайного наложения множества отдельных гармоник, одно или несколько отдельных аудиозначений кодированного сигнала суммируются с получением очень большого значения, что, в свою очередь, приводит к худшему коэффициенту сжатия при последующем уменьшении избыточности из-за их редкого появления.

Задача настоящего изобретения состоит в создании схемы аудиокодирования, которая позволяет обеспечить кодирование, в результате которого возникает меньшее количество прослушиваемых аудиопомех.

Этот результат достигается в способе по пп. 13 или 15 формулы изобретения и в устройстве по пп. 1 или 14 формулы изобретения.

Кодирование аудиосигнала, состоящего из последовательности аудиозначений, в соответствии с изобретением, для получения кодированного сигнала включает в себя определение первого порогового значения слышимости для первого блока аудиозначений последовательности аудиозначений и второго порогового значения слышимости для второго блока аудиозначений последовательности аудиозначений; вычисление версии первой параметризации параметризируемого фильтра так, чтобы его передаточная функция приблизительно соответствовала обратному значению величины первого порогового значения слышимости, и версии второй параметризации параметризируемого фильтра так, чтобы его передаточная функция приблизительно соответствовала обратному значению величины второго порогового значения слышимости; определение первого предельного значения мощности шумов в зависимости от первого порогового значения маскирования и второго предельного значения мощности шумов в зависимости от второго порогового значения маскирования; параметризируемую фильтрацию и масштабирование или усиление заданного блока аудиозначений последовательности аудиозначений для получения блока масштабированных, отфильтрованных аудиозначений, соответствующих заданному блоку, причем последний этап содержит следующие подэтапы: интерполяцию между версией первой параметризации и версией второй параметризации для получения версии интерполированной параметризации для заданного аудиозначения в заданном блоке аудиозначений; интерполяцию между первым предельным значением мощности шумов и вторым предельным значением мощности шумов для получения интерполированного предельного значения мощности шумов для заданного аудиозначения; определение промежуточного значения масштабирования в зависимости от интерполированного предельного значения мощности шумов; и применение параметризируемого фильтра с версией интерполированной параметризации и промежуточного значения масштабирования к заданному аудиозначению для получения одного из масштабированных отфильтрованных аудиозначений. И, наконец, выполняют квантование масштабированных отфильтрованных аудиозначений для получения блока квантованных, масштабированных отфильтрованных аудиозначений; и интеграцию информации в кодированный сигнал, из которого можно получить блок квантованных масштабированных отфильтрованных аудиозначений, версию первой параметризации, версию второй параметризации, первое предельное значение мощности шумов и второе предельное значение мощности шумов.

Основная идея настоящего изобретения состоит в том, что необходимо исключить описанную выше процедуру, а именно интерполяцию в отношении коэффициентов фильтра и величины усиления, для получения интерполированных значений для промежуточных аудиозначений, начиная от узлов. Кодирование, содержащее меньшее количество слышимых ложных сигналов, может быть получено не в результате выполнения интерполяции величины усиления, а вместо этого, с использованием предельного значения мощности, полученного из порогового значения маскирования, предпочтительно, как область ниже квадрата величины порогового значения маскирования, для каждого узла, то есть, для каждой параметризации, предназначенной для передачи, с последующим выполнением интерполяции между этими предельными значениями мощности соседних узлов, например линейной интерполяции. Как на стороне кодера, так и на стороне декодера величина усиления затем может вычисляться из промежуточного предельного значения мощности, определенного таким образом, чтобы шум квантования, обусловленный квантованием, который имеет постоянную частоту перед последующей фильтрацией на стороне декодера, был ниже, чем предельное значение мощности, или соответствовал ему после последующей фильтрации.

Предпочтительные варианты выполнения настоящего изобретения подробно описаны ниже, со ссылкой на прилагаемые чертежи, на которых показано следующее:

Фиг.1 - блок-схема аудиокодера в соответствии с вариантом выполнения настоящего изобретения.

Фиг.2 - блок-схема последовательности операций, иллюстрирующая режим функционирования аудиокодера по Фиг.1 при вводе данных.

Фиг.3 - блок-схема последовательности операций, иллюстрирующая режим функционирования аудиокодера по Фиг.1 в отношении оценки поступающего аудиосигнала с использованием психоакустической модели.

Фиг.4 - блок-схема последовательности операций, иллюстрирующая режим функционирования аудиокодера по Фиг.1, в отношении применения параметров, полученных с помощью психоакустической модели для поступающего аудиосигнала.

Фиг.5a - схема, иллюстрирующая поступающий аудиосигнал, последовательность аудиозначений, из которых он состоит, и этапы работы по Фиг.4 в отношении аудиозначений.

Фиг.5b - схема, иллюстрирующая установку кодированного сигнала.

Фиг.6 - блок-схема последовательности операций, иллюстрирующая режим функционирования аудиокодера по Фиг.1, в отношении окончательной обработки вплоть до получения кодированного сигнала.

Фиг.7a - схема варианта выполнения функции этапа квантования.

Фиг.7b - схема другого варианта выполнения функции этапа квантования.

Фиг.8 - блок-схема аудиокодера, который позволяет декодировать аудиосигнал, кодированный с помощью аудиокодера по Фиг.1, в соответствии с вариантом выполнения настоящего изобретения.

Фиг.9 - блок-схема последовательности операций, иллюстрирующая режим функционирования декодера по Фиг.8 при вводе данных.

Фиг.10 - блок-схема последовательности операций, иллюстрирующая режим функционирования декодера по Фиг.8, в отношении буферизации предварительно декодированных квантованных и отфильтрованных аудиоданных и обработки аудиоблоков без соответствующей дополнительной информации.

Фиг.11 - блок-схема последовательности операций, иллюстрирующая режим функционирования декодера по Фиг.8, в отношении действительно выполняемой обратной фильтрации.

Фиг.12 - обычная схема кодирования звука, с коротким временем задержки.

Фиг.13 - схема, в которой в качестве примера представлен спектр аудиосигнала, его пороговое значение слышимости и функция передачи последующего фильтра в декодере.

На Фиг.1 показан аудиокодер в соответствии с вариантом выполнения настоящего изобретения. Аудиокодер 10 имеет информационный вход 12, через который в него подается аудиосигнал, предназначенный для кодирования, который, как описано более подробно ниже со ссылкой на Фиг.5a, состоит из последовательности аудиозначений или дискретных значений, и информационный выход, через который выводится кодированный сигнал, информационное содержание которого более подробно описано ниже со ссылкой на Фиг.5b.

Аудиокодер 10 по Фиг.1 разделен на часть 16 уменьшения несущественного звука и часть 18 уменьшения избыточности. Часть 16 уменьшения несущественного звука включает в себя средство 20 определения порогового значения слышимости, средство 22 вычисления величины усиления, средство 24 вычисления параметризации, средство 26 сравнения узла, квантователь 28 и параметризируемый предварительный фильтр 30, а также выходной буфер 32 FIFO («первым прибыл, первым обслужен»), буфер или запоминающее устройство 38 и умножитель или средство 40 умножения. Часть 18 уменьшения избыточности включает в себя блок 34 сжатия и контроллер 36 скорости передачи битов.

Часть 16 уменьшения несущественного звука и часть 18 уменьшения избыточности включены последовательно в указанном порядке между информационным входом 12 и информационным выходом 14. В частности, информационный вход 12 соединен с информационным входом средства 20 определения порогового значения слышимости и с информационным входом входного буфера 32. Информационный выход средства 20 определения порогового значения слышимости соединен со входом средства 24 вычисления параметризации и информационным входом средства 22 вычисления величины усиления для передачи на них определенного порогового значения слышимости. Средства 22 и 24 вычисляют, соответственно, параметризацию и величину усиления на основе порогового значения слышимости и соединены со средством 26 сравнения узла для передачи в него полученных результатов. В зависимости от результата сравнения средство 26 сравнения узла, как описано ниже, передает результаты, вычисленные средствами 22 и 24, в качестве входного параметра или параметризации параметризируемого предварительного фильтра 30. При этом средство 22 реализует функцию определения первого предельного значения мощности шумов в зависимости от первого порога маскирования и второго предельного значения мощности шумов в зависимости от второго порогового значения маскирования, как более подробно описано ниже. Параметризуемый предварительный фильтр 30 включен между информационным выходом входного буфера 32 и информационным входом буфера 38. Умножитель 40 включен между информационным выходом буфера 38 и квантователем 28. Квантователь 28 передает отфильтрованные аудиозначения, которые могут быть умножены или масштабированы, но всегда квантованы, в часть 18 уменьшения избыточности, более точно на информационный вход блока 34 сжатия. Средство 26 сравнения узла передает информацию, из которой могут быть выведены входные параметры, переданные в параметризируемый предварительный фильтр 30, для части 18 уменьшения избыточности, более точно на другой информационный вход блока 34 сжатия. Контроллер скорости передачи битов соединен с управляющим входом умножителя 40 через управляющее соединение для передачи квантованных отфильтрованных аудиозначений в том виде, как они были приняты из предварительного фильтра 30, для умножения умножителем 40 на соответствующее множимое, как более подробно описано ниже. Контроллер 36 скорости передачи битов подсоединен между информационным выходом блока 34 сжатия и информационным выходом 14 аудиокодера 10, для соответствующего определения множимого для умножителя 40. Когда каждое аудиозначение проходит квантователь 40 первый раз, множимое вначале устанавливается равным соответствующему коэффициенту масштабирования, например 1. Буфер 38, однако, продолжает сохранять каждое отфильтрованное аудиозначение, обеспечивая для контроллера 36 скорости передачи битов, как более подробно описано ниже, возможность изменения множимого для другого прохода блока аудиозначений. Если такое изменение не указано контроллером 36 скорости передачи битов, буфер 38 может освобождать память, занимаемую этим блоком.

После приведенного выше описания установки аудиокодера по Фиг.1, далее, со ссылкой на Фиг.2-7b, описан режим его функционирования.

Как видно на Фиг.2, аудиосигнал, когда он поступает на информационный вход 12, уже был получен в результате дискретизации 50 аудиосигнала из аналогового аудиосигнала. Дискретизация аудиосигнала выполняется с заданной частотой дискретизации, которая обычно составляет от 32 до 48 кГц. Следовательно, на информационном входе 12 присутствует аудиосигнал, состоящий из последовательности дискретных значений или аудиозначений. Хотя кодирование аудиосигнала не происходит на основе блоков, как очевидно из следующего описания, аудиозначения на информационном входе 12 вначале комбинируются для формирования аудиоблоков, на этапе 52. Комбинирование для формирования аудиоблоков происходит только с целью определения порогового значения слышимости, как очевидно из следующего описания, и происходит на входном этапе средства 20 определения порогового значения слышимости. В настоящем варианте выполнения в качестве примера предполагается, что каждое из 128 последовательных аудиозначений, комбинируется для формирования аудиоблоков, и что комбинирование выполняется таким образом, что, с одной стороны, последовательные аудиоблоки не перекрываются друг с другом и, с другой стороны, они расположены непосредственно рядом друг с другом. Этот пример описан ниже со ссылкой на Фиг.5a.

На Фиг.5a ссылочной позицией 54 обозначена последовательность дискретных значений, причем каждое дискретное значение представлено прямоугольником 56. Дискретные значения пронумерованы с целью иллюстрации, причем для ясности показаны только некоторые дискретные значения последовательности 54. Как обозначено фигурными скобками над последовательностью 54, каждые 128 последовательных дискретных значений скомбинированы так, что они формируют блок в соответствии с настоящим вариантом выполнения, в котором непосредственно последовательные 128 дискретных значений формируют очередной блок. Следует отметить, что комбинирование для формирования блоков также может быть выполнено другим способом, например с перекрытием блоков или раздельными друг от друга блоками, имеющими другой размер блоками, хотя размер блока 128, в свою очередь, является предпочтительным, поскольку он обеспечивает хороший компромисс между высоким качеством аудиосигнала, с одной стороны, и наименьшим возможным временем задержки, с другой стороны.

Когда аудиоблоки, комбинируемые в средстве 20 на этапе 52, последовательно обрабатывают в средстве 20 для определения порогового значения слышимости блок за блоком, поступающие аудиозначения помещаются 54 в буфер во входном буфере 32 до тех пор, пока параметризируемый предварительный фильтр 30 не получит входные параметры из средства 26 сравнения узла для выполнения предварительной фильтрации, как описано ниже.

Как можно видеть на Фиг.3, средство 20 определения порогового значения слышимости начинает свою обработку непосредственно после приема достаточного количества аудиозначений на информационном входе 12, для формирования аудиоблока или для формирования следующего аудиоблока, который отслеживает средство 20 при выполнении проверки на этапе 60. Если полный обрабатываемый аудиоблок пока отсутствует, то средство 20 находится в режиме ожидания. Если полный аудиоблок для проверки присутствует, то средство 20 для определения порогового значения слышимости вычисляет на этапе 62 пороговое значение слышимости на основе соответствующей психоакустической модели. Для иллюстрации порогового значения слышимости рассмотрим снова Фиг.12 и, в частности, график «b», который был получен на основе психоакустической модели, в качестве примера для текущего аудиоблока со спектром «a». Пороговое значение маскирования, которое определяется на этапе 62, представляет собой функцию, зависимую от частоты, которая может изменяться для последовательных аудиоблоков и также может существенно изменяться для разных аудиосигналов, таких как, например, рок-музыка и пьесы классической музыки. Пороговое значение слышимости обозначает пороговое значение для каждой частоты, ниже которого слух человека не может воспринимать помехи.

На последующем этапе 64, средство 24 и средство 22 вычисляют из вычисленного порогового значения М(f) слышимости (f обозначает частоту) величину усиления a или параметр р, установленный на основе N параметров x(i) (i = 1,..., N). Параметризация x(i), которую на этапе 64 вычисляет средство 24, передается в параметризируемый предварительный фильтр 30, который, например, выполнен как структура адаптивного фильтра такого типа, как используется при кодировании КЛП (LPC = кодирование методом линейного предсказания). Например, в случае, когда s(n), n = 0,..., 127 представляет 128 аудиозначений текущего аудиоблока и s'(n) представляет получаемый в результате 128 отфильтрованных аудиозначений, фильтр, в качестве примера, может быть выполнен таким образом, что в нем будет использоваться следующее уравнение:

где K представляет собой порядок фильтра и a_k ^t, k = 1,..., K, представляют коэффициенты фильтра, и индекс t предназначен для иллюстрации того, что коэффициенты фильтра изменяются в последовательных аудиоблоках. Средство 24 затем вычисляет параметризацию a_k ^t так, что функция H(f) передачи параметризируемого предварительного фильтра 30 приблизительно равняется обратному значению величины порогового значения М(f) маскирования, то есть так, чтобы применялось следующее уравнение:

в котором зависимость от t, в свою очередь, предназначена для иллюстрации того, что пороговое значение М(f) маскирования изменяется для разных аудиоблоков. При выполнении предварительного фильтра 30 в форме адаптивного фильтра, указанной выше, коэффициенты a_k ^t фильтра будут получены следующим образом: обратное дискретное преобразование Фурье |M(f, t)|² по частоте для блока в момент времени t приводит к получению целевой функции автокорреляции r^t _mn(i). Затем a_k ^t получают путем решения линейной системы уравнений:

Для того чтобы не возникала нестабильность между параметризацией линейной интерполяции, описанной более подробно ниже, для фильтра 30 предпочтительно использовать решетчатую структуру, в которой коэффициенты фильтра решетчатой структуры повторно параметризируют для формирования коэффициентов отражения. Более подробное описание структуры предварительного фильтра, предназначенного для расчета коэффициентов и повторной параметризации, содержится в статье Schuller и др., указанной во вводной части описания и, в частности, на страницу 381, раздел III, включенной в настоящий документ посредством ссылки.

В то время как средство 24 вычисляет параметризацию для параметризируемого предварительного фильтра 30 так, что его передаточная функция равна обратному значению порогового значения маскирования, средство 22 вычисляет предельное значение мощности шумов на основе порогового значения слышимости, а именно предельное значение, обозначающее какая мощность шума может вводиться квантователем 28 в аудиосигнал, отфильтрованный предварительным фильтром 30, для того чтобы шумы квантования на стороне декодера были ниже порогового значения M(f) слышимости или точно равнялись ему после последующей или обратной фильтрации. Средство 22 вычисляет это предельное значение мощности шумов как область ниже квадрата величины порогового значения М слышимости, то есть, как S|M(f)|². Средство 22 вычисляет величину «а» усиления на основе предельного значения мощности шумов путем вычисления корня из доли мощности шумов квантования, разделенной на предельное значение мощности шумов. Шумы квантования представляют собой шумы, вносимые квантователем 28. Шум, вносимый квантователем 28, как описано ниже, представляет собой белый шум и, таким образом, не зависит от частоты и характеризуется мощностью шумов квантования.

Как следует из приведенного выше описания, средство 22 также вычисляет предельное значение мощности шумов на основе величины «а» усиления. Хотя возможно повторное вычисление предельного значения мощности шумов средством 26 сравнения узла на основе величины «а» усиления, полученной средством 22, также возможно, что средство 22 передает определенное предельное значение мощности шумов в средство 26 сравнения узла, помимо значения «a» усиления.

После вычисления величины усиления и параметризации средство 26 сравнения узла выполняет проверку на этапе 66, отличается ли только что вычисленная параметризация больше, чем на заданное пороговое значение от текущей последней параметризации, переданной в параметризируемый предварительный фильтр. Если проверка на этапе 66 покажет, что только что вычисленная параметризация отличается от текущей больше, чем на заданное пороговое значение, только что вычисленные коэффициенты фильтра и только что вычисленная величина усиления, или предельное значение мощности шумов буферизуются в средстве 26 сравнения узла для интерполяции, как описано ниже, и средство 26 сравнения узла передает в предварительный фильтр 30 коэффициенты фильтра, вычисленные на этапе 68, и величину усиления, вычисленную на этапе 70. В противном случае, вычисленная параметризация отличается от текущей не более чем на заданное пороговое значение, средство (26) сравнения узла передает в предварительный фильтр 30 на этапе 72 вместо только что вычисленной параметризации только текущую параметризацию узла, то есть ту параметризацию, которая в последний раз позволила получить положительный результат на этапе 66, то есть отличавшуюся от предыдущей параметризации узла больше, чем на заданное пороговое значение. После этапов 70 и 72 процесс, показанный на Фиг.3, возвращается к обработке следующего аудиоблока, то есть к запросу 60.

В случае, когда только что вычисленная параметризация не отличается от текущей параметризации узла и, следовательно, предварительный фильтр 30 на этапе 72 снова получает полученную ранее параметризацию узла для, по меньшей мере, последнего аудиоблока, предварительный фильтр 30 будет применять эту параметризацию узла для всех дискретных значений этого аудиоблока в FIFO 32, как более подробно описано ниже, каким образом этот текущий блок выбирается из FIFO 32, и квантователь 28 получает результирующий аудиоблок предварительно отфильтрованных аудиозначений.

На Фиг.4 более подробно представлен режим функционирования параметризируемого предварительного фильтра 30 для случая, когда он принимает только что вычисленную параметризацию и только что вычисленное значение усиления, когда они существенно отличаются от текущей параметризации узла. Как описано со ссылкой на Фиг.3, обработка в соответствии с Фиг.4 выполняется не для каждого из последовательных аудиоблоков, но только для тех аудиоблоков, соответствующая параметризация которых существенно отличается от текущей параметризации узла. Другие аудиоблоки, как описано выше, предварительно фильтруются путем применения соответствующей текущей параметризации узла и соответствующего текущего значения величины усиления для всех дискретных значений этих аудиоблоков.

На этапе 80 параметризируемый предварительный фильтр 30 проверяет, произошла ли передача из средства 26 сравнения узла только что вычисленных коэффициентов фильтра или старой параметризации узла. Предварительный фильтр 30 выполняет проверку 80 до тех пор, пока не произойдет такая передача.

Как только такая передача происходит, параметризируемый предварительный фильтр 30 начинает обработку текущего аудиоблока аудиозначений, непосредственно содержащихся в буфере 32, то есть того блока, для которого только что вычислена параметризация. На Фиг.5a, например, представлены все аудиозначения 56 перед аудиозначением с номером 0, которые уже были обработаны и, таким образом, уже прошли через запоминающее устройство 32. Обработка блока аудиозначений перед аудиозначением с номером 0 была запущена, поскольку параметризация, вычисленная для аудиоблока перед блоком 0, а именно,x₀(i), отличалась от параметризации узла, переданной до предварительного фильтра 30, на более чем заданное пороговое значение. Параметризацияx₀(i), таким образом, представляет собой параметризацию узла, как описано в настоящем изобретении. Обработка аудиозначений в аудиоблоке перед аудиозначением 0 была выполнена на основеустановленного параметраа₀, x₀(i).

На Фиг.5a предполагается, что параметризация, которая была вычислена для блока 0 с аудиозначениями 0-127, отличалась менее чем на заданное пороговое значение от параметризацииx₀(i), которая относится к блоку, расположенному спереди. Этот блок 0 также был получен из FIFO 32 c использованием предварительного фильтра 30, и также был обработан в отношении всех его дискретных значений 0-127 с использованием параметризацииx₀(i), переданной на этапе 72, как обозначено стрелкой 81, обозначенной как "непосредственное применение", и затем передан в квантователь 28.

Однако параметризация, вычисленная для блока 1, все еще находящегося в FIFO 32, в отличие от этого, отличалась, в соответствии с примером, представленным на Фиг.5a, более чем на заданное пороговое значение от параметризации x₀(i) и была, таким образом, передана на этапе 68 в предварительный фильтр 30 как параметризация x₁(i), вместе с величиной а₁ усиления (этап 70) и, если это применимо, с соответствующим ей предельным значением мощности шумов, при этом индексы a и x на Фиг.5 представляют собой индекс для узлов, используемых при описанной ниже интерполяции, выполняемой в отношении дискретных значений 128-255 в блоке 1, обозначенном стрелкой 82 и реализуемой на этапах, следующих после этапа 80 на Фиг.4. Обработка на этапе 80, таким образом, начинается при появлении аудиоблока с номером 1.

При передаче набора параметров а₁, x₁, только аудиозначения 128-255, то есть текущий аудиоблок, после последнего аудиоблока 0, обработанного предварительным фильтром 30, находится в запоминающем устройстве 32. После определения передачи параметров x₁(i) узла на этапе 80 предварительный фильтр 30 определяет предельное значение q₁ мощности шумов, соответствующее величине а₁ усиления на этапе 84. Такая обработка может быть выполнена средством 26 сравнения узла, передающего это значение в предварительный фильтр 30, или с помощью предварительного фильтра 30, который снова вычисляет это значение, как описано выше со ссылкой на этап 64.

После этого на этапе 86 инициализируется индекс j для дискретного значения, который указывает на самое старое дискретное значение, остающееся в запоминающем устройстве FIFO 32, или на первое дискретное значение текущего аудиоблока "блока 1", то есть, в примере по Фиг.5 на дискретное значение 128. На этапе 88 параметризируемый предварительный фильтр выполняет интерполяцию между коэффициентами х₀ и х₁фильтра, причем, в данном случае, параметризацияx₀ действует как узел в узле, имеющем номер 127 аудиозначения предыдущего блока 0, и параметризация х₁действует как узел в узле, имеющем номер 225 аудиозначения текущего блока 1. Эти позиции 127 и 255 аудиозначений далее упоминаются как узел 0 и узел 1, причем параметризации узла, относящиеся к узлам по Фиг.5a, обозначены стрелками 90 и 92.

На этапе 88 параметризируемый предварительный фильтр 30 выполняет интерполяцию коэффициентов х₀, х₁фильтрамежду этими двумя узлами в форме линейной интерполяции для пол

Аудиокодирование

Патент 2335809