Способ и устройство для квантования информационного сигнала
Иллюстрации
Показать всеИзобретение относится к квантованию аудиосигналов, используемых, например, для сжатия данных аудиосигналов или для кодирования звука, а именно относится к кодированию звука с коротким временем задержки. Квантование информационного сигнала последовательности информационных значений включает в себя избирательную по частоте фильтрацию последовательности информационных значений для получения последовательности отфильтрованных информационных значений и квантование отфильтрованных информационных значений для получения последовательности квантованных информационных значений посредством квантующей ступенчатой функции, которая отображает отфильтрованные информационные значения в квантованные информационные значения и ход которой является более крутым ниже порогового информационного значения, чем выше порогового информационного значения. Технический результат - обеспечение повышения сжатия данных информационного сигнала. 3 н. и 7 з.п. ф-лы, 15 ил.
Реферат
Изобретение, в основном, относится к квантователям или квантованию информационных сигналов и, в вариантах осуществления, к квантованию аудиосигналов, используемых, например, для сжатия данных аудиосигналов или для кодирования звука. В конкретном варианте осуществления данное изобретение относится к кодированию звука с коротким временем задержки.
Способом сжатия звука, наиболее хорошо известным в настоящее время, является МПЕГ-1 уровень 3 (MPEG-1 Layer III). Этим способом сжатия значения выборки или значения аудиосигнала кодируются в кодированный сигнал с потерями. Другими словами, несоответствие и избыточность первоначального аудиосигнала уменьшаются или идеально устраняются при сжатии. Для достижения этого одновременное и временное маскирования распознаются психоакустической моделью, т.е. изменяющийся со временем порог маскирования, зависящий от аудиосигнала, вычисляется или определяется указывающим, с какой громкости тональные сигналы определенной частоты воспринимаются для человеческого слуха. Эта информация, в свою очередь, используется для кодирования сигнала посредством квантования спектральных значений аудиосигнала более точным или менее точным способом или вообще без квантования, в зависимости от порога маскирования, и интегрирования их в кодируемый сигнал.
Способы сжатия звука, такие как, например, формат МP3, испытывают предел в их применимости, когда аудиоданные должны передаваться через ограниченный битовой скоростью канал передачи, с одной стороны, сжатым способом, но, с другой стороны, с настолько малым временем задержки, насколько это возможно. В некоторых приложениях, время задержки не играет роли, например, при архивировании аудиоинформации. Аудиокодеры с малой задержкой, которые иногда называются "кодерами со сверхнизкой задержкой", однако, являются необходимыми, когда критические по времени аудиосигналы должны передаваться, как например, в телеконференции, в беспроводных громкоговорителях или микрофонах. Для этих областей применения, статья Schuller G. и др. "Perceptual Audio Coding using Adaptive Pre- and Post-Filters and Lossless Compression", IEEE Transactions on Speech and Audio Processing, vol. 10, no. 6, September 2002, pp. 379-390, предлагает кодирование звука, когда уменьшение несоответствия и уменьшение избыточности выполняются не на основе единственного преобразования, а на основе двух отдельных преобразований.
Этот принцип будет обсуждаться впоследствии со ссылкой на фиг.12 и 13. Кодирование начинается с аудиосигнала 902, который уже был дискретизирован и, таким образом, уже присутствует как последовательность 904 звуковых значений или значений 906 выборки, в которой временной порядок звуковых значений 906 указан стрелкой 908. Порог слушания вычисляется посредством психоакустической модели для последовательных блоков значений 906 аудиосигнала, характеризующихся возрастающей нумерацией "блок№". Фиг.13, например, показывает диаграмму, где, относительно частоты f, график а вычерчивает спектр блока сигнала из 128 звуковых значений 906, и b вычерчивает порог маскирования, вычисленный психоакустической моделью, в логарифмических единицах. Порог маскирования указывает, как уже было отмечено, до какой интенсивности частоты остаются неслышимыми для человеческого уха, а именно все тональные сигналы ниже порога b маскирования. На основе порогов слушания, вычисленных для каждого блока, уменьшение несоответствия достигается посредством управления параметризуемым фильтром, за которым следует квантователь. Для параметризуемого фильтра, параметризация вычисляется таким образом, что его амлитудно-частотная характеристика соответствует инверсии величины порога маскирования. Эта параметризация указана на фиг.12 x#(i).
После фильтрации звуковых значений 906 имеет место квантование с постоянным размером шага, как, например, операция округления до следующего целого. Шум квантования, вызываемый этим, является белым шумом. На стороне декодера, отфильтрованный сигнал "повторно преобразуется" опять параметризуемым фильтром, передаточная функция которого установлена на величину самого порога маскирования. Посредством этого не только декодируется отфильтрованный сигнал, но шум квантования на стороне декодера также настраивается на форму порога маскирования. Для соответствия шума квантования порогу маскирования так точно, как это возможно, величина а# усиления, приложенная к отфильтрованному сигналу перед квантованием, вычисляется на стороне кодера для каждого множества параметров или каждой параметризации. Для выполнения повторного преобразования на стороне декодера, величина усиления а и параметризация х передаются к кодеру как дополнительная информация 910 отдельно от фактических главных данных, а именно квантованных отфильтрованных звуковых значений 912. Для уменьшения 914 избыточности эти данные, т.е. дополнительная информация 910 и основные данные 912, подвергаются сжатию без потерь, а именно кодированию энтропии, которое заключается в том, как получен кодированный сигнал.
Вышеупомянутая статья предлагает размер в 128 значений 906 выборки как размер блока. Это дает возможность получить относительно короткую задержку в 8 мс с частотой отсчетов 32 кГц. Со ссылкой на подробную реализацию, статья также утверждает, что для увеличения эффективности кодирования дополнительной информации дополнительная информация, а именно коэффициенты х# и а#, будет передана, только если имеются достаточные изменения по сравнению со множеством параметров, переданным ранее, т.е. если эти изменения превышают некоторое пороговое значение. Кроме того, описано, что реализация предпочтительно осуществляется таким образом, что текущее множество параметров не применяется непосредственно ко всем значениям выборки, принадлежащим к соответствующему блоку, а что линейная интерполяция коэффициентов х# фильтра используется для того, чтобы избежать слышимых артефактов. Для осуществления линейной интерполяции коэффициентов фильтра для фильтра предложена решетчатая структура для того, чтобы помешать возникновению нестабильностей. Для случая, когда желателен кодированный сигнал с управляемой битовой скоростью, статья также предлагает избирательное умножение или ослабление отфильтрованного сигнала, масштабированного с зависящим от времени коэффициентом усиления, посредством коэффициента, не равного 1, таким образом, что имеют место слышимые помехи, но скорость передачи битов может быть уменьшена в местах аудиосигнала, которые усложнены для кодирования.
Хотя схема кодирования звука, описанная в статье, упомянутой выше, уже уменьшает время задержки для многих приложений в достаточной степени, проблема в вышеупомянутой схеме состоит в том, что из-за требования передачи порога маскирования или передаточной функции фильтра стороны кодера, впоследствии называемого префильтром, канал передачи загружен до относительно высокой степени, даже хотя коэффициенты фильтра будут переданы, только если заданный порог превышен.
Другим недостатком вышеупомянутой схемы кодирования является то, что из-за того факта, что порог маскирования или его инверсия должна быть сделана доступной на стороне декодера посредством набора х# параметров, подлежащих передаче, должен быть достигнут компромисс между самой низкой возможной битовой скоростью или высоким коэффициентом сжатия, с одной стороны, и наиболее точной возможной аппроксимацией или параметризацией порога маскирования или его инверсии, с другой стороны. Таким образом, является неизбежным для шума квантования, отрегулированного для порога маскирования вышеупомянутой схемой кодирования звука, превысить порог маскирования в некоторых диапазонах частот и, таким образом, привести к слышимым звуковым помехам для слушателя. Фиг.13, например, показывает параметризованную амплитудно-частотную характеристику параметризуемого фильтра стороны декодера графиком с. Как можно видеть, имеются области, где передаточная функция фильтра стороны декодера, впоследствии называемого постфильтром, превышает порог b маскирования. Проблема усложняется тем фактом, что параметризация передается только с перебоями с достаточным изменением между параметризациями и интерполируется между ними. Интерполяция коэффициентов х# фильтра, предложенная в статье, одна приводит к слышимым помехам, когда величина а# усиления удерживается постоянной от узла к узлу или от новой параметризации к новой параметризации. Даже если интерполяция, предложенная в статье, также применяется к значению а# дополнительной информации, т.е. переданному значению усиления, слышимые звуковые артефакты могут оставаться в аудиосигнале, приходящем на сторону декодера.
Другой проблемой со схемой кодирования звука согласно фиг.12 и 13 является то, что отфильтрованный сигнал, из-за избирательной по частоте фильтрации, принимает непредсказуемую форму, когда, особенно из-за случайной суперпозиции многих индивидуальных гармонических волн, одно или несколько индивидуальных звуковых значений кодированного сигнала складываются до очень высоких значений, что в свою очередь приводит к более плохому коэффициенту сжатия в последующем уменьшении избыточности из-за их редкой наблюдаемости.
Задачей данного изобретения является обеспечение способа и устройства для квантования информационного сигнала таким образом, что более высокое сжатие данных информационного сигнала может быть реализовано с вызыванием только небольшого ухудшения качества первоначального информационного сигнала.
Эта задача достигается способом, описанным ниже, и соответствующим п.9 и, и устройством, соответствующим п.1, реализующим данный способ.
Настоящее изобретение предоставляет способ квантования информационного сигнала последовательности информационных значений, причем информационный сигнал является аудиосигналом и информационные значения являются звуковыми значениями.
Согласно данному способу квантование информационного сигнала последовательности значений информации включает в себя избирательную по частоте фильтрацию последовательности информационных значений для получения последовательности отфильтрованных информационных значений и квантование отфильтрованных информационных значений для получения последовательности квантованных информационных значений посредством квантующей ступенчатой функции, которая отображает отфильтрованные информационные значения в квантованные информационные значения, и ход которой является более крутым ниже порогового информационного значения, чем выше порогового информационного значения.
Кроме того, согласно данному способу определяется порог слушания для блока звуковых значений и вычисляется версия параметризации параметризуемого фильтра таким образом, что его передаточная функция грубо соответствует величине, обратной величине первого порога слушания, где стадия избирательной по частоте фильтрации дополнительно предусматривает стадию таким образом, что артефакты, искусственно генерируемые избирательной по частоте фильтрацией, устраняются или сглаживаются из отфильтрованного информационного сигнала, после постфильтрации едва ли приводит к какому-либо ухудшению качества информационного сигнала, отфильтрованного после квантования, тогда как обрезание или увеличение размера шага квантования выше соответствующего порога предлагает огромную экономию в битовом представлении отфильтрованного информационного сигнала.
Согласно предпочтительному варианту осуществления информационным сигналом является аудиосигнал, где избирательное квантование выше или ниже некоторого порога едва ли приводит к слышимому уменьшению качества звука с одновременным огромным уменьшением в битовом представлении.
Квантующая ступенчатая функция может альтернативно быть обеспеченной для квантования всех звуковых значений до самого высокого шага квантования над пороговым значением, или квантующая ступенчатая функция, имеющая более пологий ход над пороговым значением или имеющая больший размер шага квантования над пороговым значением, используется таким образом, что искусственно генерируемые артефакты квантуются более грубым образом.
Предпочтительные варианты осуществления данного изобретения будут далее детализированы со ссылкой на прилагаемые чертежи, в которых:
Фиг.1 показывает блок-схему аудиокодера согласно варианту осуществления данного изобретения;
Фиг.2 показывает блок-схему для иллюстрации режима фильтрации заданного блока звуковых значений последовательности звуковых значений параметризуемым фильтром, использующим заданную параметризацию, которая заданным образом зависит от версии параметризации, для получения блока отфильтрованных звуковых значений.
Указанную выше задачу также решает другой объект настоящего изобретения, а именно устройство для квантования информационного сигнала последовательности информационных значений, причем информационный сигнал является аудиосигналом и информационные значения являются звуковыми значениями, которое, в свою очередь, содержит средства для реализации стадий, соответствующих описанному выше способу.
Кроме того, средство для определения порога слушания может быть сформировано для дальнейшего определения другого второго порога слушания для другого второго блока звуковых значений, и средство для вычисления может быть сформировано для вычисления версии другой второй параметризации параметризуемого фильтра таким образом, что его передаточная функция грубо соответствует величине, обратной величине второго порога слушания. Причем средство для избирательной по частоте фильтрации содержит средство для интерполяции между версией первой параметризации и версией второй параметризации для получения версии интерполированной параметризации для заданного звукового значения заданного блока звуковых значений и средство для применения версии интерполированной параметризации к заданному звуковому значению заданного блока звуковых значений.
Дополнительно указанное устройство может содержать средство для определения первого предела мощности шума, зависящего от первого порога маскирования, и второго предела мощности шума, зависящего от второго порога маскирования, причем средство для фильтрации содержит средство для интерполяции между первым пределом мощности шума и вторым пределом мощности шума для получения интерполированного предела мощности шума для заданного звукового значения заданного блока звуковых значений, средство для определения промежуточного значения масштабирования, зависящего от мощности шума квантования, вызванной квантованием согласно заданному правилу квантования и интерполированному пределу мощности шума, и средство для применения промежуточного значения масштабирования к заданному звуковому значению для получения масштабированного отфильтрованного звукового значения.
Наблюдалось, что искусственно генерируемые артефакты в результирующем отфильтрованном информационном сигнале возникают от избирательной по частоте фильтрации аудиосигнала, когда индивидуальные информационные значения, из-за случайной конструктивной интерференции всех или многих гармоник, принимают значения, которые значительно выше, чем максимальные значения первоначального сигнала, например, вдвое выше. Центральной идеей данного изобретения является то, что обрезание отфильтрованного информационного сигнала выше соответствующего порога, который, примерно, вдвое выше, чем наибольшее возможное значение первоначального информационного сигнала, подлежащего фильтрации таким образом, что артефакты, искусственно генерируемые избирательной по частоте фильтрацией, устраняются или сглаживаются из отфильтрованного информационного сигнала, после постфильтрации едва ли приводит к какому-либо ухудшению качества информационного сигнала, отфильтрованного после квантования, тогда как обрезание или увеличение размера шага квантования выше соответствующего порога предлагает огромную экономию в битовом представлении отфильтрованного информационного сигнала.
Согласно предпочтительному варианту осуществления информационным сигналом является аудиосигнал, где избирательное квантование выше или ниже некоторого порога едва ли приводит к слышимому уменьшению качества звука с одновременным огромным уменьшением в битовом представлении.
Квантующая ступенчатая функция может альтернативно быть обеспеченной для квантования всех звуковых значений до самого высокого шага квантования над пороговым значением, или квантующая ступенчатая функция, имеющая более пологий выше порогового информационного значения или имеющая больший размер шага квантования над пороговым значением, используется таким образом, что отфильтрованные звуковые значения, большие, чем пороговое информационное значение, квантуются до максимального значения шага квантования.
Предпочтительные варианты осуществления данного изобретения будут далее детализированы со ссылкой на прилагаемые чертежи.
Фиг.1 показывает блок-схему аудиокодера согласно варианту осуществления данного изобретения.
Фиг.2 показывает блок-схему для иллюстрации режима функционирования аудиокодера фиг.1 на входе данных.
Фиг.3 показывает блок-схему для иллюстрации функционирования аудиокодера фиг.1 относительно оценки входящего аудиосигнала психоакустической моделью.
Фиг.4 показывает блок-схему для иллюстрации режима функционирования аудиокодера фиг.1 относительно применения параметров, полученных психоакустической моделью, к входящему аудиосигналу.
Фиг.5а показывает схематичную диаграмму для иллюстрации входящего аудиосигнала, последовательности звуковых значений, из которых он состоит, и рабочих стадий фиг.4 относительно звуковых значений.
Фиг.5b показывает схематичную диаграмму для иллюстрации настройки кодированного сигнала.
Фиг.6 показывает блок-схему для иллюстрации режима функционирования аудиокодера по фиг.1 относительно окончательной обработки вплоть до кодированного сигнала.
Фиг.7а показывает график, где показан вариант осуществления квантующей ступенчатой функции;
Фиг.7b показывает график, где показан другой вариант осуществления квантующей ступенчатой функции.
Фиг.8 показывает блок-схему аудиодекодера, который может декодировать аудиосигнал, кодированный аудиокодером по фиг.1 согласно варианту осуществления данного изобретения.
Фиг.9 показывает блок-схему для иллюстрации режима функционирования декодера по фиг.8 на входе данных.
Фиг.10 показывает блок-схему для иллюстрации режима функционирования декодера по фиг.8 относительно буферизации предварительно декодированных квантованных и отфильтрованных аудиоданных и обработки аудиоблоков без соответствующей дополнительной информации.
Фиг.11 показывает блок-схему для иллюстрации режима функционирования декодера по фиг.8 относительно фактической обратной фильтрации.
Фиг.12 показывает схему для иллюстрации стандартной схемы кодирования звука, имеющей короткое время задержки.
Фиг.13 показывает график, где, примерно, показаны спектр аудиосигнала, его порог слушания и передаточная функция постфильтра в декодере.
Фиг.1 показывает аудиокодер согласно варианту осуществления данного изобретения. Аудиокодер, который обычно указан 10, включает в себя вход 12 данных, где он принимает аудиосигнал, подлежащий кодированию, который, как будет более подробно объяснено далее со ссылкой на фиг.5а, состоит из последовательности звуковых значений или значений выборки, и выход данных, где выводится кодированный сигнал, информационное содержание которого будет обсуждаться более подробно со ссылкой на фиг.5b.
Аудиокодер 10 по фиг.1 делится на часть 16 уменьшения несоответствия и часть 18 уменьшения избыточности. Часть 16 уменьшения несоответствия включает в себя средство 20 для определения порога слушания, средство 22 для вычисления величины усиления, средство 24 для вычисления параметризации, средство 26 сравнения узлов, квантователь 28 и параметризуемый префильтр 30 и входной FIFO (первым пришел - первым обслужен) буфер 32, буфер или память 38 и умножитель частоты или средство 40 умножения. Часть 18 уменьшения избыточности включает в себя компрессор 34 и контроллер 36 битовой скорости.
Часть 16 уменьшения несоответствия и часть 18 уменьшения избыточности подключены последовательно в этом порядке между входом 12 данных и выходом 14 данных. В частности, вход 12 данных подключен ко входу данных средства 20 для определения порога слушания и ко входу данных входного буфера 32. Выход данных средства 20 для определения порога слушания подключен ко входу средства 24 для вычисления параметризации и ко входу данных средства 22 для вычисления величины усиления для прохождения порога слушания, определенного для него. Средства 22 и 24 вычисляют величину параметризации или усиления на основе порога слушания и подключены к средству 26 сравнения узлов для прохождения этих результатов для них. В зависимости от результата сравнения средство 26 сравнения узлов, как будет обсуждаться далее, пропускает результаты, вычисленные средствами 22 и 24, как входной параметр или параметризацию к параметризуемому префильтру 30. Параметризуемый префильтр 30 подключен между выходом данных входного буфера 32 и входом данных буфера 38. Умножитель 40 частоты подключен между выходом данных буфера 38 и квантователем 28. Квантователь 28 пропускает отфильтрованные звуковые значения, которые могут быть умножены или масштабированы, но всегда квантованы, к части 18 уменьшения избыточности, более точно ко входу данных компрессора 34. Средство 26 сравнения узлов пропускает информацию, из которой входные параметры, пропущенные к параметризуемому префильтру 30, могут быть выведены для части 18 уменьшения избыточности, более точно для другого входа данных компрессора 34. Контроллер битовой скорости подключен к управляющему входу умножителя 40 частоты через подключение управления для обеспечения квантованных отфильтрованных звуковых значений, принятых от префильтра 30, подлежащих умножению умножителем 40 частоты на соответствующий множитель, как будет более подробно обсуждаться ниже. Контроллер 36 битовой скорости подключен между выходом данных блока сжатия (компрессора) 34 и выходом 14 данных аудиокодера 10 для того, чтобы определить множитель для умножителя 40 частоты подходящим образом. Когда каждое звуковое значение проходит квантователь 40 первый раз, множитель сначала устанавливается на соответствующий коэффициент масштабирования, например 1. Буфер 38, однако, продолжает хранение каждого отфильтрованного звукового значения для передачи контроллеру 36 битовой скорости, как будет описано далее, возможности изменения множителя для другого прохождения блока звуковых значений. Если такое изменение не указано контроллером 36 битовой скорости, то буфер 38 может освободить память, занятую этим блоком.
После того как установка аудиокодера фиг.1 была описана выше, режим его функционирования будет далее описан со ссылкой на фиг.2-7b.
Как можно видеть из фиг.2, аудиосигнал, при достижении аудиовхода 12, уже был получен посредством выборки 50 аудиосигнала из аналогового аудиосигнала. Выборка аудиосигнала выполняется с заданной частотой выборки, которая обычно находится между 32 и 48 кГц. Следовательно, на входе 12 данных имеется аудиосигнал, состоящий из последовательности звуковых значений или значений выборки. Хотя кодирование аудиосигнала не имеет место основанным на блоках образом, как станет очевидно из последующего описания, звуковые значения на входе 12 данных сначала комбинируются для образования аудиоблоков на стадии 52. Эта комбинация для образования аудиоблоков имеет место только с целью определения порога слушания, как станет очевидным из следующего описания, и имеет место во входной стадии средства 20 для определения порога слушания. В данном варианте осуществления примерно допускается, что каждые 128 последовательных звуковых значений скомбинированы для образования аудиоблоков, и что комбинация имеет место таким образом, что, с одной стороны, последовательные аудиоблоки не перекрываются и, с другой стороны, являются непосредственными соседями друг друга. Это будет примерно кратко обсуждаться со ссылкой на фиг.5а.
Фиг.5а в 54 указывает последовательность значений выборки, причем каждое значение выборки иллюстрируется прямоугольником 56. Значения выборки пронумерованы с целью иллюстрации, где по причине ясности в свою очередь показаны только некоторые значения выборки последовательности 54. Как указано фигурными скобками над последовательностью 54, каждые 128 последовательных значений выборки скомбинированы для образования блока согласно данному варианту осуществления, где непосредственно последующие 128 значений выборки образуют следующий блок. Только как мера предосторожности, нужно отметить, что комбинация для образования блоков, могла бы быть осуществлена по-другому, примерно посредством перекрывающихся блоков или разнесенных блоков и блоков, имеющих другой размер блока, хотя размер блока в 128 в свою очередь является предпочтительным, так как он обеспечивает хороший компромисс между высоким качеством аудиосигнала, с одной стороны, и самым малым возможным временем задержки, с другой стороны.
Тогда как аудиоблоки, комбинированные в средстве 20 на стадии 52, обрабатываются в средстве 20 для определения порога слушания блок за блоком, входящие звуковые значения будут сохраняться 54 во входном буфере 32, пока параметризуемый префильтр 30 не получил входных параметров от средства 26 сравнения узлов для осуществления префильтрации, как будет описано далее.
Как можно видеть из фиг.3, средство 20 для определения порога слушания начинает свою обработку непосредственно после того, как достаточно звуковых значений было принято на входе 12 данных для формирования аудиоблока или для формирования следующего аудиоблока, который средство 20 контролирует посредством инспекции на стадии 60. Если нет полного обрабатываемого аудиоблока, то средство 20 будет ждать. Если полный аудиоблок, подлежащий обработке, присутствует, то средство 20 для определения порога слушания будет вычислять порог слушания на стадии 62 на основе соответствующей психоакустической модели на стадии 62. Для иллюстрации порога слушания опять делается ссылка на фиг.12 и, в частности, на график b, полученный на основе психоакустической модели, примерно, относительно текущего аудиоблока со спектром а. Порог маскирования, который определяется на стадии 62, является зависящей от частоты функцией, которая может изменяться для последовательных аудиоблоков и может также значительно изменяться от аудиосигнала к аудиосигналу, например от произведений рок-музыки до произведений классической музыки. Порог слушания указывает для каждой частоты пороговое значение, ниже которого человеческий слух не может воспринимать помехи.
На последующей стадии 64 средство 24 и средство 22 вычисляют из вычисленного порога М(f) слушания (f указывает частоту) величину а усиления или множество параметров из N параметров х(i) (i = 1, ..., N). Параметризация х(i), которую средство 24 вычисляет на стадии 64, обеспечена для параметризуемого префильтра 30, который, например, воплощен в структуре адаптивного фильтра, используемой в LPC кодировании (LPC = кодирование методом линейного предсказания). Например, пусть s(n), n = 0, ..., 127, - 128 звуковых значений текущего аудиоблока, и s'(n) - результирующие отфильтрованные 128 звуковых значений, тогда фильтр примерно воплощается таким образом, что применяется следующее равенство:
где К - порядок фильтра и ак t, k = 1, ..., К, - коэффициенты фильтра, и индекс t должен иллюстрировать, что коэффициенты фильтра изменяются в последующих аудиоблоках. Средство 24 затем вычисляет параметризацию ак t таким образом, что передаточная функция H(f) параметризуемого префильтра 30 грубо равна величине, обратной величине порога маскирования М(f), т.е., таким образом, что выполнено следующее:
где зависимость от t в свою очередь должна иллюстрировать, что порог маскирования М(f) изменяется для различных аудиоблоков. При реализации префильтра 30 как адаптивного фильтра, упомянутого выше, коэффициенты ак t фильтра будут получены следующим образом: инверсное дискретное преобразование Фурье |М(f,t)|2 по частоте для блока во время t приводит к целевой аутокорреляционной функции rmm t(i). Затем, ак t получаются решением системы линейных уравнений:
Для того чтобы не возникало никаких нестабильностей между параметризациями в линейной интерполяции, описанной более подробно ниже, для фильтра 30 предпочтительно используется решетчатая структура, в которой коэффициенты фильтра для решетчатой структуры повторно параметризуются для образования коэффициентов отражения. Относительно дальнейших подробностей, касающихся конструкции префильтра, вычисления коэффициентов и повторной параметризации, делается ссылка на статью Schuller и т.д., упомянутую во вступлении к описанию и, в частности, к странице 381, раздел III, которая включена здесь в качестве ссылки.
Тогда как в результате средство 24 вычисляет параметризацию для параметризуемого префильтра 30 таким образом, что его передаточная функция равна величине, обратной порогу маскирования, средство 22 вычисляет предел мощности шума на основе порога слушания, а именно предел, указывающий, какую мощность шума квантователю 28 разрешено вводить в аудиосигнал, отфильтрованный префильтром 30 для того, чтобы шум квантования на стороне декодера был ниже порога слушания М(f) или в точности равен ему после постфильтрации или обратной фильтрации. Средство 22 вычисляет этот предел мощности шума как площадь под квадратом величины порога слушания М, т.е. как Σ|М(f)|2. Средство 22 вычисляет величину усиления а из предела мощности шума посредством вычисления корня из дроби мощности шума квантования, деленной на предел мощности шума. Шумом квантования является шум, вызванный квантователем 28. Шум, вызванный квантователем 28, как будет описано ниже, является белым шумом и, таким образом, не зависит от частоты. Мощность шума квантования является мощностью шума квантования.
Как стало очевидным из вышеприведенного описания, средство 22 также вычисляет предел мощности шума отдельно от величины а усиления. Хотя для средства 26 сравнения узлов возможно повторное вычисление предела мощности шума из величины а усиления, полученной от средства 22, для средства 22 также возможна передача определенного предела мощности шума к средству 26 сравнения узлов отдельно от величины а усиления.
После вычисления величины усиления и параметризации средство 26 сравнения узлов проверяет на стадии 66, отличается ли только что вычисленная параметризация на более чем заданный порог от текущей последней параметризации, пропущенной к параметризуемому префильтру. Если проверка на стадии 66 имеет тот результат, что только что вычисленная параметризация отличается от текущей параметризации на более чем заданный порог, то только что вычисленные коэффициенты фильтра и только что вычисленная величина усиления или предел мощности шума буферизуются в средстве 26 сравнения узлов для интерполяции, подлежащей обсуждению, и средство 26 сравнения узлов перераспределяет к префильтру 30 коэффициенты фильтра, только что вычисленные на стадии 68, и величину усиления, только что вычисленную на стадии 70. Если, однако, это не имеет места и только что вычисленная параметризация не отличается от текущей параметризации более чем на заданный порог, то средство 26 сравнения узлов перераспределит на префильтр 30 на стадии 72, вместо только что вычисленной параметризации, только параметризацию текущего узла, т.е. ту параметризацию, которая последняя привела к положительному результату на стадии 66, т.е. отличалась от параметризации предыдущего узла более чем на заданный порог. После стадий 70 и 72, процесс фиг.3 возвращается к обработке следующего аудиоблока, т.е. к запросу 60.
В том случае, если только что вычисленная параметризация не отличается от параметризации текущего узла, и в результате префильтр 30 на стадии 72 опять получает параметризацию узла, уже полученную по меньшей мере для последнего аудиоблока, префильтр 30 применит эту параметризацию узла ко всем значениям выборки этого аудиоблока в FIFO 32, как будет описано более подробно ниже, как этот текущий блок берется из FIFO 32 и квантователь 28 принимает результирующий аудиоблок префильтрованных звуковых значений.
Фиг.4 иллюстрирует режим функционирования параметризуемого префильтра 30 для случая, когда он принимает только что вычисленную параметризацию и только что вычисленную величину усиления, так как они достаточно отличаются от параметризации текущего узла более подробно. Как было описано со ссылкой на фиг.3, отсутствует обработка согласно фиг.4 для каждого из последовательных аудиоблоков, но только для аудиоблоков, в котором соответствующая параметризация достаточно отличалась от параметризации текущего узла. Другие аудиоблоки, как было только что описано, предварительно фильтруются посредством применения соответствующей параметризации текущего узла и соответствующей текущей величины усиления ко всем значениям выборки этих аудиоблоков.
На стадии 80 параметризуемый префильтр 30 проверяет, имело ли место перераспределение только что вычисленных коэффициентов фильтра от средства 26 сравнения узлов, или параметризации более старого узла. Префильтр 30 осуществляет проверку 80, пока такое перераспределение не произошло.
Когда такое перераспределение произошло, параметризуемый префильтр 30 начинает обработку текущего аудиоблока звуковых значений как раз в буфере 32, т.е. в том, для которого была вычислена параметризация. На фиг.5а, например, иллюстрировано, что все звуковые значения 56 перед звуковым значением с номером 0, уже были обработаны и, таким образом, уже прошли память 32. Обработка блока звуковых значений перед звуковым значением с номером 0 была запущена, так как параметризация, вычисленная для аудиоблока перед блоком 0, а именно х0(i), отличалась от параметризации узла, пропущенной прежде к префильтру 30, более чем на заданный порог. Параметризация х0(i), таким образом, является параметризацией узла, как описано в данном изобретении. Обработка звуковых значений в аудиоблоке перед звуковым значением 0 была выполнена на основе множества параметров а0, х0(i).
На фиг.5а предполагается, что параметризация, вычисленная для блока 0 со звуковыми значениями 0-127, отличалась меньше, чем на заданный порог от параметризации х0(i), которая относилась к блоку спереди. Этот блок 0 был, таким образом, взят из FIFO 32 префильтром 30, равным образом обработанным относительно всех его значений выборки 0-127 посредством параметризации х0(i), поданной на стадии 72, как указано стрелкой 81, описанной "непосредственное применение", и затем пропущенной к квантователю 28.
Параметризация, вычисленная для блока 1, все еще расположена в FIFO 32, однако по контрасту отличается, согласно иллюстративному примеру фиг.5а, более чем на заданный порог от параметризации х0(i) и, таким образом, была пропущена на стадии 68 к префильтру 30 как параметризация х1(i), вместе с величиной а1 усиления (стадия 70) и, если применимо, соответствующий предел мощности шума, где индексы а и х на фиг.5 должны быть индексом для узлов, используемых в интерполяции, подлежащей обсуждению ниже, которая осуществляется относительно значений выборки 128-255 в блоке 1, символизируемом стрелкой 82 и реализованном стадиями, следующими за стадией 80 на фиг.4. Обработка на стадии 80, таким образом, началась бы с наличием аудиоблока с номером 1.
Во время, когда множество параметров а1, х1 пропущено, только звуковые значения 128-255, т.е. текущий аудиоблок после последнего аудиоблока 0, обработанного префильтром 30, находятся