2329549 - Устройство и способ определения величины шага квантователя

Устройство и способ определения величины шага квантователя

Иллюстрации

Показать все

Изобретение относится к аудиокодерам, в частности к аудиокодерам, в которых осуществляется преобразование временного представления в спектральное представление. Сущность изобретения состоит в том, что для определения величины шага квантователя для квантования сигнала, содержащего аудио- или видеоинформацию, вырабатывается первая величина шага квантователя, а также порог помехи. Затем определяется помеха, действительно введенная за счет первой величины шага квантователя, и эта помеха сравнивается с порогом помехи. Несмотря на тот факт, что сравнение указывает на то, что действительно введенная помеха больше, чем порог, применяют вторую, более грубую величину шага квантователя, которую затем используют для квантования, если выясняется, что помеха, введенная за счет более грубой второй величины шага квантования, меньше, чем порог или помеха, введенная за счет первой величины шага квантователя. Технический результат, достигаемый при реализации изобретения, состоит в том, что за счет выбора более грубой величины шага квантования и, тем самым, повышения выигрыша за счет сжатия, снижается помеха квантования. 3 н. и 7 з.п. ф-лы, 5 ил.

Реферат

Настоящее изобретение относится к аудиокодерам, в частности к аудиокодерам, которые основаны на преобразованиях, то есть в которых перед началом конвейерной обработки кодера осуществляется преобразование временного представления в спектральное представление.

Известный аудиокодер, основанный на преобразованиях, изображен на фиг. 3. Показанный на фиг. 3 кодер представлен в международном стандарте ISO/IEC 14496-3: 2001 (E), подраздел 4, страница 4, и известен в технике как ААС-кодер.

Ниже представлено описание известного кодера. На вход 1000 вводится аудиосигнал, подлежащий кодированию. Он сначала подается на блок 1002 масштабирования, в котором проводится так называемое ААС-управление усилением, чтобы установить уровень аудиосигнала. Информация разностного стереосигнала из блока масштабирования подается на блок 1004 форматирования битового потока, как это показано стрелкой между блоком 1002 и блоком 1004. Масштабированный аудиосигнал подается затем на блок 1006 фильтров модифицированного дискретного косинусного преобразования (МДКТ). В случае ААС-кодера блок фильтров реализует МДКП с перекрывающимися на 50% окнами, причем длина окна определяется посредством блока 1008.

Вообще говоря, блок 1008 применяется для того, чтобы сигналы переходных процессов подвергать взвешиванию с использованием более коротких окон, а более стационарные сигналы - с использованием более длинных окон. Это служит тому, что на основе более коротких окон для сигналов переходных процессов достигается более высокое разрешение по времени (ценой разрешения по частоте), в то время как для более стационарных сигналов за счет более длинных окон достигается более высокое разрешение по частоте (ценой разрешения по времени), причем традиционно более длинные окна считаются более предпочтительными, так как с ними связывается более высокий выигрыш от кодирования. На выходе блока 1006 фильтров, при рассмотрении во временной области, имеются следующие друг за другом блоки спектральных значений, которые, в зависимости от формы выполнения блока фильтров, могут являться коэффициентами МДКП, коэффициентами Фурье или сигналами поддиапазонов, причем каждый сигнал поддиапазона имеет определенную ограниченную ширину полосы, которая устанавливается посредством соответствующего канала поддиапазона в блоке 1006 фильтров, и каждый сигнал поддиапазона имеет определенное число значений выборок поддиапазона.

Ниже для примера представлен случай, в котором блок фильтров выдает, при рассмотрении во времени, следующие друг за другом блоки спектральных коэффициентов МДКП, которые, вообще говоря, представляют следующие друг за другом кратковременные спектры кодируемого аудиосигнала на входе 1000. Блок спектральных значений МДКП вводится затем в блок 1010 обработки, реализующей временное преобразование шумов (TNS). Метод TNS применяется для того, чтобы выполнить формирование временного представления шумов квантователя внутри каждого окна преобразования. Это достигается тем, что применяется процесс фильтрации на частях спектральных данных каждого канала. Кодирование проводится на основе окон. В частности, осуществляются следующие этапы, чтобы механизм TNS применить к окну спектральных данных, то есть к блоку спектральных значений.

Прежде всего выбирается частотный диапазон для механизма TNS. Подходящий выбор состоит в том, чтобы частотный диапазон 1,5 кГц до наивысшего возможного диапазона коэффициента масштабирования перекрыть одним фильтром. Следует отметить, что этот частотный диапазон зависит от частоты дискретизации, как это определено стандартом AAC (ISO/IEC 14496-3: 2001 (E)).

Затем проводится вычисление на основе кодирования с линейным предсказанием (LPC), а именно: со спектральными коэффициентами МДКП, которые лежат в выбранном целевом частотном диапазоне. Для повышенной устойчивости коэффициенты, которые соответствуют частотам ниже 2,5 кГц, исключаются из этого процесса обработки. Обычные процедуры LPC, как это известно из обработки речевых сигналов, могут применяться для вычисления на основе LPC, например, известный алгоритм Левинсона-Дарбина. Вычисление выполняется для максимально допустимого порядка фильтра преобразования шумов.

В качестве результата вычисления на основе LPC получают ожидаемый выигрыш предсказания PG. Кроме того, получают коэффициенты отображения или Parcor-коэффициенты.

Если выигрыш предсказания не превышает определенный порог, то механизм TNS не применяется. В этом случае в битовый поток записывается управляющая информация, чтобы в кодере было известно, что обработка на основе механизма TNS не выполнялась.

Однако если выигрыш предсказания превышает определенный порог, то обработка на основе механизма TNS применяется.

На следующем этапе производится квантование коэффициентов отображения. Порядок применяемого фильтра преобразования шумов определяется путем удаления всех коэффициентов отражения с абсолютным значением, меньшим, чем порог, из «хвоста» массива коэффициентов отражения. Число оставшихся коэффициентов отражения имеет порядок величины фильтра преобразования шумов. Подходящий порог составляет примерно 0,1.

Оставшиеся коэффициенты отражения преобразуются в типовом случае в коэффициенты линейного предсказания, причем этот метод также известен как процедура ступенчатого увеличения.

Вычисленные коэффициенты линейного предсказания (LPC) применяются затем как коэффициенты фильтра преобразования шумов, таким образом, как коэффициенты фильтра предсказания. Этот FIR-фильтр (с конечным импульсным откликом) проводится через определенный диапазон целевых частот. При декодировании применяется авторегрессионный фильтр, в то время как при кодировании применяется так называемый фильтр со скользящим средним. Наконец, для механизма TNS на блок форматирования битового потока еще подводится информация разностного стереосигнала, как показано на фиг. 3 стрелкой между блоком 1010 TNS-обработки и блоком 1004 форматирования битового потока.

Затем проводятся не показанные факультативные механизмы обработки, такие как механизм долговременного прогнозирования, механизм интенсивности/связи, механизм прогнозирования, механизм шумовой подстановки, пока, наконец, обработка не дойдет до кодера 1012 центрального/боковых сигналов. Кодер 1012 центрального/боковых сигналов активизируется в том случае, если кодируемый аудиосигнал представляет собой многоканальный сигнал, то есть стереосигнал с левым каналом и правым каналом. До сих пор, то есть в направлении обработки от блока 1012 на фиг. 3, левый и правый стереоканалы обрабатывались отдельно друг от друга, то есть масштабировались, преобразовывались набором фильтров, подвергались TNS-обработке или пропускали ее и т.д.

Тогда в кодере 1012 центрального/боковых сигналов сначала проверяется, целесообразно ли проводить кодирование центрального/боковых сигналов, то есть обеспечивает ли оно вообще выигрыш от кодирования. Кодирование центрального/боковых сигналов обеспечивает выигрыш кодирования в том случае, если левый и правый каналы подобны, так как тогда центральный канал, то есть сумма левого и правого каналов, примерно равен левому или правому каналу, без учета масштабирования посредством коэффициента ¹/₂, в то время как разностный стереосигнал имеет всего лишь малые значения, так как равен разности между левым и правым каналом. Тем самым можно видеть, что в том случае, когда левый и правый каналы приближенно одинаковы, разность приближенно равна нулю или имеет очень малые значения, которые, можно надеяться, в последующем квантователе 1014 будут квантованы к нулю и, тем самым, могут передаваться очень эффективным образом, так как за квантователем 1014 включен энтропийный кодер 1016.

На квантователь 1014 из психоакустической модели 1020 подается разрешенная помеха, приходящаяся на диапазон коэффициента масштабирования. Квантователь работает итеративным способом, то есть сначала опрашивается внешний итерационный контур, который затем опрашивает внутренний итерационный контур. Вообще говоря, сначала, исходя из величины шага и начальных значений квантователя, предпринимается квантование блока значений на входе квантователя 1014. В частности, внутренний контур квантует коэффициенты МДКП, при этом применяется определенное количество битов. Внешний контур рассчитывает искажения и модифицированную энергию коэффициентов с применением коэффициента масштабирования, чтобы снова обратиться к внутреннему контуру. Этот процесс итеративно повторяется до тех пор, пока не будет выполнено определенное условие. Для каждой итерации во внешнем итерационном контуре при этом реконструируется сигнал, чтобы вычислить помеху, обусловленную квантованием, и сравнить с разрешенной помехой, выдаваемой из психоакустической модели 1020. Кроме того, коэффициенты масштабирования частотных диапазонов, все еще оцениваемых после этого сравнения как содержащие помехи, увеличиваются от итерации к итерации на одну или более ступеней, а именно для каждой итерации внешнего итерационного контура.

Затем, если достигнута ситуация, при которой помеха квантователя, введенная вследствие квантования, ниже разрешенной помехи, определенной психоакустической моделью, и если одновременно выполняются требования к битам, а именно, максимальная скорость битов не превышена, то итерация, то есть способ анализа через синтез, завершается, и полученные коэффициенты масштабирования кодируются, как это выполняется в блоке 1014, и в кодированной форме подаются на блок 1004 форматирования битового потока, как показано стрелкой между блоком 1014 и блоком 1004. Квантованные значения подаются затем на энтропийный кодер 1016, который в типовом случае с применением множества таблиц кодов Хафмана проводит энтропийное кодирование для различных диапазонов коэффициентов масштабирования, чтобы перевести квантованные значения в двоичный формат. Известно, что при энтропийном кодировании в форме кодирования Хафмана осуществляется обращение к кодовым таблицам, которые формируются на основе ожидаемой статистики сигналов, и в которых часто встречающиеся значения становятся более короткими кодовыми словами, чем более редко встречающиеся значения. Энтропийно кодированные значения затем также подаются в качестве собственно основной информации на блок 1004 форматирования битового потока, который затем выдает на выходе кодированный аудиосигнал, соответствующий определенному синтаксису битового потока.

Как уже упоминалось, при таком итеративном квантовании, если помеха, обусловленная величиной шага квантования, больше, чем порог, то применяется меньшая величина шага квантования, а именно, в надежде на то, что тем самым шумы квантования будут снижены, вследствие более точного квантования.

Этот принцип имеет недостаток, заключающийся в том, что, естественно, за счет меньшей величины шага квантователя, подлежащий передаче объем данных возрастает, и, тем самым, выигрыш от сжатия снижается.

Задача изобретения заключается в том, чтобы создать принцип определения величины шага квантователя, который, с одной стороны, вводит меньшую помеху квантования и, с другой стороны, обеспечивает получение хорошего выигрыша от сжатия.

Эта задача в соответствии с изобретением решается устройством для определения величины шага квантователя согласно пункту 1 формулы изобретения, способом определения величины шага квантователя согласно пункту 8 формулы изобретения или компьютерной программой согласно пункту 9 формулы изобретения.

В основе изобретения лежит знание того, что дополнительное снижение помеховой мощности с одной стороны, и одновременно повышение или, по меньшей мере, сохранение величины выигрыша от кодирования может достигаться за счет того, что и в том случае, когда введенная помеха больше, чем порог, не применяется более точное квантование, как известно в уровне техники, а испытывается, по меньшей мере, несколько более грубых величин шага квантователя. Оказалось, что и при более грубых величинах шага квантователя могут быть достигнуты снижения помех, обусловленных квантованием, а именно, в том случае, когда более грубая величина шага квантователя лучше «подходит» к значению, подлежащему квантованию, чем более точная величина шага квантователя. Этот эффект основывается на том, что ошибка квантования зависит не только от величины шага квантователя, но и, естественно, также от значений, подлежащих квантованию. Если подлежащие квантованию значения близки к величинам шага для более грубых величин шага квантователя, то достигается снижение шумов квантования при одновременном, более высоком выигрыше сжатия (ввиду более грубого квантования).

Соответствующий изобретению принцип особенно выгоден в том случае, когда уже для первой величины шага квантователя, исходя из которой проводится сравнение с порогом, имеются хорошо оцененные величины шага квантователя. В предпочтительном примере выполнения настоящего изобретения более целесообразным является определение первой величины шага квантователя путем непосредственного вычисления на основе средней энергии шума, а не на основе сценария наихудшего случая. Тем самым итерационные циклы, соответствующие уровню техники, могут быть значительно сокращены или полностью исключены.

Соответствующая изобретению последующая обработка величины шага квантователя еще только однократно испытывает более грубую величину шага квантователя, с целью получения выгоды из описанного эффекта «наилучшего соответствия» для подлежащего квантованию значения. Если затем устанавливается, что помеха, полученная за счет более грубой величины шага квантователя, меньше, чем предшествующая помеха, или даже меньше порога, то затем может производиться дополнительная итерация для испытания еще более грубой величины шага квантователя. Этот процесс проверки последующих более грубых величин шага квантователя продолжается до тех пор, пока вводимая помеха вновь не начнет возрастать. Это означает, что достигнут критерий прерывания, так что квантование проводится с использованием сохраненной величины шага квантователя, которая обуславливала наименьшую вводимую помеху, и затем выполняется, как это требуется, процедура кодирования.

В альтернативном примере выполнения настоящего изобретения для оценки первой величины шага квантователя может проводиться процедура анализа через синтез, как в уровне техники, которая проводится до тех пор, пока не будет достигнут соответствующий ей критерий прерывания. Затем может вводиться последующая обработка, соответствующая изобретению, чтобы в заключение проверить, нельзя ли все-таки с использованием более грубой величины шага квантователя прийти к настолько же хорошим результатам или даже к лучшим результатам по помехе. Если при этом устанавливается, что более грубая величина шага квантователя дает настолько же хороший результат или даже лучший результат, что касается вводимой помехи, то она применяется для квантования. Если, напротив, устанавливается, что более грубое квантование не дает ничего, то для окончательного квантования применяется первоначально определенная величина шага квантователя, то есть полученная методом анализа через синтез.

В соответствии с изобретением могут, таким образом, использоваться любые величины шага квантователя, чтобы осуществить первое сравнение с порогом. При этом несущественно, определена ли эта первая величина шага квантователя уже согласно схеме анализа через синтез, или даже посредством прямого вычисления величины шага квантования.

В предпочтительном примере выполнения заявленного изобретения этот принцип квантования используется для квантования аудиосигнала, имеющегося в частотном диапазоне. Однако этот принцип может использоваться также для квантования сигнала временного диапазона, содержащего аудио и/или видеоинформацию.

Кроме того, следует отметить, что порог, с которым выполняется сравнение, представляет собой психоакустическую или психооптическую разрешенную помеху, или другой порог, в отношении которого желательно, чтобы он не был превышен. Так этот порог может в действительности представлять собой разрешенную помеху, формируемую соответствующей психоакустической моделью. Однако такой порог может представлять собой предварительно определенную вводимую помеху, соответствующую первоначальной величине шага квантователя, или какой-либо иной порог.

Следует отметить, что квантованные значения необязательно должны быть кодированы кодом Хафмана, альтернативно, они могут быть кодированы с использованием другого энтропийного кодирования, например, арифметического кодирования. Альтернативным образом, квантованные значения могут также кодироваться двоичным способом, так как и такое кодирование приводит к тому, что для передачи меньших значений или значений, равных нулю, требуется меньше битов, чем для передачи больших значений или, в общем случае, значений, не равных нулю.

Предпочтительным образом, для определения выходных значений, то есть первых величин шага квантования, можно полностью или в значительной части отказаться от итеративного подхода, если величина шага квантователя определяется из прямой оценки энергии шумов. Вычисление величины шага квантования из точной оценки энергии шумов является значительно более быстрым, чем вычисление в контуре анализа через синтез, так как значения для вычисления непосредственно доступны. Не требуется сначала предпринимать несколько попыток квантования и сравнения, прежде чем будет найдена благоприятная для кодирования величина шага квантователя.

Однако так как в случае применяемой характеристики квантователя речь идет о нелинейной характеристике, то нелинейная характеристика должна приниматься во внимание и при оценке шумов. Больше не может применяться простая оценка энергии шумов для линейного квантователя, так как она является неточной. В соответствии с изобретением применяется квантователь со следующей характеристикой квантования:

В приведенном выше уравнении x_i представляют собой спектральные значения, подлежащие квантованию. Выходные значения обозначены через y_i, причем y_i являются, таким образом, квантованными спектральными значениями. Через q обозначена величина шага квантователя. Символом "round" обозначена функция округления, которая предпочтительно является функцией "nint", где "nint" (от англ. "nearest integer") обозначает «ближайшее целое число». Показатель степени, который делает квантователь нелинейным квантователем, обозначен символом α, причем α не равно 1. В типовом случае показатель степени α должен быть меньше, чем 1, так что квантователь имеет сжимающую характеристику. В случае уровня 3 и для ААС показатель степени α равен 0,75. Параметр s является аддитивной постоянной, имеющей величину, которая также может принимать значение, равное нулю.

В соответствии с изобретением, для вычисления величины шага квантования применяется следующее соотношение:

В случае α, равного ³/₄, получается следующее уравнение:

В этих уравнениях левый член соответствует разрешенной в частотном диапазоне помехе THR, которая создается психоакустическим модулем для диапазона коэффициента масштабирования с частотными линиями от i, равного i₁, до i, равного i₂. Приведенное выше уравнение обеспечивает возможность практически точной оценки помехи, вводимой вследствие величины q шага квантователя, для нелинейного квантователя с вышеуказанной характеристикой квантования с показателем степени α, не равным 1, причем функция "nint" из уравнения квантователя проводит собственно уравнение квантования, а именно округление до ближайшего целого числа.

Следует отметить, что вместо функции "nint" может применяться любая функция округления round, например, округление до ближайшего четного числа или ближайшего нечетного числа, или округление до следующего 10-го числа и т.д. В общем случае функция округления обеспечивает то, что значение из множества значений с предварительно определенным количеством разрешенных значений отображается на множество значений с меньшим определенным вторым количеством значений.

В предпочтительном варианте выполнения заявленного изобретения квантованные спектральные значения уже перед этим были подвергнуты обработке TNS, и если речь идет о, например, стереосигналах, то есть кодированию центрального/боковых сигналов, если только каналы были такого типа, что позволяли активировать кодер центрального/боковых сигналов.

Во взаимосвязи между величиной шага квантователя и коэффициента масштабирования, который задается согласно следующей формуле:

коэффициент масштабирования может, тем самым, быть непосредственно указан для каждого диапазона коэффициентов масштабирования и может быть подан на соответствующий аудиокодер. Коэффициент масштабирования получается из следующего уравнения:

В предпочтительном примере выполнения настоящего изобретения может еще использоваться итерация после обработки, которая основывается на принципе анализа через синтез, чтобы непосредственно без итерации вычисленную величину шага квантователя для каждого диапазона коэффициента масштабирования еще в некоторой степени изменить, чтобы добиться действительного оптимума.

По сравнению с уровнем техники, уже очень точное вычисление начальных значений обеспечивает возможность очень короткой итерации, хотя было найдено, что в большинстве случае можно совсем отказаться от последующей итерации.

Предпочтительный принцип, который базируется на вычислении величины шага квантователя с помощью средней энергии шумов, обеспечивает, таким образом, хорошую и реалистичную оценку, так как она, в отличие от решений, известных из уровня техники, работает не согласно сценарию наихудшего случая, а применяет ожидаемое значение ошибки квантования в качестве основы и, тем самым, при субъективно эквивалентном качестве обеспечивает возможность более эффективного кодирования данных со значительно меньшим числом битов. Кроме того, ввиду того факта, что от итерации можно вообще отказаться, или что число шагов итерации можно значительным образом снизить, может быть реализован кодер со значительно более высоким быстродействием. Это, в частности, имеет значение потому, что итерационные циклы в известных кодерах составляли существенную часть полного требуемого времени обработки. Тем самым сокращение уже на один или несколько итерационных циклов ведет в целом к заметной экономии времени для кодера.

Предпочтительные варианты выполнения заявленного изобретения поясняются ниже со ссылками на чертежи, на которых показано следующее:

Фиг. 1 - блок-схема устройства для определения квантованного аудиосигнала;

Фиг. 2 - блок-схема процесса обработки согласно предпочтительному варианту выполнения настоящего изобретения;

Фиг. 3 - блок-схема известного кодера согласно стандарту ААС;

Фиг. 4 - иллюстрация снижения помехи квантования за счет более грубой величины шага квантователя и

Фиг. 5 - блок-схема соответствующего изобретению устройства для определения величины шага квантователя для квантования сигнала.

Далее со ссылкой на фиг. 5 представлен принцип, соответствующий изобретению. На фиг. 5 показано схематичное представление устройства для определения величины шага квантователя для квантования сигнала, который содержит аудио- или видеоинформацию и подается на сигнальный вход 500. Сигнал подается на устройство 502 для выработки первой величины шага квантователя (QSW) и для выработки порога помехи, которая далее обозначается как вводимая помеха. Следует отметить, что порог помехи может быть любым порогом. Предпочтительным образом, он может представлять собой психоакустическую или психооптически вводимую помеху, причем этот порог выбирается таким образом, что сигнал, в который введена помеха, все еще воспринимается слушателем или наблюдателем как не имеющий помех.

Порог (THR), а также первая величина шага квантователя подаются на устройство 504 для определения первой помехи, действительно вводимой за счет первой величины шага квантователя. Определение действительно вводимой помехи осуществляется предпочтительным образом посредством квантования с первой величиной шага квантователя, посредством повторного квантования с применением первой величины шага квантователя и за счет вычисления расстояния (меры различия) между первоначальным сигналом и квантованным сигналом. Предпочтительным образом, если обрабатываются спектральные значения, то из корреспондирующих спектральных значений первоначального сигнала и повторно квантованного сигнала формируются квадраты, чтобы затем определить разность квадратов. Могут использоваться альтернативные методы определения расстояния.

Устройство 504 вырабатывает значение для первой помехи, действительно введенной за счет первой величины шага квантователя. Оно вместе с порогом THR подается на устройство 506 для сравнения. Устройство 506 выполняет сравнение между порогом THR и первой действительно введенной помехой. Если первая действительно введенная помеха больше, чем порог, то устройство 506 активизирует устройство 508 для выбора второй величины шага квантователя, причем устройство 508 выполнено таким образом, чтобы выбирать вторую величину шага квантователя более грубой, то есть большей, чем первая величина шага квантователя. Выбранная устройством 508 вторая величина шага квантователя подается на устройство 510 для определения действительно введенной второй помехи. Для этого устройство 510 получает первоначальный сигнал, а также вторую величину шага квантователя и вновь проводит квантование с использованием второй величины шага квантователя, то есть повторное квантование с использованием второй величины шага квантователя, и вычисление расстояния между повторно квантованным сигналом и первоначальным сигналом, чтобы ввести меру действительно введенной второй помехи в устройство 512 для сравнения. Устройство 512 для сравнения сравнивает действительно введенную вторую помеху с действительно введенной первой помехой или с порогом THR. Если действительно введенная вторая помеха меньше, чем действительно введенная первая помеха, или даже меньше, чем порог THR, то для квантования сигнала применяется вторая величина шага квантователя.

Следует отметить, что показанный фиг. 5 принцип является всего лишь схематичным. Разумеется, для проведения операций сравнения в блоках 506 и 512 необязательно должны предусматриваться раздельные устройства сравнения, а может также предусматриваться единственное устройство сравнения, которое управляется соответствующим образом. То же самое справедливо для устройств 504 и 510 для определения действительно введенных помех. Также и они необязательно должны выполняться как раздельные устройства.

Кроме того, следует отметить, что устройство для квантования необязательно должно выполняться как отдельное устройство от устройства 510. В типовом случае сигналы, квантованные с использованием второй величины шага квантователя, формируются уже в устройстве 510, если устройство 510 проводит квантование и повторное квантование, чтобы определить действительно введенную помеху. Полученные там квантованные значения могут также сохраняться и затем, когда устройство 512 для сравнения вырабатывает положительный результат, выдаваться в качестве квантованного сигнала, так что устройство 514 для квантования в известной мере «сливается» с устройством для определения действительно введенной второй помехи.

В предпочтительном примере выполнения предложенного изобретения порог THR представляет собой психоакустически определяемую максимальную вводимую помеху, причем в этом случае сигнал является аудиосигналом. Порог THR при этом вырабатывается из психоакустической модели, которая работает обычным образом и для каждого диапазона коэффициентов масштабирования вырабатывает оцениваемую в этом диапазоне коэффициентов масштабирования вводимую максимальную помеху квантования. Максимально вводимая помеха базируется на пороге маскирования в той мере, что она идентична порогу маскирования или выводится из порога маскирования в той степени, что, например, кодирование проводится с доверительным интервалом таким образом, что вводимая помеха меньше, чем порог маскирования, или что проводится скорее «агрессивное» кодирование в смысле сокращения битовой скорости, а именно, что разрешенная помеха лежит выше порога маскирования.

Далее со ссылкой на фиг. 1 представлен предпочтительный способ реализации устройства 502 для выработки первой величины шага квантователя. В остальном функции устройства 50 по фиг. 2 и устройства 502 по фиг. 5 одинаковы. Предпочтительным образом, устройство 502 выполнено таким образом, чтобы иметь функции устройства 10 и устройства 12, показанных на фиг. 1. Кроме того, в этом примере квантователь 514 на фиг. 1 выполнен подобно квантователю 14 на фиг. 1.

Далее со ссылкой на фиг. 2 показана полная процедура, которая в том случае, если введенная помеха больше, чем порог, также проводит проверку более грубых величин шага квантования.

Кроме того, левая ветвь на фиг. 2, которая представляет соответствующий изобретению принцип, расширена за счет того, что в случае, если введенная помеха больше, чем порог, и выбор более грубой величины шага квантования ничего не дает, и если требования битовой скорости не особенно строги, или в «битовом резерве» еще имеется место, то проводится итерация с меньшей, то есть более точной величиной шага квантования.

Наконец, со ссылкой на фиг. 4 представлен эффект, на котором базируется настоящее изобретение, а именно то, что несмотря на выбор более грубой величины шага квантователя, может быть получен меньший шаг квантования и, тем самым, до некоторой степени повышение выигрыша за счет сжатия.

На фиг. 1 показано устройство для определения квантованного аудиосигнала, который задан как спектральное представление в форме спектральных значений. В частности, следует отметить, что если, ссылаясь на фиг. 3, не предпринимается никакая обработка TNS и никакое кодирование центрального/боковых сигналов, то спектральные значения являются непосредственно выходными значениями блока фильтров. Если, однако, осуществляется обработка TNS, но без кодирования центрального/боковых сигналов, то вводимые в квантователь 1015 спектральные значения являются спектральными остаточными значениями в том виде, как они возникают на основе фильтрации предсказания по процедуре TNS.

Если используется обработка TNS вместе с кодированием центрального/боковых сигналов, то вводимые в соответствующее изобретению устройство спектральные значения являются спектральными значениями центрального канала или спектральными значениями боковых каналов.

Соответствующее изобретению устройство включает в себя, прежде всего, устройство для выработки разрешенной помехи, которая на фиг. 1 обозначена ссылочной позицией 10. В качестве устройства для выработки разрешенной помехи может служить показанная на фиг. 3 психоакустическая модель 1020, которая в типовом случае выполнена таким образом, чтобы для каждого диапазона коэффициентов масштабирования, то есть для группы из нескольких спектрально граничащих друг с другом спектральных значений, вырабатывать разрешенную помеху или порог, которая также обозначается как THR. Разрешенная помеха базируется на психоакустическом пороге маскирования и указывает, какое количество энергии может быть введено в исходный аудиосигнал, не вызывая восприятия помехи человеческим ухом. Иными словами, разрешенная помеха является искусственно введенной (за счет квантования) сигнальной составляющей, которая маскируется собственно аудиосигналом.

Устройство 10 выполнено таким образом, чтобы вычислить разрешенную помеху THR для частотного диапазона, предпочтительно, диапазона коэффициентов масштабирования и подать ее на следующее подключенное устройство 12. Устройство 12 служит для вычисления информации о величине шага квантователя для частотного диапазона, для которого указана разрешенная помеха THR. Устройство 12 выполнено таким образом, чтобы информацию q о величине шага квантователя подавать на следующее подключенное устройство 14 для квантования. Устройство 14 для квантования работает согласно записанному в блоке 14 предписанию квантования, причем информация о величине шага квантователя в показанном на фиг.1 случае применяется для того, чтобы спектральное значение x_i сначала разделить на значение q, и затем результат возвести в степень с показателем α, не равным 1, и затем, при необходимости, еще добавить аддитивный коэффициент s.

Затем этот результат вводится в функцию округления, которая в примере выполнения, показанном на фиг. 1, обеспечивает выбор ближайшего целого числа. Целое число может, по определению, быть получено отсечением разрядов после запятой, то есть вырабатываться по принципу «всегда округление с недостатком». В качестве альтернативы ближайшее целое число может формироваться путем округления с недостатком чисел до 0,499 и путем округления с избытком чисел с 0,5. Также в качестве альтернативы ближайшее целое число может определяться по принципу «всегда округление с избытком», в зависимости от конкретной реализации. Вместо функции "nint" может использоваться любая функция округления, которая, вообще говоря, отображает округляемое значение из первого большего множества значений на второе меньшее множество значений.

На выходе устройства 14 имеется квантованное спектральное значение в частотном диапазоне. Как видно из уравнения, показанного в блоке 14, на устройство 14, наряду с величиной q шага квантователя, разумеется, также подается квантуемое спектральное значение в рассматриваемом частотном диапазоне.

Следует отметить, что устройство 12 необязательно должно непосредственно вычислять величину q шага квантователя, а в качестве альтернативной информации о величине шага квантователя может вычислять также коэффициент масштабирования, как он применяется в известных аудиокодерах, основанных на преобразованиях. Коэффициент масштабирования связан с действительной величиной шага квантователя посредством соотношения, показанного справа от блока 12. Если устройство для вычисления выполнено таким образом, чтобы в качестве информации о величине шага квантователя вычислять коэффициент масштабирования scf, то этот коэффициент масштабирования подается на устройство 14 для квантования, которое в этом случае вместо значения q в блоке 14 применяет для вычисления квантования значение 2^{1/4 scf}.

Ниже приводится вывод формулы, показанной в блоке 12.

Как описано выше, квантователь экспоненциального закона, как он показан в блоке 14, подчиняется следующему соотношению:

Инверсная операция представляется следующим образом:

Это уравнение представляет, таким образом, операцию, необходимую для повторного квантования, причем y_i является спектральным значением, а x'_i является повторно квантованным спектральным значением. q вновь представляет величину шага квантователя, которая взаимосвязана с коэффициентом масштабирования соотношением, показанным справа от блока 12 на фиг. 1.

Можно ожидать, что результат совместим с этим уравнением для случая α, равного 1.

Если вышеуказанное уравнение просуммировать по вектору спектральных значений, то вся мощность шумов в диапазоне, который определен индексом i, определяется следующим образом:

В целом, ожидаемое значение шумов квантования вектора определяется посредством величины q шага квантователя и так называемого коэффициента формы, который описывает распределение компонентов вектора.

Коэф

Устройство и способ определения величины шага квантователя

Патент 2329549