Кодирование информационного сигнала

Иллюстрации

Показать все

Изобретение относится к кодированию инфомационного сигнала, например, аудио или видео. Очень грубое квантование, превышающее меру, определенную порогом маскирования без или только с очень небольшими потерями качества, обеспечивается квантованием не непосредственно предварительно фильтрованного сигнала, но ошибки предсказания, полученной в соответствии с адаптивным предсказанием вперед предварительно фильтрованного сигнала. Из-за применяемой адаптивности вперед ошибка квантования не имеет отрицательного влияния на предсказание на стороне декодера. 8 н. и 41 з.п. ф-лы, 10 ил.

Реферат

Настоящее изобретение относится к кодированию информационного сигнала, например кодированию аудио или видео.

Использование кодирования цифрового аудио в новых коммуникационных сетях, а также в профессиональных аудиопроизведениях для двунаправленного обмена в реальном времени, требует очень недорогого алгоритмического кодирования, а также очень короткой задержки кодирования. Типичный сценарий, где применение кодирования цифрового аудио становится критическим в смысле времени задержки, существует, когда прямые, то есть не кодированные, и передаваемые, то есть кодированные и декодированные, сигналы используются одновременно. Примерами, поэтому, является "живые" произведения, использующие беспроводные микрофоны и мгновенный (в ухе) контроль, или "разрозненные" произведения, где артисты играют одновременно в различных студиях. Допустимый полный период времени задержки в этих применениях составляет менее 10 мс. Если, например, асимметричные каналы участников используются для обмена, скорость передачи данных в битах является дополнительным ограничивающим фактором.

Алгоритмическая задержка стандартных кодеров аудио, таких как MPEG-1 3 (MP3), MPEG-2 AAC и MPEG-2/4 с малой задержкой, изменяется от 20 мс до нескольких сотен (100) мс, причем ссылка приводится, например, на статью M. Lutzky, G. Schuller, M. Gayer; U. Kraemer, S. Wabnik: "A guideline to audio codec delay", представленную на 116-м съезде AES, Берлин, май 2004. Кодеры речи оперируют при более низких скоростях передачи данных и с меньшей алгоритмической задержкой, но обеспечивают просто ограниченное аудиокачество.

Вышеописанный пробел между стандартными кодерами аудио с одной стороны и речевыми кодерами с другой стороны, например, закрывается посредством схемы кодирования, такой как описана в статье B. Edler, C. Faller and G. Schuller, "Perceptual Audio Coding Using a Time-Varying Linear Pre- and Postfilter", представленной на 109 съезде AES, Лос-Анджелес, сентябрь 2000, согласно которой сигнал, подлежащий кодированию, фильтруют с инверсией порога маскирования на стороне кодера и затем квантуют, чтобы выполнить сокращение неуместных данных, и квантованный сигнал подвергают статистическому кодированию для выполнения устранения избыточности, отдельного от сокращения неуместных данных, в то время как квантованный предварительно фильтрованный сигнал восстанавливают на стороне декодера и фильтруют в постфильтре с порогом маскирования в качестве функции передачи. Такая схема кодирования, ниже называемая схемой кодирования ULD, приводит к воспринимаемому качеству, которое может быть сравнено со стандартными кодерами аудио, например MP3, для скоростей передачи данных, приблизительно равных 80 кбит/сек на канал и выше. Кодер этого типа, например, описан также в WO 2005/078703 A1.

В частности, ULD кодеры, описанные здесь, используют психоакустически управляемые линейные фильтры для формирования шума квантования. Из-за своей структуры шум квантования всегда находится на заданном пороге, даже когда никакого сигнала нет в заданной частотной области. Шум остается неслышимым, пока он соответствует психоакустическому порогу маскирования. Для получения скорости передачи, которая является даже меньшей, чем скорость передачи данных, которая заранее определена этим порогом, шум квантования должен быть увеличен, что делает шум слышимым. В частности, шум становится слышимым в областях без частей сигнала. Примерами поэтому являются очень низкие и очень высокие звуковые частоты. Обычно имеются только части очень низких сигналов в этих областях, в то время как порог маскирования является высоким. Если порог маскирования увеличивается однородно по всей частотной области, шум квантования находится на увеличенном пороге, даже когда не имеется никакого сигнала, так что шум квантования становится слышимым как сигнал, который слышится паразитным. Основанные на поддиапазонах кодеры не имеют этой проблемы, так как они просто квантуют поддиапазоны, имеющие меньшие сигналы, чем порог, в нуль.

Вышеупомянутая проблема, которая имеет место, когда разрешенная скорость передачи данных падает ниже минимальной скорости передачи данных, которая не вызывает побочного шума квантования и которая определена порогом маскирования, не является единственной. Кроме того, ULD кодеры, описанные в вышеупомянутых ссылках, страдают от сложной процедуры получения постоянной скорости передачи данных, в частности, из-за того, что используется итеративный цикл, который нужно пройти, чтобы определить, для каждого блока выборки, значение коэффициента усиления, регулирующее размер шага деквантования (обратного квантования).

Задачей настоящего изобретения является обеспечение схемы кодирования информации, которая делает возможным разрешить короткое время задержки, типичное для типов ULD кодера, при низкой скорости передачи и все же обеспечить высокое качество кодирования.

Эта задача достигается устройствами по п. 1 или 24, способами по п. 44 или 45, а также кодером по п. 47 и декодером по п. 48.

Центральной идеей настоящего изобретения является обнаружение того, что чрезвычайно грубое квантование, превышающее меру, определенную порогом маскирования, сделано возможным без или только с очень небольшими потерями качества, с помощью не непосредственно квантования предварительно фильтрованного сигнала, но ошибки предсказания, полученной в соответствии с адаптивным предсказанием вперед предварительно фильтрованного сигнала. Из-за адаптивности вперед ошибка квантования не имеет отрицательного влияния на коэффициент предсказания.

Согласно другому варианту осуществления предварительно фильтрованный сигнал даже квантуется нелинейным способом или даже отсекается, то есть квантуется посредством функции квантования, которая отображает неквантованные значения ошибки предсказания на индексы квантования ступеней квантования, и чей ход (изменение) является более крутым ниже порога, чем выше порога. Таким образом, PSD (спектральная плотность мощности) шума, увеличенная относительно порога маскирования из-за низкой доступной скорости передачи данных, подстраивается к PSD сигнала, так что нарушение порога маскирования не имеет места в спектральных частях без части сигнала, что дополнительно улучшает качество прослушивания или поддерживает качество прослушивания соответственно, несмотря на уменьшающуюся доступную скорость передачи данных.

Согласно еще одному варианту осуществления настоящего изобретения квантование является равномерно квантованным или ограниченным соответственно посредством ограничения, а именно посредством квантования в ограниченное и фиксированное количество уровней квантования или ступеней соответственно. Посредством предсказания предварительно фильтрованного сигнала с помощью адаптивного предсказания вперед, грубое квантование не имеет отрицательного эффекта непосредственно на коэффициенты предсказания. Посредством квантования к фиксированному количеству уровней квантования предотвращение итерации для получения постоянной скорости передачи данных разрешается естественным образом.

Согласно другому варианту осуществления настоящего изобретения размер шага квантования или высота ступени соответственно между фиксированным количеством уровней квантования определяется адаптивным способом назад (в обратном направлении) от предыдущих индексов уровня квантования, полученных квантованием, так что, с одной стороны, несмотря на очень малое количество уровней квантования, лучшее или по меньшей мере наилучшее возможное квантование ошибки предсказания или остаточного сигнала соответственно может быть получено без необходимости подавать дополнительную побочную информацию к стороне декодера. С другой стороны, можно гарантировать, что ошибки передачи во время передачи квантованного остаточного сигнала к стороне декодера имеют только кратковременный эффект на сторону декодера с соответствующей конфигурацией адаптивной настройки размера шага назад (в обратном направлении).

Предпочтительные варианты осуществления изобретения описаны ниже со ссылками на сопроводительные чертежи. Они показывают:

фиг.1 - блок-схема кодера согласно варианту осуществления настоящего изобретения;

фиг.2, a, b являются графиками, показывающими примерно ход (изменение) спектра шума относительно порога маскирования и спектральную плотность мощности сигнала для случая кодера по п. 1 (график a) или для сравнительного случая кодера с адаптивным предсказанием назад предварительно фильтрованного сигнала и итеративную настройку размера шага поблочного квантования порога маскирования (график b) соответственно;

фиг.3, a, b, c являются графиками, показывающими в качестве примера плотность спектра мощности сигнала относительно спектральной плотности мощности ошибки или шума соответственно для различных величин отсечения или различных количеств уровней квантования соответственно для случая, когда, как в кодере согласно фиг.1, выполняется адаптивное предсказание вперед предварительно фильтрованного сигнала, но все еще выполняется итеративная настройка размера шага квантования;

фиг.4 - блок-схема структуры кодера коэффициентов в кодере согласно фиг.1 согласно варианту осуществления настоящего изобретения;

фиг.5 - блок-схема декодера для декодирования информационного сигнала, кодированного кодером согласно фиг.1 согласно варианту осуществления настоящего изобретения;

фиг.6 - блок-схема структуры кодеров коэффициентов в кодере согласно фиг.1 или декодере согласно фиг.5 согласно варианту осуществления настоящего изобретения;

фиг.7 - график для иллюстрирования результатов тестирования прослушивания;

фиг.8A-8C - графики примерных функций квантования, которые могут использоваться в средствах квантования и квантования/отсечения соответственно на фиг.1, 4, 5 и 6.

Прежде, чем варианты осуществления настоящего изобретения будут описаны более подробно со ссылками на чертежи, сначала для лучшего понимания преимуществ и принципов этих вариантов осуществления возможная реализация схемы кодирования ULD-типа описана в качестве сравнительного примера, на основе которого существенные преимущества и соображения, лежащие в основе последующих вариантов осуществления, которые в конце концов привели к этим вариантам осуществления, могут быть проиллюстрированы более ясно.

Как было описано во введении настоящего описания, имеется потребность в ULD версии для более низких скоростей передачи данных, например 64 кбит/сек, с сопоставимым воспринимаемым качеством, а также в более простой схеме получения постоянной скорости передачи данных, особенно для намеченных более низких скоростей передачи данных. Дополнительно, было бы выгодно, чтобы время восстановления после ошибки в передаче могло оставаться низким или на минимальном уровне.

Для устранения избыточности психоакустически предварительно обработанного сигнала, сравниваемый ULD кодер использует адаптивное предсказание назад по выборкам с замкнутым контуром. Это означает, что вычисление коэффициентов предсказания в кодере и декодере основано просто на прошлых или уже квантованных и восстановленных выборках сигнала. Для получения адаптации к сигналу или предварительно фильтрованному сигналу соответственно новый набор коэффициентов блока предсказания вычисляют снова для каждой выборки. Это приводит к тому преимуществу, что могут использоваться длинные блоки предсказания или формулы определения значений предсказания, то есть, в частности, блоки предсказания, имеющие большое количество коэффициентов блока предсказания, так как не имеется требования передавать коэффициенты блока предсказания от кодера к стороне декодера. С другой стороны, это означает, что квантованная ошибка предсказания должна быть передана к декодеру без потерь точности для получения коэффициентов предсказания, которые являются идентичными тем, что лежат в основе процесса кодирования. Иначе, предсказанные или «заявленные» значения соответственно в кодере и декодере могут не быть идентичными друг другу, что вызовет нестабильный процесс кодирования. Вместо этого, в сравниваемом ULD кодере требуется периодический сброс блока предсказания и на стороне кодера и стороне декодера, чтобы разрешить избирательный доступ к кодированному потоку битов, а также остановить распространение ошибок передачи. Однако периодические сбросы вызывают пики скорости передачи данных, что не представляет проблемы для канала с переменной скоростью передачи данных, но представляет проблемы для каналов с фиксированной скоростью передачи данных, где пики скорости передачи данных ограничивают нижний предел настройки постоянной скорости передачи данных.

Как следует из нижеследующего более подробного описания сравниваемой схемы кодирования ULD с вариантами осуществления настоящего изобретения, эти варианты осуществления отличаются от сравниваемой схемы кодирования использованием поблочного адаптивного предсказания вперед с адаптивной настройкой назад размера шага квантования вместо адаптивного предсказания по выборкам назад. С одной стороны, это имеет недостаток в том, что блоки предсказания должны быть короче, чтобы ограничить объем требуемой побочной информации для передачи требуемых коэффициентов предсказания к стороне кодера, что снова может приводить к уменьшенной эффективности кодера, но, с другой стороны, это имеет преимущество в том, что процедура согласно последующим вариантам осуществления все еще функционирует эффективно для более высоких ошибок квантования, которые являются результатом уменьшенных скоростей передачи данных, так, чтобы блок предсказания на стороне декодера мог использоваться для формирования шума квантования.

Как также следует из нижеследующего сравнения, по сравнению со сравниваемым ULD кодером скорость передачи данных является ограниченной посредством ограничения диапазона значений остатка предсказания перед передачей. Это приводит к формированию шума, модифицированного по сравнению со сравниваемой схемой кодирования ULD, и также ведет к различным и менее паразитным артефактам прослушивания. Далее, постоянная скорость передачи данных формируется без использования итеративных циклов. Далее, "сброс" неотъемлемо включен для каждого блока выборок как результат поблочной адаптации вперед. Дополнительно, в вариантах осуществления, описанных ниже, схема кодирования используется для коэффициентов предварительного фильтра и коэффициентов предсказания вперед, которое использует разностное кодирование с управлением адаптивным квантованием назад размером шага для LSF (линейных спектральных частот) представления этих коэффициентов. Эта схема обеспечивает поблочный доступ к этим коэффициентам, генерирует постоянную скорость передачи данных побочной информации и, помимо этого, является устойчивой к ошибкам в передаче, как описано ниже.

Ниже, сравниваемая структура ULD кодера и декодера описана более подробно с последующим описанием вариантов осуществления настоящего изобретения и иллюстрации его преимуществ при передаче от более высоких постоянных скоростей передачи данных к более низким скоростям передачи данных.

В сравниваемой схеме кодирования ULD входной сигнал кодера анализируется на стороне кодера перцепционной моделью или моделью прослушивания соответственно для получения информации относительно перцепционно нерелевантных частей сигнала. Эта информация используется для управления предварительным фильтром посредством изменяющихся во времени коэффициентов фильтра. Посредством этого предварительный фильтр нормализует входной сигнал в отношении его порога маскирования. Коэффициенты фильтра вычисляют однократно для каждого блока из 128 выборок каждый, квантованных и переданных к стороне кодера в качестве побочной информации.

После перемножения предварительно фильтрованного сигнала с коэффициентом усиления, посредством вычитания адаптивно предсказанного назад сигнала, ошибка предсказания квантуется с помощью однородного блока квантования, то есть блока квантования с однородным размером шага. Как упомянуто выше, предсказанный сигнал получают с помощью адаптивного предсказания назад по выборкам с замкнутым контуром. Соответственно, передачи коэффициентов предсказания к декодеру не требуется. Затем квантованный остаточный сигнал предсказания подвергается статистическому кодированию. Для получения постоянной скорости передачи данных обеспечивается контур, который повторяет этапы перемножения, предсказания, квантования и статистического кодирования несколько раз для каждого блока предварительно фильтрованных выборок. После итерации определяют самый высокий коэффициент усиления из набора заранее определенных значений усиления, который все еще удовлетворяет условию постоянной скорости передачи данных. Это значение усиления передают к декодеру. Если, однако, определено значение усиления меньшее чем единица, шум квантования является заметным после декодирования, то есть его спектр имеет форму подобную порогу маскирования, но его полная мощность выше, чем заранее определенная с помощью модели предсказания. Для частей спектра входного сигнала шум квантования может даже стать выше, чем спектр самого входного сигнала, что опять генерирует слышимые артефакты в частях спектра, где в ином случае никакой звуковой сигнал не присутствует из-за использования прогнозирующего кодера. Эти эффекты, вызванные шумом квантования, представляют собой ограничивающий фактор, когда более низкие постоянные скорости передачи данных представляют интерес.

Продолжая описание сравниваемой схемы ULD, коэффициенты предварительного фильтра просто передаются как внутрикадровые LSF-разности, и также только как только они превышают некоторый предел. Во избежание распространения ошибки передачи в течение неограниченного периода система время от времени сбрасывается. Дополнительные методы могут использоваться для минимизации снижения восприятия декодированного сигнала в случае ошибок передачи. Схема передачи генерирует переменную скорость передачи данных побочной информации, которая является многоуровневой в описанном выше контуре цикле посредством регулировки вышеупомянутого коэффициента усиления соответствующим образом.

Статистическое кодирование квантованного остаточного сигнала предсказания в случае сравниваемого ULD кодера содержит способы, типа Голомба (Golomb), Хаффмана, или способ арифметического кодирования. Статистическое кодирование должно быть сброшено время от времени и формирует неотъемлемо переменную скорость передачи данных, которая снова является многоуровневой из-за вышеупомянутого контура.

В случае сравниваемой схемы кодирования ULD, квантованный остаточный сигнал предсказания в декодере получают из статистического кодирования, после чего остаток предсказания и предсказанный сигнал суммируют, сумму умножают на инверсию переданного коэффициента усиления, и из нее формируют восстановленный выходной сигнал посредством постфильтра, имеющего частотную характеристику, инверсную таковой предварительного фильтра, при этом постфильтр использует переданные коэффициенты предварительного фильтра.

Сравниваемый ULD кодер описанного выше типа получает, например, общую задержку кодера/декодера от 5,33 до 8 мс при частотах выборок 32 кГц - 48 кГц. Без (ложного контура) итерации он формирует скорости передачи данных в диапазоне от 80 до 96 кбит/сек. Как описано выше, при более низких постоянных скоростях передачи данных качество прослушивания уменьшается в этом кодере из-за однородного увеличения спектра шума. Дополнительно, из-за итераций затраты для получения однородной скорости передачи данных являются высокими. Варианты осуществления, описанные ниже, преодолевают или минимизируют эти недостатки. При постоянной скорости передачи данных схема кодирования согласно вариантам осуществления, описанным ниже, вызывает формирование ошибки квантования с меняющимся шумом и не требует никакой итерации. Более точно, в вышеописанной сравниваемой схеме кодирования ULD в случае постоянной скорости передачи данных в итеративном процессе определяют множитель, с помощью которого сигнал, приходящий из предварительного фильтра, умножается до квантования, причем шум квантования является спектрально белым, что приводит к шуму квантования в декодере, который имеет форму, подобную порогу прослушивания, но который находится немного ниже или немного выше порога прослушивания, в зависимости от выбранного множителя, который может, как описано выше, также интерпретироваться как сдвиг определенного порога прослушивания. В связи с этим, шум квантования происходит после декодирования, чья мощность в отдельных частотных областях может даже превышать мощность входного сигнала в соответствующей частотной области. Результирующие артефакты кодирования являются ясно слышимыми. Варианты осуществления, описанные ниже, формируют шум квантования таким, что его спектральная плотность мощности больше не является спектрально белой. Грубое квантование/ограничение или отсечение соответственно сигнала предварительного фильтра скорее формируют результирующий шум квантования, подобный к спектральной плотности мощности сигнала предварительного фильтра. Таким образом, шум квантования в декодере формируется так, что он остается ниже спектральной плотности мощности входного сигнала. Это может интерпретироваться как искажение определенного порога прослушивания. Результирующие артефакты кодирования являются менее паразитными, чем в сравниваемой схеме кодирования ULD. Далее, последующие варианты осуществления не требуют итеративного процесса, что уменьшает сложность.

Так как посредством описания вышеприведенной сравниваемой схемы кодирования ULD было обеспечено достаточное основание для привлечения внимания к основным преимуществам и соображениям нижеследующих вариантов осуществления для описания этих вариантов осуществления, сначала ниже описана структура кодера согласно варианту осуществления настоящего изобретения.

Кодер согласно фиг.1, в целом обозначаемый 10, содержит вход 12 для информационного сигнала, который подлежит кодированию, а также выход 14 для кодированного информационного сигнала, причем в качестве примера ниже принимается, что он является аудиосигналом, и в качестве примера, в частности, уже дискретизированным аудиосигналом, хотя осуществление выборки в кодере после входа 12 также возможно. Выборки входящего выходного сигнала обозначены на фиг.1 как x(n).

Как показано на фиг.1, кодер 10 может быть разделен на средство 16 определения порога маскирования, средство 18 предварительного фильтра, средство 20 прогнозирующего предсказания вперед и средство 22 квантования/отсечения, а также средство 24 генерирования потока битов. Средство 16 определения порога маскирования работает согласно перцепционной модели или модели прослушивания соответственно для определения представления порога маскирования или прослушивания соответственно аудиосигнала, приходящего на вход 12, с помощью использования перцепционной модели, которая указывает часть аудиосигнала, которая является нерелевантной в отношении восприимчивости или слышимости, соответственно, или представляет спектральный порог для частоты, при которой спектральная энергия остается неслышимой из-за психоакустических эффектов охвата или не воспринимается людьми соответственно. Как описано ниже, средство 16 определения определяет порог маскирования поблочно, то есть оно определяет порог маскирования для каждого блока последующих блоков выборок аудиосигнала. Другие процедуры также возможны. Представление порога маскирования, как оно выдается из средства 16 определения, может, вопреки последующему описанию, в частности, со ссылками на фиг.4, также быть представлением в виде спектральных выборок спектрального порога маскирования.

Предварительный фильтр или средство 18 предварительной оценки подсоединено как к средству 16 определения порога маскирования, так и входу 12 и фильтрует выходной сигнал для его нормализации в отношении порога маскирования для получения предварительно фильтрованного сигнала f(n). Средство 18 предварительного фильтра основано, например, на линейном фильтре и реализуется для того, чтобы настраивать коэффициенты фильтра в зависимости от представления порога маскирования, выданного средством 16 определения порога маскирования, так что функция передачи линейного фильтра соответствует по существу инверсии порога маскирования. Настройка коэффициентов фильтра может быть выполнена поблочно, наполовину поблочно, например, в случае, описанном ниже, для блоков, накладывающихся наполовину при определении порога маскирования, или для каждой выборки, например, посредством интерполяции коэффициентов фильтра, полученных посредством поблочно определенных представлений порога маскирования, или посредством коэффициентов фильтра, полученных из него через межблочные промежутки.

Средство 20 предсказания вперед подсоединено к средству 18 предварительного фильтра для того, чтобы подвергнуть выборки f(n) предварительно фильтрованного сигнала, которые адаптивно отфильтрованы во временной области с использованием психоакустического порога маскирования, адаптивному предсказанию вперед для получения предсказанного сигнала (n), остаточного сигнала r(n), представляющего ошибки предсказания для предварительно фильтрованного сигнала f(n), и представления коэффициентов фильтра предсказания, на основании которых предсказанный сигнал может быть восстановлен. В частности, средство 20 адаптивного предсказания вперед реализовано для того, чтобы определить представление коэффициентов фильтра предсказания немедленно из предварительно фильтрованного сигнала f и не только на основании последующего квантования остаточного сигнала r. Хотя, как описано более подробно ниже со ссылками на фиг.4, коэффициенты фильтра предсказания представлены в области LFS, в частности в форме остатка предсказания LFS, также возможны другие представления, например промежуточное представление в форме коэффициентов линейного фильтра. Дополнительно, средство 20 выполняет определение коэффициента фильтра предсказания согласно последующему описанию, например, поблочно, то есть для каждого блока в последующем блоке выборок f(n) предварительно фильтрованного сигнала, при этом, однако, также возможны другие процедуры. Средство 20 также реализуется, чтобы определить предсказанный сигнал с помощью этих определенных коэффициентов фильтра предсказания, и вычесть его из предварительно фильтрованного сигнала f, причем определение предсказанного сигнала выполняется, например, с помощью линейного фильтра, чьи коэффициенты фильтра настроены согласно адаптивно определенным вперед представлениям коэффициентов предсказания. Остаточный сигнал, доступный на стороне декодера, то есть квантованный и отсеченный остаточный сигнал ic(n), суммированный с ранее выданными значениями выходного сигнала фильтра, может служить в качестве входного сигнала фильтра, как описано ниже более подробно.

Средство 22 квантования/отсечения подсоединено к средству 20 предсказания для квантования или отсечения соответственно остаточного сигнала с помощью функции квантования, отображающей значения r(n) остаточного сигнала на постоянное и ограниченное количество уровней квантования, и для передачи квантованного остаточного сигнала, полученного этим способом, в форме индексов квантования ic(n), как уже было упомянуто, к средству 20 адаптивного предсказания вперед.

Квантованный остаточный сигнал ic(n), представление коэффициентов предсказания, определенные средством 20, а также представление порога маскирования, определенное средством 16, составляют информацию, подаваемую к стороне декодера посредством кодированного сигнала 14, в котором, поэтому, средство 24 генерирования потока битов обеспечивается, например, на фиг.1 для объединения информации согласно последовательному потоку битов или пакетной передаче, возможно, используя дальнейшее кодирование без потерь.

Перед описанием более подробно структуры кодера фиг.1, режим работы кодера 1 описан ниже на основании вышеупомянутой структуры кодера 10. Посредством фильтрации аудиосигнала средством 18 предварительного фильтра с функцией передачи, соответствующей инверсии порога маскирования, получают предварительно фильтрованный сигнал f(n), который получает спектральную плотность мощности ошибки равномерным квантованием, которое главным образом соответствует белому шуму, и может привести к спектру шума, подобному порогу маскирования, посредством фильтрации в постфильтре на стороне декодера. Однако сначала остаточный сигнал f уменьшается до ошибки предсказания r средством 20 адаптивного предсказания вперед с помощью вычитания адаптивно предсказанного вперед сигнала f. Последующее грубое квантование этой ошибки предсказания r средством 22 квантования/отсечения не оказывает влияния на коэффициенты предсказания средства 20 предсказания ни на стороне кодера, ни на стороне декодера, так как вычисление коэффициентов предсказания выполняют адаптивным способом вперед, и таким образом основано на не квантованных значениях f(n). Квантование не только выполнено грубым способом, в том смысле, что используется большой (грубый) размер шага квантования, но также выполнено грубым способом в том смысле, что равномерное квантование выполняется только к постоянному и ограниченному количеству уровней квантования, так что для представления каждого квантованного остаточного сигнала ic(n) или каждого индекса квантования в кодированном аудиосигнале 14 требуется только фиксированное количество битов, что разрешает неотъемлемо постоянную скорость передачи данных в отношении остаточных значений ic(n). Как описано ниже, квантование выполняют главным образом посредством квантования до равноудаленных уровней квантования фиксированного количества, и ниже в качестве примера - до количества просто трех уровней квантования, при этом квантование выполняют, например, так что не квантованное остаточное значение сигнала r(n) квантуется к следующему уровню квантования для получения индекса квантования ic(n), соответствующего уровню квантования для него. Чрезвычайно высокие и чрезвычайно низкие значения не квантованного остаточного сигнала r(n) таким образом отображаются на соответствующий самый высокий или самый низкий, соответственно, уровень квантования или соответствующий индекс уровня квантования, соответственно, даже когда они могли бы быть отображены на более высокий уровень квантования при равномерном квантовании с тем же самым размером шага. До этой степени остаточный сигнал r также "отсекается" или ограничивается, соответственно, средством 22. Однако последнее имеет тот эффект, как описано ниже, что PSD ошибки (PSD = спектральная плотность мощности) предварительно фильтрованного сигнала больше не является белым шумом, а аппроксимируется к PSD сигнала предварительно фильтрованного сигнала в зависимости от степени отсечения. На стороне декодера это имеет тот эффект, что PSD шума остается ниже PSD сигнала даже при скоростях передачи данных, которые являются более низкими, чем определенные заранее с помощью порога маскирования.

Ниже структура кодера на фиг.1 описана более подробно. В частности, средство 16 определения порога маскирования содержит блок определения порога маскирования, или перцепционную модель 26, соответственно, работающий согласно перцепционной модели, модуль 28 вычисления коэффициентов предварительного фильтра и кодер 30 коэффициентов, которые подсоединены в названном порядке между входом 12 и средством 18 предварительного фильтра, а также генератором 24 потока битов. Средство 18 предварительного фильтра содержит декодер 32 коэффициентов, чей вход соединен с выходом кодера 30 коэффициентов, а также предварительный фильтр 34, которым является, например, адаптивный линейный фильтр, и который связан своим входом данных с входом 12 и своим выходом данных со средством 20, в то время как его вход адаптации для адаптации коэффициентов фильтра связан с выходом декодера 32 коэффициентов. Средство 20 предсказания содержит модуль 36 вычисления коэффициентов предсказания, кодер 38 коэффициентов, декодер 40 коэффициентов, блок вычитания 42, фильтр 44 предсказания, элемент 46 задержки, дополнительный сумматор 48 и деквантователь 50. Модуль 36 вычисления коэффициентов предсказания и кодер 38 коэффициентов соединены последовательно в этом порядке между выходом предварительного фильтра 34 и входом декодера 40 коэффициентов или дополнительного входа генератора 24 потока битов соответственно и взаимодействуют для определения представления коэффициентов предсказания поблочно адаптивным способом вперед. Декодер 40 коэффициентов включен между кодером 38 коэффициентов и фильтром 44 предсказания, которым является, например, фильтр с линейным предсказанием. Кроме входа коэффициента предсказания, соединенного с декодером 40 коэффициентов, фильтр 44 содержит вход данных и выход данных, с которыми он соединен в замкнутом контуре, который содержит, кроме фильтра 44, сумматор 48 и элемент 46 задержки. В частности, элемент 46 задержки включен между сумматором 48 и фильтром 44, в то время как выход данных фильтра 44 соединен с первым входом сумматора 48. Помимо этого, выход данных фильтра 44 также соединен с инвертирующим входом блока вычитания 42. Не инвертирующий вход блока вычитания 42 соединен с выходом предварительного фильтра 34, в то время как второй вход сумматора 48 соединен с выходом деквантователя 50. Вход данных деквантователя 50 соединен со средством 22 квантования/отсечения, а также с входом управления размером шага деквантователя 50. Средство 22 квантования/отсечения содержит модуль 52 квантователя, а также блок 54 адаптации размера шага, причем снова модуль 52 квантования состоит из однородного квантователя 56 с однородным и управляемым размером шага и ограничителем 58, которые соединены последовательно в названном порядке между выходом блока вычитания 42 и дополнительным входом генератора 24 потока битов, и, при этом, снова, блок 54 адаптации размера шага содержит модуль 60 адаптации размера шага и элемент 62 задержки, которые соединены последовательно в названном порядке между выходом ограничителя 58 и входом управления размером шага квантователя 56. Дополнительно, выход ограничителя 58 соединен со входом данных деквантователя 50, причем вход управления размером шага деквантователя 50 также соединен с блоком 60 адаптации размера шага. На выходе генератора 24 потока битов, снова, формируют выходной сигнал 14 кодера 10.

После того как подробная структура кодера согласно фиг.1 была выше описана подробно, его режим работы описан ниже. Модуль 26 перцепционной модели определяет или оценивает, соответственно, порог маскирования поблочно из аудиосигнала. Поэтому модуль 26 перцепционной модели использует, например, DFT (дискретное преобразование Фурье, ДПФ) длиной 256, то есть длину блока в 256 выборок x(n) с 50% перекрытием между блоками, что приводит к задержке кодера 10, равной 128 выборкам аудиосигнала. Оценка порога маскирования, выводимая модулем 26 перцепционной модели, например, представлена в форме спектральных выборок в диапазонах барк-шкалы или линейной шкале частот. Порог маскирования, выдаваемый модулем 26 перцепционной модели для каждого блока, используется в модуле 24 вычисления коэффициентов для вычисления коэффициентов фильтра заранее определенного фильтра, а именно фильтра 34. Коэффициенты, вычисленные модулем 28, могут быть, например, LPC коэффициентами, которые моделируют порог маскирования. Коэффициенты предварительного фильтра для каждого блока снова кодируются кодером 30 коэффициентов, который описан более подробно со ссылками на фиг.4. Декодер 32 коэффициентов декодирует кодированные коэффициенты предварительного фильтра для извлечения коэффициентов предварительного фильтра модуля 28, при этом предваритель