2500043 - Кодер, декодер, способ кодирования и способ декодирования

Кодер, декодер, способ кодирования и способ декодирования

Иллюстрации

Показать все

Изобретение относится к устройству кодирования, устройству декодирования, способу кодирования и способу декодирования. В кодере в кодовой книге (305) формы остатка спектра хранятся кандидаты, позволяющие получать высококачественный декодированный сигнал при масштабируемом кодировании исходного сигнала в первом и втором слоях, даже если блок второго или более высокого слоя осуществляет кодирование ни низкой битовой скорости векторов формы остатка спектра, в кодовой книге (307) коэффициента усиления остатка спектра хранятся кандидаты коэффициентов усиления остатка спектра, и вектор формы остатка спектра и коэффициент усиления остатка спектра последовательно выводятся из кандидатов согласно команде от блока (306) поиска. Умножитель (308) умножает кандидат вектора формы остатка спектра на кандидат коэффициента усиления остатка спектра и выводит результат на блок (303) фильтрации. Блок (303) фильтрации осуществляет фильтрацию с использованием внутреннего состояния фильтра основного тона, заданного блоком (302) задания состояния фильтра, отставания T, выведенного блоком (304) задания отставания, и вектора формы остатка спектра, подвергнутого регулировке коэффициента усиления. Технический результат - получение высококачественного декодированного сигнала при масштабируемом кодировании исходного сигнала в первом и втором слоях, даже если блок второго или более высокого слоя осуществляет кодирование при низкой битовой скорости остатка спектра, подвергнутого регулировке коэффициента усиления. 5 н. и 4 з.п. ф-лы, 21 ил.

Реферат

Область техники, к которой относится изобретение

Настоящее изобретение относится к устройству кодирования, устройству декодирования, способу кодирования и способу декодирования для кодирования/декодирования речевых сигналов, аудиосигналов и пр.

Описание уровня техники

Для эффективного использования радиоресурсов в системах мобильной связи необходимо сжимать речевые сигналы на низкой битовой скорости. С другой стороны, пользователь ожидает повышение качества передаваемой речи и реализации услуг связи с высокой точностью. Чтобы реализовать это, предпочтительно не только повышать качество речевых сигналов, но также иметь возможность кодировать сигналы, отличные от речевых, например аудиосигналы, имеющие более широкий диапазон, с высоким качеством.

С учетом таких противоречивых требований, подход иерархического включения совокупности методов кодирования выглядит многообещающим. В частности, пригодна конфигурация, объединяющая на многослойной основе блок кодирования первого уровня, который кодирует входной сигнал с использованием низкой битовой скорости с использованием модели, подходящей для речевого сигнала, и блок кодирования второго уровня, который кодирует сигнал остатка между входным сигналом и декодированным сигналом первого слоя с использованием модели, подходящей для общих сигналов, в том числе речевого сигнала. Схемы кодирования, имеющие такую многослойную структуру, обладают масштабируемостью (способны получать декодированные сигналы даже из частичной информации битовых потоков) в битовых потоках, полученных блоком кодирования, и поэтому такие схемы называются масштабируемым кодированием. Особенностью масштабируемого кодирования является дополнительная способность гибко поддерживать связь между сетями, имеющими разные битовые скорости. Эта особенность полезна для сетевого окружения будущего, где различные сети будут объединены IP-протоколом.

В качестве традиционного масштабируемого кодирования можно привести пример масштабируемого кодирования, раскрытого в непатентном документе 1. В этом документе раскрыт способ, согласно которому масштабируемое кодирование осуществляется с использованием метода, заданного в MPEG-4 (Moving Picture Experts Group phase-4) [Экспертная группа по вопросам движущегося изображения фаза 4]. В частности, на первом слое (базовом слое) речевой сигнал (исходный сигнал) кодируется с использованием CELP (Code Excited Linear Prediction) [возбуждаемое кодом линейное предсказание], и на втором слое (слое расширения) сигнал остатка кодируется с использованием кодирования преобразования, например ACC (Advanced Audio Coder) [усовершенствованный аудиокодер] и TwinVQ (Transform Domain Weighted Interleave Vector Quantization). Здесь сигнал остатка - это сигнал, полученный вычитанием сигнала (декодированного сигнала первого слоя), полученного декодированием кодированного кода, полученного на первом слое, из исходного сигнала.

Непатентный документ 1: “Everything for MPEG-4”, составленный Мики Сукеичи (Miki Sukeichi), опубликовый Kogyo Chosakai Publishing, Inc., 30 сентября 1998, стр. 126 - 127.

Сущность изобретения

Проблемы, стоящие перед изобретением

Однако согласно вышеописанному методу, отвечающему уровню техники, кодирование преобразования на втором слое осуществляется на сигнале остатка, полученном вычитанием декодированного сигнала первого слоя из исходного сигнала. В результате часть главной информации, содержащейся в исходном сигнале, удаляется через первый слой. В этом случае характеристика сигнала остатка близка к шумовой последовательности. Поэтому, когда кодирование преобразования, призванное эффективно кодировать музыкальные сигналы, например AAC и TwinVQ, используется для второго слоя, чтобы кодировать сигнал остатка, имеющий вышеописанную характеристику, и добиться высокого качества декодированного сигнала, необходимо выделять большое количество битов. Это значит, что битовая скорость возрастает.

Поэтому задачей настоящего изобретения, исходя из этих проблем, является обеспечение устройства кодирования, устройства декодирования, способа кодирования и способа декодирования, позволяющих получать высококачественные декодированные сигналы, даже когда кодирование осуществляется на низкой битовой скорости на втором слое или на слоях выше второго слоя.

Средство решения проблемы

Устройство кодирования, отвечающее настоящему изобретению, генерирует информацию кодирования низкочастотного диапазона и информацию кодирования высокочастотного диапазона из исходного сигнала и имеет конфигурацию, включающую в себя: блок вычисления первого спектра, который вычисляет первый спектр низкочастотного диапазона из декодированного сигнала информации кодирования низкочастотного диапазона; блок вычисления второго спектра, который вычисляет второй спектр из исходного сигнала; блок вычисления первого параметра, который вычисляет первый параметр, указывающий степень подобия между первым спектром и высокочастотным диапазоном второго спектра; блок вычисления второго параметра, который вычисляет второй параметр, указывающий компонент флуктуации между первым спектром и высокочастотным диапазоном второго спектра; и блок кодирования, который кодирует вычисленные первый параметр и второй параметр как информацию кодирования высокочастотного диапазона.

Устройство кодирования, отвечающее настоящему изобретению, генерирует информацию кодирования низкочастотного диапазона и информацию кодирования высокочастотного диапазона из исходного сигнала и имеет конфигурацию, включающую в себя: блок вычисления первого спектра, который вычисляет первый спектр низкочастотного диапазона из декодированного сигнала информации кодирования низкочастотного диапазона; блок вычисления второго спектра, который вычисляет второй спектр из исходного сигнала; блок вычисления параметра, который вычисляет параметр, указывающий степень подобия между первым спектром и высокочастотным диапазоном второго спектра; блок кодирования параметра, который кодирует вычисленный параметр как информацию кодирования высокочастотного диапазона; и блок кодирования остаточного компонента, который кодирует остаточный компонент между первым спектром и низкочастотным диапазоном второго спектра, в котором блок вычисления параметра вычисляет параметр после повышения качества первого спектра с использованием остаточного компонента, закодированного блоком кодирования остаточного компонента.

Устройство декодирования, отвечающее настоящему изобретению, имеет конфигурацию, включающую в себя: блок получения спектра, который получает первый спектр, соответствующий низкочастотному диапазону; блок получения параметра, который соответственно получает первый параметр, который закодирован в качестве информации кодирования высокочастотного диапазона и указывает степень подобия между первым спектром и высокочастотным диапазоном второго спектра, соответствующим исходному сигналу, и второй параметр, который закодирован в качестве информации кодирования высокочастотного диапазона и указывает компонент флуктуации между первым спектром и высокочастотным диапазоном второго спектра; и блок декодирования, который декодирует второй спектр с использованием полученных первого параметра и второго параметра.

Способ кодирования настоящего изобретения для генерации информации кодирования низкочастотного диапазона и информации кодирования высокочастотного диапазона на основании исходного сигнала имеет конфигурацию, включающую в себя: этап вычисления первого спектра, на котором вычисляют первый спектр низкочастотного диапазона из декодированного сигнала информации кодирования низкочастотного диапазона; этап вычисления второго спектра, на котором вычисляют второй спектр из исходного сигнала; этап вычисления первого параметра, на котором вычисляют первый параметр, указывающий степень подобия между первым спектром и высокочастотным диапазоном второго спектра; этап вычисления второго параметра, на котором вычисляют второй параметр, указывающий компонент флуктуации между первым спектром и высокочастотным диапазоном; и этап кодирования, на котором кодируют вычисленные первый параметр и второй параметр как информацию кодирования высокочастотного диапазона.

Способ декодирования настоящего изобретения имеет конфигурацию, включающую в себя: этап получения спектра, на котором получают первый спектр, соответствующий низкочастотному диапазону; этап получения параметра, на котором соответственно получают первый параметр, который закодирован в качестве информации кодирования высокочастотного диапазона и указывает степень подобия между первым спектром и высокочастотным диапазоном второго спектра, соответствующим исходному сигналу, и второй параметр, который закодирован в качестве информации кодирования высокочастотного диапазона и указывает компонент флуктуации между первым спектром и высокочастотным диапазоном второго спектра; и этап декодирования, на котором декодируют второй спектр с использованием полученных первого параметра и второго параметра.

Преимущества изобретения

Согласно настоящему изобретению можно получить высококачественный декодированный сигнал, осуществляя кодирование на низкой битовой скорости на втором слое или на слоях выше второго слоя.

Краткое описание чертежей

Фиг.1 - блок-схема, демонстрирующая конфигурацию устройства кодирования согласно варианту осуществления 1 настоящего изобретения;

фиг.2 - блок-схема, демонстрирующая конфигурацию блока кодирования второго уровня согласно варианту осуществления 1 настоящего изобретения;

фиг.3 - блок-схема, демонстрирующая конфигурацию блока кодирования диапазона расширения согласно варианту осуществления 1 настоящего изобретения;

фиг.4 - схема, демонстрирующая буфер генерации спектра, обрабатываемый на блоке фильтрации блока кодирования диапазона расширения согласно варианту осуществления 1 настоящего изобретения;

фиг.5 - схема, демонстрирующая содержимое битового потока, выведенного из блока мультиплексирования устройства кодирования согласно варианту осуществления 1 настоящего изобретения;

фиг.6 - блок-схема, демонстрирующая конфигурацию устройства декодирования согласно варианту осуществления 1 настоящего изобретения;

фиг.7 - блок-схема, демонстрирующая конфигурацию блока декодирования второго уровня согласно варианту осуществления 1 настоящего изобретения;

фиг.8 - блок-схема, демонстрирующая конфигурацию блока декодирования диапазона расширения согласно варианту осуществления 1 настоящего изобретения;

фиг.9 - блок-схема, демонстрирующая конфигурацию блока кодирования второго уровня согласно варианту осуществления 2 настоящего изобретения;

фиг.10 - блок-схема, демонстрирующая конфигурацию блока кодирования первого спектра согласно варианту осуществления 2 настоящего изобретения;

фиг.11 - блок-схема, демонстрирующая конфигурацию блока декодирования второго уровня согласно варианту осуществления 2 настоящего изобретения;

фиг.12 - блок-схема, демонстрирующая конфигурацию блока декодирования первого спектра согласно варианту осуществления 2 настоящего изобретения;

фиг.13 - блок-схема, демонстрирующая конфигурацию блока кодирования диапазона расширения согласно варианту осуществления 2 настоящего изобретения;

фиг.14 - блок-схема, демонстрирующая конфигурацию блока декодирования диапазона расширения согласно варианту осуществления 2 настоящего изобретения;

фиг.15 - блок-схема, демонстрирующая конфигурацию блока кодирования второго уровня согласно варианту осуществления 3 настоящего изобретения;

фиг.16 - блок-схема, демонстрирующая конфигурацию блока кодирования второго спектра согласно варианту осуществления 3 настоящего изобретения;

фиг.17 - блок-схема, демонстрирующая видоизмененный пример конфигурации блока кодирования второго спектра согласно варианту осуществления 3 настоящего изобретения;

фиг.18 - блок-схема, демонстрирующая конфигурацию блока декодирования второго уровня согласно варианту осуществления 3 настоящего изобретения;

фиг.19 - блок-схема, демонстрирующая видоизмененный пример конфигурации блока декодирования второго спектра согласно варианту осуществления 3 настоящего изобретения;

фиг.20 - блок-схема, демонстрирующая видоизмененный пример конфигурации блока кодирования второго уровня согласно варианту осуществления 3 настоящего изобретения; и

фиг.21 - блок-схема, демонстрирующая видоизмененный пример конфигурации блока декодирования второго уровня согласно варианту осуществления 3 настоящего изобретения.

Предпочтительные варианты осуществления изобретения

Настоящее изобретение относится к кодированию преобразования, пригодному для слоев расширения в масштабируемом кодировании, и, в частности, к способу эффективного кодирования спектра при кодировании преобразования.

Одна основная особенность состоит в том, что обработка фильтрацией осуществляется с использованием фильтра, принимающего спектр (декодированный спектр первого слоя), полученный благодаря осуществлению частотного анализа на декодированном сигнале первого слоя в качестве внутреннего состояния (состояния фильтра), и этот выходной сигнал принимается как оценочное значение для высокочастотного диапазона исходного спектра. Здесь исходный спектр - это спектр, полученный осуществлением частотного анализа на исходном сигнале с регулировкой задержки. Информация фильтра, когда сгенерированный выходной сигнал в основном является аналоговым в высокочастотном диапазоне исходного спектра, кодируется и передается на блок декодирования. Кодировать необходимо только информацию фильтра, что позволяет добиться низкой битовой скорости.

Согласно одному варианту осуществления настоящего изобретения при осуществлении обработки фильтрацией остаток спектра поступает на фильтр с использованием кодовой книги формы остатка спектра, в которой записана совокупность кандидатов остатка спектра. Согласно другому варианту осуществления компонент ошибки декодированного спектра первого слоя кодируется до того, как декодированный спектр первого слоя сохраняется в качестве внутреннего состояния фильтра, и после повышения качества декодированного спектра первого слоя высокочастотный диапазон исходного спектра оценивается путем обработки фильтрацией. Кроме того, согласно еще одному варианту осуществления компонент ошибки декодированного спектра первого слоя кодируется так, чтобы эффективность кодирования декодированного спектра первого слоя и эффективность оценивания спектра высокочастотного диапазона с использованием декодированного спектра первого слоя возрастали после кодирования компонента ошибки декодированного спектра первого слоя.

Перейдем к подробному описанию вариантов осуществления настоящего изобретения со ссылкой на прилагаемые чертежи. В каждом из вариантов осуществления осуществляется масштабируемое кодирование, имеющее многослойную структуру, образованную совокупностью слоев. Кроме того, в каждом варианте осуществления, для примера, считается, что (1) многослойная структура масштабируемого кодирования состоит из двух слоев, а именно первого слоя (базового слоя или нижнего слоя) и второго слоя, который является более высоким слоем, чем первый слой (слоем расширения или слоем развития), (2) кодирование (кодирование преобразования) осуществляется в частотной области при кодировании второго слоя, (3) MDCT (Modified Discrete Cosine Transform) [модифицированное дискретное косинусное преобразование] используется как схема преобразования при кодировании второго слоя, (4) при кодировании второго слоя, когда полный диапазон делится на совокупность поддиапазонов, полный диапазон делится на регулярные интервалы с использованием шкалы Барка, и тогда каждый поддиапазон соответствует каждому критическому диапазону, и (5) соотношение, состоящее в том, что F2 больше или равен F1 (F1≤F2), справедливо между частотой дискретизации (F1) входного сигнала для первого слоя и частотой дискретизации (F2) входного сигнала для второго слоя.

Вариант осуществления 1

На фиг.1 показана блок-схема, демонстрирующая конфигурацию устройства 100 кодирования, представляющего собой, например, устройство кодирования речи. Устройство 100 кодирования имеет блок 101 понижающей дискретизации, блок 102 кодирования первого уровня, блок 103 декодирования первого уровня, блок 104 мультиплексирования, блок 105 кодирования второго уровня и блок 106 задержки.

Согласно фиг.1 речевой сигнал и аудиосигнал (исходный сигнал) с частотой дискретизации F2 поступают на блок 101 понижающей дискретизации, обработка преобразованием дискретизации осуществляется на блоке 101 понижающей дискретизации, и сигнал с частотой дискретизации F1 генерируется и поступает на блок 102 кодирования первого уровня. Затем блок 102 кодирования первого уровня выводит кодированный код, полученный кодированием сигнала с частотой дискретизации F1, на блок 103 декодирования первого уровня и блок 104 мультиплексирования.

Затем блок 103 декодирования первого уровня генерирует декодированный сигнал первого слоя из кодированного кода, выведенного из блока 102 кодирования первого уровня, и выводит декодированный сигнал первого слоя на блок 105 кодирования второго уровня.

Блок задержки 106 вносит задержку заранее определенной длительности в исходный сигнал и выводит результат на блок 105 кодирования второго уровня. Эта задержка нужна для регулировки задержки по времени, возникающей на блоке 101 понижающей дискретизации, блоке 102 кодирования первого уровня и блоке 103 декодирования первого уровня.

Блок 105 кодирования второго уровня кодирует исходный сигнал, выведенный из блока 106 задержки, с использованием декодированного сигнала первого слоя, выведенного из блока 103 декодирования первого уровня. Затем кодированный код, полученный в результате этого кодирования, выводится на блок мультиплексирования 104.

Затем блок 104 мультиплексирования мультиплексирует кодированный код, выведенный из блока 102 кодирования первого уровня, и кодированный код, выведенный из блока 105 кодирования второго уровня, и выводит результат как битовый поток.

Перейдем к более подробному описанию блока 105 кодирования второго уровня. Конфигурация блока 105 кодирования второго уровня показана на фиг.2. Блок 105 кодирования второго уровня имеет блок 201 преобразования частотной области, блок 202 кодирования диапазона расширения, блок 203 преобразования частотной области и блок 204 вычисления перцепционного маскирования.

Согласно фиг.2 блок 201 преобразования частотной области осуществляет частотный анализ на декодированном сигнале первого слоя, выведенном из блока 103 декодирования первого уровня, для вычисления коэффициентов MDCT (декодированного спектра первого слоя). Затем декодированный спектр первого слоя выводится на блок 202 кодирования диапазона расширения.

Блок 203 преобразования частотной области вычисляет коэффициенты MDCT (исходный спектр) путем частотного анализа исходного сигнала, выведенного из блока 106 задержки, с использованием преобразования MDCT. Затем исходный спектр выводится на блок 202 кодирования диапазона расширения.

Затем блок 204 вычисления перцепционного маскирования вычисляет перцепционное маскирование для каждого диапазона с использованием исходного сигнала, выведенного из блока 106 задержки, и передает это перцепционное маскирование на блок 202 кодирования диапазона расширения.

Здесь перцепционное восприятие человека имеет характеристики перцепционного маскирования, при которых, когда данный сигнал слышен, даже если звук, имеющий частоту, близкую к частоте этого сигнала, достигает уха, звук трудно расслышать. Перцепционное маскирование используется для реализации эффективного кодирования спектра. При этом кодировании спектра искажение квантования, которое допустимо с перцепционной точки зрения, количественно оценивается с использованием характеристик перцепционного маскирования человека, и применяется способ кодирования, отвечающий допустимому искажению квантования.

Согласно фиг.3 блок 202 кодирования диапазона расширения имеет блок 301 регулировки амплитуды, блок 302 задания состояния фильтра, блок 303 фильтрации, блок 304 задания отставания, кодовую книгу 305 формы остатка спектра, блок 306 поиска, кодовую книгу 307 коэффициента усиления остатка спектра, умножитель 308, блок 309 декодирования спектра расширения и блок 310 кодирования масштабных коэффициентов.

Декодированный спектр первого слоя {S1(k);0≤k<Nn} из блока 201 преобразования частотной области и исходный спектр {S2(k);0≤k<Nw} из блока 203 преобразования частотной области поступают на блок 301 регулировки амплитуды. Здесь выполняется соотношение Nn<Nw, где количество точек спектра для декодированного спектра первого слоя обозначено Nn и количество точек спектра для исходного спектра обозначено Nw.

Блок 301 регулировки амплитуды регулирует амплитуду так, чтобы отношение (динамический диапазон) между спектром максимальной амплитуды декодированного спектра первого слоя {S1(k);0≤k<Nn} и спектром минимальной амплитуды достигало динамического диапазона для высокочастотного диапазона исходного спектра {S2(k);0≤k<Nw}. В частности, согласно нижеследующему уравнению 1 берется мощность спектра амплитуды.

S 1 ′ ( k ) = s i g n ( S 1 ( k ) ) ⋅ | S 1 ( k ) | γ

(Уравнение 1)

Здесь sign() - это функция, возвращающая положительный знак/отрицательный знак, и γ - действительное число в пределах 0≤γ≤1. Блок 301 регулировки амплитуды выбирает γ (коэффициент регулировки амплитуды), в случае, когда динамический диапазон декодированного спектра первого слоя с регулировкой амплитуды наиболее близок к динамическому диапазону для высокочастотного диапазона исходного спектра {S2(k);0≤k<Nw}, из совокупности кандидатов, подготовленных заранее, и выводит кодированный код на блок 104 мультиплексирования.

Блок 302 задания состояния фильтра задает декодированный спектр первого слоя с регулировкой амплитуды {S1'(k);0≤k<Nn} как внутреннее состояние фильтра основного тона, описанное ниже. В частности, декодированный спектр первого слоя с регулировкой амплитуды {S1(k);0≤k<Nn} выделяется в буфере генерации спектра {S(k);0≤k<Nn} и выводится на блок 303 фильтрации. Здесь буфер генерации спектра S(k) является матричной переменной, определенной в пределах 0≤k<Nw. Кандидаты для оценочного значения исходного спектра (ниже именуемого “оценочным исходным спектром”) в точке (Nw-Nn) генерируются с использованием обработки фильтрацией, описанной ниже.

Блок 304 задания отставания последовательно выводит отставание T на блок 303 фильтрации, постепенно изменяя отставание T в диапазоне поиска от TMIN до TMAX, заданном заранее в соответствии с командой от блока 306 поиска.

В кодовой книге 305 формы остатка спектра хранится совокупность кандидатов вектора формы остатка спектра. Кроме того, векторы формы остатка спектра последовательно выводятся из всех кандидатов или из заранее ограниченного числа кандидатов, в соответствии с командой от блока 306 поиска.

Аналогично, в кодовой книге 307 коэффициента усиления остатка спектра хранится совокупность кандидатских коэффициентов усиления остатка спектра. Кроме того, коэффициенты усиления остатка спектра последовательно выводятся из всех кандидатов или из заранее ограниченного числа кандидатов, в соответствии с командой от блока 306 поиска.

Затем умножитель 308 умножает векторы формы остатка спектра, выведенные из кодовой книги 305 формы остатка спектра, и коэффициент усиления остатка спектра, выведенный из кодовой книги 307 коэффициента усиления остатка спектра, и регулирует коэффициент усиления векторов формы остатка спектра. Затем векторы формы остатка спектра с регулировкой коэффициента усиления выводятся на блок 303 фильтрации.

Затем блок 303 фильтрации осуществляет обработку фильтрацией с использованием внутреннего состояния фильтра основного тона, заданного на блоке 302 задания состояния фильтра, отставания T, выведенного из блока 304 задания отставания, и векторов формы остатка спектра с регулировкой коэффициента усиления, и вычисляет оценочный исходный спектр. Передаточную функцию фильтра основного тона можно выразить нижеследующим уравнением 2. Кроме того, эту обработку фильтрацией можно выразить нижеследующим уравнением 3.

P ( z ) = 1 1 − z − T

(Уравнение 2)

S ( k ) = S ( k − T ) + g ( j ) ⋅ C ( i , k ) N n ≤ k < N w

(Уравнение 3)

Здесь C(i, k) - i-й вектор формы остатка спектра, и g(j) - j-й коэффициент усиления формы остатка. Буфер генерации спектра S(k), содержащийся в пределах Nn≤k<Nw, выводится на блок поиска 306 как выходной сигнал (т.е. оценочный исходный спектр) блока 303 фильтрации. Корреляция между буфером генерации спектра, декодированным спектром первого слоя с регулировкой амплитуды и выходным сигналом блока 303 фильтрации показана на фиг.4.

Блок поиска 306 предписывает блоку 304 задания отставания, кодовой книге 305 формы остатка спектра и кодовой книге 307 коэффициента усиления остатка спектра выводить отставание, форму остатка спектра и коэффициент усиления остатка спектра соответственно.

Кроме того, блок 306 поиска вычисляет искажение E между высокочастотным диапазоном исходного спектра {S2(k); Nn≤k<Nw} и выходным сигналом блока 303 фильтрации {S(k); Nn≤k<Nw}. Затем определяется комбинация отставания, вектора формы остатка спектра и коэффициента усиления остатка спектра в случае, когда искажение минимально с использованием AbS (анализ через синтез). При этом комбинация, перцепционное искажение которой минимально, выбирается с использованием перцепционного маскирования, выведенного из блока 204 вычисления перцепционного маскирования. Когда это искажение принимается равным E, искажение E выражается уравнением 4 с использованием весового коэффициента w(k), определенного с использованием, например, перцепционного маскирования. Здесь весовой коэффициент w(k) оказывается малой величиной на частоте, на которой перцепционное маскирование существенно (искажение трудно расслышать) и оказывается большой величиной на частоте, на которой перцепционное маскирование мало (искажение легко расслышать).

E = ∑ k = N n N w − 1 w ( k ) ⋅ ( S 2 ( k ) − S ( k ) ) 2

(Уравнение 4)

Кодированный код для отставания, определенного блоком 306 поиска, кодированный код для векторов формы остатка спектра и кодированный код для коэффициента усиления остатка спектра выводятся на блок 104 мультиплексирования и блок 309 декодирования спектра расширения.

Согласно вышеописанному способу определения кодированного кода с использованием AbS можно определять вектор формы остатка спектра и коэффициент усиления остатка спектра одновременно или последовательно определять каждый параметр (например, в порядке отставания, вектора формы остатка спектра и коэффициента усиления остатка спектра) для снижения объема вычислений.

Блок 309 декодирования спектра расширения декодирует кодированный код для отставания, выведенный из блока 306 поиска, совместно с кодированным кодом для коэффициента регулировки амплитуды, кодированным кодом для векторов формы остатка спектра и кодированным кодом для коэффициента усиления остатка спектра, выведенным из блока 301 регулировки амплитуды, и генерирует оценочное значение для исходного спектра (оценочный исходный спектр).

В частности, во-первых, регулировка амплитуды декодированного спектра первого слоя {S1(k); 0≤k<Nn} осуществляется в соответствии с вышеприведенным уравнением 1 с использованием декодированного коэффициента регулировки амплитуды γ. Затем декодированный спектр первого слоя с регулировкой амплитуды используется как внутреннее состояние фильтра, обработка фильтрацией осуществляется в соответствии с вышеприведенным уравнением 3 с использованием декодированного отставания, вектора формы остатка спектра и коэффициента усиления остатка спектра, и генерируется оценочный исходный спектр {S(k); Nn≤k<Nw}. Затем сгенерированный оценочный исходный спектр выводится на блок 310 кодирования масштабных коэффициентов.

Затем блок 310 кодирования масштабных коэффициентов кодирует масштабный коэффициент (масштабные коэффициенты) оценочного исходного спектра, которые наиболее пригодны с перцепционной точки зрения, применяя перцепционное маскирование с использованием высокочастотного диапазона исходного спектра {S2(k); Nn≤k<Nw}, выведенного из блока 203 преобразования частотной области, и оценочного исходного спектра {S(k); Nn≤k<Nw}, выведенного из блока 309 декодирования спектра расширения, и выводит кодированный код на блок 104 мультиплексирования.

Конкретно, кодированный код второго слоя состоит из комбинации кодированного кода (коэффициента регулировки амплитуды), выведенного из блока 301 регулировки амплитуды, кодированного кода (отставания, вектора формы остатка спектра, коэффициента усиления остатка спектра), выведенного из блока 306 поиска, и кодированного кода (масштабного коэффициента), выведенного из блока 310 кодирования масштабных коэффициентов.

Согласно этому варианту осуществления была описана конфигурация, где один набор кодированных кодов (коэффициент регулировки амплитуды, отставание, вектор формы остатка спектра, коэффициент усиления остатка спектра и масштабный коэффициент) определяется с применением блока 202 кодирования диапазона расширения к диапазонам Nn-Nw, но также возможна конфигурация, где диапазоны Nn-Nw делятся на совокупность диапазонов и блок 202 кодирования диапазона расширения применяется к каждому диапазону. В этом случае кодированные коды (коэффициент регулировки амплитуды, отставание, вектор остатка спектра, коэффициент усиления остатка спектра и масштабный коэффициент) определяются для каждого диапазона и выводятся на блок 104 мультиплексирования. Например, когда диапазоны Nn-Nw делятся на M диапазонов и блок 202 кодирования диапазона расширения применяется к каждому диапазону, затем получаются M наборов кодированных кодов (коэффициент регулировки амплитуды, отставание, вектор формы остатка спектра, коэффициент усиления остатка спектра и масштабный коэффициент).

Кроме того, можно также совместно использовать части кодированных кодов между соседними диапазонами, не передавая кодированные коды независимо для совокупности диапазонов. Например, когда диапазоны Nn-Nw делятся на M диапазонов и когда используется коэффициент регулировки амплитуды, общий для соседних диапазонов, количество кодированных кодов для коэффициентов регулировки амплитуды равно M/2, и количество кодированных кодов для других равно M.

Согласно этому варианту осуществления описан случай использования фильтра основного тона AR-типа первого порядка. Однако фильтры, к которым применимо настоящее изобретение, никоим образом не ограничиваются фильтром основного тона AR-типа первого порядка, и настоящее изобретение применимо также к фильтру с передаточной функцией, которую можно выразить с использованием нижеследующего уравнения 5. Используя фильтр основного тона с увеличенными параметрами L и M, определяющими порядок фильтра, можно выразить самые разнообразные характеристики и повысить качество. Однако, в соответствии с увеличением порядка, необходимо выделять большое количество битов кодирования для коэффициентов фильтра, и поэтому необходимо определять передаточную функцию соответствующего фильтра основного тона на основании практического выделения битов.

P ( z ) = 1 + ∑ j = − M M γ j z − T − j 1 − ∑ i = − L L β i z − T + i

(Уравнение 5)

Согласно этому варианту осуществления предполагается использование перцепционного маскирования, но возможна конфигурация, где перцепционное маскирование не используется. В этом случае уже не нужно обеспечивать блок 204 вычисления перцепционного маскирования, показанный на фиг.2, в блоке 105 кодирования второго уровня, что позволяет сократить объем вычислений для устройства в целом.

Опишем конфигурацию битового потока, выведенного из блока 104 мультиплексирования, со ссылкой на фиг.5. Кодированный код первого слоя и кодированный код второго слоя сохраняются по порядку от MSB (старшего бита) битового потока. Кроме того, кодированный код второго слоя сохраняется в порядке масштабного коэффициента, коэффициента регулировки амплитуды, отставания, коэффициента усиления остатка спектра и вектора формы остатка спектра, и информация для последнего размещается в позициях, более близких к LSB (младшему биту). Конфигурация этого битового потока такова, что, в отношении чувствительности к потере кода каждого кодированного кода (степени ухудшения качества декодированного сигнала при потере кодированного кода), части битового потока, где чувствительность к ошибкам кодирования выше (ухудшение велико), размещаются в позициях, более близких к MSB. Согласно этой конфигурации можно минимизировать ухудшение, обусловленное отбрасыванием, отбрасывая по порядку от LSB, когда битовый поток частично отбрасывается на канале связи. В иллюстративной конфигурации сети, где битовый поток отбрасывается в порядке приоритета от LSB, каждый кодированный код, разделенный на секции, как показано на фиг.5, передается с использованием отдельных пакетов, каждому пакету назначается приоритет, и используется сеть с коммутацией пакетов, способная к управлению приоритетами. Конфигурация сети никоим образом не ограничена вышеописанной.

Кроме того, в конфигурации битового потока, где кодированные параметры с более высокой чувствительностью к ошибкам кодирования согласно фиг.5 размещаются в позициях, более близких к MSB, путем применения канального кодирования, в результате чего обнаружение ошибок и исправление ошибок применяются более строго к битам, более близким к MSB, можно минимизировать ухудшение качества декодирование. Например, в качестве методов обнаружения ошибок и исправления ошибок можно применять кодирование CRC и кодирование RS.

На фиг.6 показана блок-схема, демонстрирующая конфигурацию устройства 600 декодирования, например устройства декодирования речи.

Устройство 600 декодирования содержит блок 601 разделения, который разделяет битовый поток, выведенный из устройства 100 кодирования, на кодированный код первого слоя и кодированный код второго слоя, блок 602 декодирования первого уровня, который декодирует кодированный

Кодер, декодер, способ кодирования и способ декодирования

Патент 2500043