Устройство масштабируемого декодирования и устройство масштабируемого кодирования
Иллюстрации
Показать всеИзобретение относится к устройствам масштабируемого декодирования и масштабируемого кодирования. В устройстве масштабируемого декодирования блок (1211) регулировки амплитуды использует разные регулировочные коэффициенты в соответствии с характеристикой информации спектра первого уровня для регулировки амплитуды спектра декодированного сигнала первого уровня и затем выводит отрегулированный по амплитуде спектр декодированного сигнала первого уровня в блок (1012) генерации псевдоспектра. Используя отрегулированный по амплитуде спектр декодированного сигнала первого уровня, полученный из блока (1211) регулировки амплитуды, блок (1012) генерации псевдоспектра генерирует и выводит псевдоспектр высоких частот в блок (1013) масштабирования. Блок (1013) масштабирования масштабирует спектр, полученный от блока (1012) генерации псевдоспектра, и затем выводит его в сумматор (В). Технический результат - обеспечение получения декодированного сигнала высокого качества с незначительным ухудшением в спектре диапазона высоких частот. 2 н.п. ф-лы, 26 ил.
Реферат
Область техники, к которой относится изобретение
Настоящее изобретение относится к устройству масштабируемого декодирования и устройству масштабируемого кодирования, используемым для осуществления связи с использованием речевых сигналов и аудиосигналов в системе мобильной связи и в системе пакетной связи, использующей интернет-протокол.
Уровень техники
Для эффективного использования радиоресурсов в системе мобильной связи необходимо сжимать речевые сигналы на низкой битовой скорости. С другой стороны, пользователь ожидает повышение качества передаваемой речи и реализации услуг связи с высокой точностью ощущения. Чтобы реализовать это, предпочтительно не только повышать качество речевых сигналов, но также иметь возможность кодировать сигналы, отличные от речевых, например аудиосигналы, имеющие более широкий диапазон, с высоким качеством.
Кроме того, в условиях эксплуатации, где существуют различные типы сетей, необходима схема кодирования речи, которая может гибко поддерживать связь между разными сетями, связь между терминалами, использующими разные услуги, связь между терминалами, имеющими разную производительность обработки, и взаимную связь в режиме многоточечной связи, а также связь между двумя сторонами.
Кроме того, необходима схема кодирования речи, устойчивая к ошибкам в канале связи (в частности, в сетях с коммутацией пакетов, например, IP-сетях).
Одной из схем кодирования речи, удовлетворяющей таким требованиям, является схема кодирования речи с масштабированием диапазона рабочих частот. Схема кодирования с масштабированием диапазона рабочих частот - это схема кодирования, которая кодирует речевые сигналы в многоуровневом режиме, и схема кодирования, где качество кодирования возрастает в соответствии с увеличением количества уровней кодирования. Битовую скорость можно задать переменной путем увеличения или уменьшения количества уровней кодирования, что позволяет эффективно использовать пропускную способность канала связи.
Кроме того, в схеме кодирования речи с масштабированием диапазона рабочих частот не только необходим прием, по меньшей мере, кодированных данных базового уровня на стороне декодера, но и допустима, до некоторой степени, потеря кодированной информации дополнительных уровней в канале связи, и поэтому схема кодирования речи с масштабированием диапазона рабочих частот обеспечивает высокую устойчивость к ошибкам в канале связи. Кроме того, диапазон рабочих частот речевых сигналов, подлежащих кодированию, также расширяется в соответствии с возрастанием количества уровней кодирования. Например, для базового уровня используется схема кодирования речи в телефонном диапазоне рабочих частот, соответствующем уровню техники. Кроме того, в дополнительных уровнях (уровнях расширения) уровни имеют конфигурацию, позволяющую кодировать широкополосный речевой сигнал, например, в диапазоне рабочих частот 7 кГц.
Таким образом, в схеме кодирования речи с масштабированием диапазона рабочих частот речевые сигналы телефонного диапазона рабочих частот кодируются в базовом уровне, и широкополосные сигналы высокого качества кодируются в уровнях расширения, что позволяет использовать схему кодирования речи с масштабированием рабочих частот как для терминалов с услугой передачи речи в телефонном диапазоне рабочих частот, так и для терминалов с услугой широкополосной передачи речи высокого качества и поддерживать многоточечную связь с участием двух терминалов. Кроме того, кодированная информация является многоуровневой, что позволяет увеличить устойчивость к ошибкам благодаря разработке метода связи и легко управлять битовой скоростью на стороне кодирования или в канале связи. Поэтому, схема кодирования речи с масштабированием диапазона рабочих частот привлекает внимание как схема кодирования речи для связи будущего.
Способ, раскрытый в непатентном документе 1, приведен в качестве примера вышеописанной схемы кодирования речи с масштабированием диапазона рабочих частот.
В схеме кодирования речи с масштабированием диапазона рабочих частот, раскрытой в непатентном документе 1, коэффициенты MDCT кодируются с использованием масштабного коэффициента и информации структуры высокого разрешения для каждого диапазона рабочих частот. Масштабный коэффициент кодируется по Хаффману, и структура высокого разрешения подвергается векторному квантованию. Слуховое взвешивание каждого диапазона рабочих частот вычисляется с использованием результата декодирования масштабного коэффициента и принимается решение по выделению битов для каждого диапазона рабочих частот. Ширина каждого диапазона рабочих частот является неравномерной и задается заранее, так, чтобы она расширялась для диапазона более высоких частот.
Кроме того, информация передачи подразделяется на четыре группы, что описано ниже.
A: Информация кодирования базового кодека
B: Информация кодирования масштабных коэффициентов диапазона верхних частот
C: Информация кодирования масштабных коэффициентов диапазона нижних частот
D: Информация кодирования структуры спектра высокого разрешения.
Кроме того, следующая обработка осуществляется на стороне декодирования.
<Случай 1> Когда информацию для A нельзя принять полностью, декодированная речь генерируется путем осуществления обработки кадра компенсации потерь.
<Случай 2> Когда принимается только информация для A, выводится декодированный сигнал для базового кодека.
<Случай 3> В случае приема информации для B помимо информации для A, диапазон верхних частот генерируется путем зеркального отражения декодированного сигнала для базового кодека и генерируется декодированный сигнал, имеющий более широкую полосу, чем декодированный сигнал кодека. Декодированная информация для B используется при генерации форм спектра диапазона верхних частот. Зеркальное отражение выполняется на вокализованном кадре и осуществляется так, чтобы гармоническая структура не коллапсировала (не разрушалась). Диапазон верхних частот генерируется на невокализованном кадре с использованием случайного шума.
<Случай 4> В случае приема информации C помимо информации для A и B осуществляется такая же обработка декодированием, что и в случае 3, с использованием только информации для A и B.
<Случай 5> В случае приема информации для D помимо информации для A, B и C полная обработка декодированием осуществляется в диапазонах рабочих частот, где принимается вся информация для A-D, и спектр высокого разрешения декодируется путем зеркального отражения декодированного спектра сигнала на стороне диапазона нижних частот в диапазонах, где информация для D не принимается. Даже, если информация для D не принимается, можно принимать информацию для B и C, и эта информация для B и C используется при декодировании информации огибающей спектра. Зеркальное отражение выполняется на вокализованном кадре и осуществляется так, чтобы гармоническая структура не коллапсировала. Диапазон верхних частот генерируется на невокализованном кадре с использованием случайного шума.
Непатентный документ 1: Ковеси (B. Kovesi) и др., “A scalable speech and audio coding scheme with continuous bit rate flexibility”, в материалах IEEE ICASSP 2004, стр.I-273-I-276.
Сущность изобретения
Проблемы, стоящие перед изобретением
Согласно уровню техники (непатентный документ 1) диапазон верхних частот генерируется путем зеркального отражения. При этом зеркальное отражение осуществляется так, чтобы гармоническая структура не коллапсировала, чтобы поддерживать гармоническую структуру. Однако гармоническая структура диапазона нижних частот появляется в диапазоне верхних частот как зеркальное изображение. Обычно, в вокализованном сигнале, гармоническая структура более склонна к коллапсу в диапазоне верхних частот, и поэтому гармоническая структура не появляется более заметно в диапазоне верхних частот, чем в диапазоне нижних частот. Иными словами, несмотря на то, что впадины в гармониках диапазона нижних частот глубокие, впадины в гармониках диапазона верхних частот неглубокие, или, в ряде случаев, сама гармоническая структура становится менее выраженной. Поэтому, согласно вышеописанному уровню техники гармоническая структура с большей легкостью отчетливо проявляется в компонентах диапазона верхних частот, из-за чего качество декодированного речевого сигнала ухудшается.
Таким образом, задачей настоящего изобретения является создание устройства масштабируемого декодирования и устройства масштабируемого кодирования, позволяющих получать высококачественный декодированный речевой (аудио) сигнал с незначительным ухудшением в спектре диапазона верхних частот, даже когда речевой (или аудио) сигнал декодируется путем генерации спектра диапазона верхних частот с использованием спектра диапазона нижних частот.
Средство решения проблемы
Устройство масштабируемого декодирования согласно настоящему изобретению, содержит первый блок декодирования, который декодирует кодированную информацию диапазона нижних частот и получает декодированный сигнал диапазона нижних частот, и второй блок декодирования, который получает декодированный сигнал диапазона верхних частот из декодированного сигнала диапазона нижних частот и кодированной информации диапазона верхних частот, причем второй блок декодирования содержит блок преобразования, который преобразует декодированный сигнал диапазона нижних частот и получает спектр диапазона нижних частот, блок регулировки, который осуществляет регулировку амплитуды в спектре диапазона нижних частот, и блок генерации, который генерирует спектр диапазона нижних частот в псевдорежиме с использованием спектра диапазона нижних частот, отрегулированного по амплитуде, и кодированной информации диапазона верхних частот.
Преимущества изобретения
Настоящее изобретение позволяет получать высококачественный декодированный речевой (или аудио) сигнал с незначительным ухудшением в диапазоне верхних частот, даже когда речевой (или аудио) сигнал декодируется путем генерации спектра диапазона верхних частот с использованием спектра диапазона нижних частот.
Краткое описание чертежей
Фиг.1 - блок-схема, демонстрирующая конфигурацию устройства масштабируемого декодирования согласно варианту осуществления 1 настоящего изобретения;
фиг.2 - блок-схема, демонстрирующая конфигурацию устройства масштабируемого кодирования согласно варианту осуществления 1 настоящего изобретения;
фиг.3 - блок-схема, демонстрирующая конфигурацию блока декодирования второго уровня согласно варианту осуществления 1 настоящего изобретения;
фиг.4 - блок-схема, демонстрирующая конфигурацию блока кодирования второго уровня согласно варианту осуществления 1 настоящего изобретения;
фиг.5 - блок-схема, демонстрирующая конфигурацию блока декодирования спектра согласно варианту осуществления 1 настоящего изобретения;
фиг.6 - другая блок-схема, демонстрирующая конфигурацию блока декодирования спектра согласно варианту осуществления 1 настоящего изобретения;
фиг.7 - еще одна блок-схема, демонстрирующая конфигурацию блока декодирования спектра согласно варианту осуществления 1 настоящего изобретения;
фиг.8 - еще одна блок-схема, демонстрирующая конфигурацию блока декодирования спектра согласно варианту осуществления 1 настоящего изобретения;
фиг.9 - еще одна блок-схема, демонстрирующая конфигурацию блока декодирования спектра согласно варианту осуществления 1 настоящего изобретения;
фиг.10 - еще одна блок-схема, демонстрирующая конфигурацию блока декодирования спектра согласно варианту осуществления 1 настоящего изобретения;
фиг.11 - схема, демонстрирующая обработку генерации компонента диапазона верхних частот в блоке декодирования спектра диапазона верхних частот согласно варианту осуществления 1 настоящего изобретения;
фиг.12 - еще одна блок-схема, демонстрирующая конфигурацию блока декодирования спектра согласно варианту осуществления 1 настоящего изобретения;
фиг.13 - еще одна блок-схема, демонстрирующая конфигурацию блока декодирования спектра согласно варианту осуществления 1 настоящего изобретения;
фиг.14 - блок-схема, демонстрирующая конфигурацию блока декодирования второго уровня согласно варианту осуществления 2 настоящего изобретения;
фиг.15 - блок-схема, демонстрирующая конфигурацию блока кодирования второго уровня согласно варианту осуществления 2 настоящего изобретения;
фиг.16 - еще одна блок-схема, демонстрирующая конфигурацию блока декодирования спектра согласно варианту осуществления 2 настоящего изобретения;
фиг.17 - еще одна блок-схема, демонстрирующая конфигурацию блока декодирования спектра согласно варианту осуществления 2 настоящего изобретения;
фиг.18 - блок-схема, демонстрирующая конфигурацию блока кодирования первого спектра согласно варианту осуществления 2 настоящего изобретения;
фиг.19 - блок-схема, демонстрирующая конфигурацию блока декодирования с расширенным диапазоном согласно варианту осуществления 2 настоящего изобретения;
фиг.20 - другая блок-схема, демонстрирующая конфигурацию блока декодирования с расширенным диапазоном согласно варианту осуществления 2 настоящего изобретения;
фиг.21 - еще одна блок-схема, демонстрирующая конфигурацию блока декодирования с расширенным диапазоном согласно варианту осуществления 2 настоящего изобретения;
фиг.22 - еще одна блок-схема, демонстрирующая конфигурацию блока декодирования с расширенным диапазоном согласно варианту осуществления 2 настоящего изобретения;
фиг.23 - схема, демонстрирующая обработку генерации компонента диапазона верхних частот во втором блоке декодирования с расширенным диапазоном согласно варианту осуществления 1 настоящего изобретения;
фиг.24 - блок-схема, демонстрирующая конфигурацию блока кодирования с расширенным диапазоном согласно варианту осуществления 2 настоящего изобретения;
фиг.25 - схема, демонстрирующая содержимое битового потока, принятого блоком разделения устройства масштабируемого декодирования согласно варианту осуществления 2 настоящего изобретения;
фиг.26 - блок-схема, демонстрирующая конфигурацию блока декодирования с расширенным диапазоном согласно варианту осуществления 3 настоящего изобретения.
Предпочтительные варианты осуществления изобретения
Варианты осуществления настоящего изобретения подробно описаны ниже со ссылкой на прилагаемые чертежи.
Вариант осуществления 1
На фиг.1 показана блок-схема, демонстрирующая конфигурацию устройства масштабируемого декодирования для формирования, например, устройства декодирования речевого (аудио) сигнала с масштабированием диапазона рабочих частот.
Устройство 100 масштабируемого декодирования включает в себя блок 101 разделения, блок 102 декодирования первого уровня и блок 103 декодирования второго уровня.
Блок 101 разделения принимает битовый поток, передаваемый с устройства масштабируемого кодирования, описанного ниже, разделяет битовый поток на параметр кодирования первого уровня и параметр кодирования второго уровня и выводит параметры, соответственно, в блок 102 декодирования первого уровня и блок 103 декодирования второго уровня.
Блок 102 декодирования первого уровня декодирует параметр кодирования первого уровня, введенный из блока 101 разделения, и выводит декодированный сигнал первого уровня. Этот декодированный сигнал первого уровня также выводится в блок 103 декодирования второго уровня.
Блок декодирования второго уровня декодирует параметр кодирования второго уровня, введенный из блока 101 разделения, с использованием декодированного сигнала первого уровня, введенного из блока 102 декодирования первого уровня, и выводит декодированный сигнал второго уровня.
На фиг.2 показан пример конфигурации устройства 200 масштабируемого кодирования, соответствующего устройству 100 масштабируемого декодирования, показанному на фиг.1.
Согласно фиг.2 блок 201 кодирования первого уровня кодирует введенный речевой сигнал (исходный сигнал) и выводит полученные параметры кодирования в блок 202 декодирования первого уровня и блок 203 мультиплексирования. Блок 201 декодирования первого уровня реализует масштабируемость диапазона для первого и второго уровней, выполняя обработку понижающей дискретизацией и обработку фильтрацией низких частот для кодирования.
Затем блок 202 декодирования первого уровня генерирует декодированный сигнал первого уровня из параметров кодирования, введенных из блока 201 кодирования первого уровня, и выводит декодированный сигнал первого уровня в блок 204 кодирования второго уровня.
Затем блок 204 кодирования второго уровня кодирует введенный речевой сигнал (исходный сигнал) с использованием декодированного сигнала первого уровня, введенного из блока 202 декодирования первого уровня, и выводит полученный параметр кодирования в блок 203 мультиплексирования. Блок 204 кодирования второго уровня осуществляет обработку повышающей дискретизацией декодированного сигнала первого уровня и обработку регулировкой фазы для согласования фаз первого декодированного сигнала и введенного речевого сигнала согласно обработке, осуществляемой в блоке 201 кодирования первого уровня (обработке понижающей дискретизацией или обработке фильтрацией низких частот) для кодирования.
Затем блок 203 мультиплексирования мультиплексирует параметр кодирования, введенный из блока 201 кодирования первого уровня, и параметр кодирования, введенный из блока 204 кодирования второго уровня, и выводит результат как битовый поток.
Перейдем к подробному описанию блока 103 декодирования второго уровня, показанного на фиг.1. На фиг.3 показана блок-схема, демонстрирующая конфигурацию блока 103 декодирования второго уровня. Блок 103 декодирования второго уровня включает в себя блок 301 разделения, блок 302 декодирования масштабных коэффициентов, блок 303 декодирования спектра высокого разрешения, блок 304 преобразования частотной области, блок 305 декодирования спектра и блок 306 преобразования временной области.
Блок 301 разделения разделяет введенный параметр кодирования второго уровня на параметр кодирования (параметры масштабного коэффициента), указывающий масштабные коэффициенты, и параметр кодирования (параметр спектра высокого разрешения), указывающий структуру спектра высокого разрешения, и выводит параметры кодирования в блок 302 декодирования масштабных коэффициентов и блок 303 декодирования спектра высокого разрешения, соответственно.
Блок 302 декодирования масштабных коэффициентов декодирует введенный параметр масштабного коэффициента для получения масштабных коэффициентов диапазона нижних частот и масштабных коэффициентов диапазона верхних частот и выводит масштабные коэффициенты декодирования в блок 305 декодирования спектра и блок 303 декодирования спектра высокого разрешения.
Блок 303 декодирования спектра высокого разрешения вычисляет слуховое взвешивание для каждого диапазона с использованием масштабных коэффициентов, введенных из блока 302 декодирования масштабных коэффициентов, и получает число битов, выделенных для информации спектра высокого разрешения каждого диапазона. Затем блок 303 декодирования спектра высокого разрешения декодирует параметры спектра высокого разрешения, введенные из блока 301 разделения, и получает информацию декодирования спектра высокого разрешения для каждого диапазона и выводит результат в блок 305 декодирования спектра. Информацию для декодированного сигнала также можно использовать первого уровня при вычислении слухового взвешивания, и в этом случае, выходной сигнал блока 304 преобразования частотной области также поступает в блок 303 декодирования спектра высокого разрешения.
Блок 304 преобразования частотной области преобразует введенный декодированный сигнал первого уровня в параметр спектра частотной области (например, коэффициенты MDCT) и выводит результат в блок 305 декодирования спектра.
Блок 305 декодирования спектра декодирует второй декодированный сигнал из декодированного сигнала первого уровня, который поступает из блока 304 преобразования частотной области и преобразуется в частотную область, масштабные коэффициенты декодирования (диапазон нижних частот и диапазон верхних частот), введенные из блока 302 декодирования масштабных коэффициентов, и информацию декодирования спектра высокого разрешения, введенную 303 из блока декодирования спектра высокого разрешения, и выводит результат в блок 306 преобразования временной области.
Блок преобразования временной области 306 преобразует спектр декодированного сигнала второго уровня, введенного из блока 305 декодирования спектра, в сигнал временной области и выводит результат как декодированный сигнал второго уровня.
На фиг.4 показан пример конфигурации блока 204 кодирования второго уровня, соответствующего блоку 103 декодирования второго уровня, показанному на фиг.3.
Согласно фиг.4 введенный речевой сигнал поступает в блок 401 вычисления слухового маскирования и блок 402A преобразования частотной области.
Блок 401 вычисления слухового маскирования вычисляет слуховое маскирование для каждого поддиапазона, имеющего заранее определенную ширину, и выводит это слуховое маскирование в блок 403 кодирования масштабного коэффициента и блок 404 кодирования спектра высокого разрешения.
Здесь восприятие человеческой аудитории имеет характеристики слухового маскирования, которые, при прослушивании данного сигнала, даже если звук, имеющий частоту, близкую к частоте этого сигнал достигает уха, звук трудно расслышать. Это дает возможность реализовать эффективное кодирование спектра, с использованием слухового маскирования на основании этой характеристики слухового маскирования, путем выделения малого количества битов квантования частотному спектру, в котором искажения квантования трудно расслышать, и выделяя большое битов квантования частотному спектру, в котором искажения квантования легко расслышать.
Блок 402A преобразования частотной области преобразует введенный речевой сигнал в параметр спектра частотной области (например, коэффициенты MDCT) и выводит результат в блок 403 кодирования масштабного коэффициента и блок 404 кодирования спектра. Блок 402B преобразования частотной области преобразует введенный декодированный сигнал первого уровня в параметр спектра частотной области (например, коэффициенты MDCT) и выводит результат в блок 403 кодирования масштабного коэффициента и блок 404 кодирования спектра.
Блок 403 кодирования масштабного коэффициента кодирует дифференциальный спектр между параметром спектра, введенным из блока 402A преобразования частотной области, и декодированным спектром первого уровня, введенным из блока 402 преобразования частотной области, с использованием информации слухового маскирования, введенный из блока 401 вычисления слухового маскирования, получает параметр масштабного коэффициента и выводит параметр масштабного коэффициента в блок 405 мультиплексирования параметров кодирования и блок 404 кодирования спектра высокого разрешения. Здесь показан пример, где параметр масштабного коэффициента спектра диапазона верхних частот и параметр масштабного коэффициента спектра диапазона нижних частот выводятся раздельно.
Блок 404 кодирования спектра высокого разрешения декодирует параметр масштабного коэффициента (диапазон нижних частот и диапазон верхних частот), введенный из блока 403 кодирования масштабного коэффициента, получает декодированные масштабные коэффициенты (диапазон нижних частот и диапазон верхних частот) и нормализует дифференциальный спектр между параметром спектра, введенным из блока 402A преобразования частотной области, и декодированным спектром первого уровня, введенным из блока 402B преобразования частотной области, с использованием масштабных коэффициентов декодирования (диапазон нижних частот и диапазон верхних частот). Блок 404 кодирования спектра высокого разрешения кодирует нормализованный дифференциальный спектр и выводит дифференциальный спектр после кодирования (параметры кодирования спектра высокого разрешения) в блок 405 мультиплексирования параметров кодирования. При этом блок 404 кодирования спектра высокого разрешения вычисляет слуховое взвешивание для диапазона спектра высокого разрешения с использованием декодированных масштабных коэффициентов (нижний диапазон и верхний диапазон) и осуществляет выделение битов в соответствии со слуховым взвешиванием. Это слуховое взвешивание также можно вычислять с использованием декодированного спектра первого уровня.
Блок 405 мультиплексирования параметров кодирования мультиплексирует параметр масштабного коэффициента спектра диапазона верхних частот и параметр масштабного коэффициента спектра диапазона нижних частот, введенные из блока 403 кодирования масштабного коэффициента, и параметр кодирования спектра высокого разрешения, введенный из блока 404 кодирования спектра высокого разрешения, и выводит результат как параметр кодирования первого спектра.
Перейдем к подробному описанию блока 305 декодирования спектра, показанного на фиг.3. На фиг.5-фиг.9 показаны блок-схемы, демонстрирующие конфигурацию блока 305 декодирования спектра.
На фиг.5 показана конфигурация для выполнения обработки при нормальном приеме декодированного сигнала первого уровня, всех масштабных коэффициентов декодирования (диапазон нижних частот и диапазон верхних частот) и всей информации декодирования спектра высокого разрешения.
На фиг.6 показана конфигурация для выполнения обработки, когда часть информации декодирования спектра высокого разрешения для диапазона верхних частот не принята. Фиг.6 отличается от фиг.5 тем, что выходной сигнал сумматора A поступает в блок 602 декодирования спектра диапазона верхних частот. Спектр для диапазонов, подлежащих декодированию с использованием информации декодирования спектра высокого разрешения диапазона верхних частот, которая не принята, генерируется в псевдорежиме следующим способом.
На фиг.7 показана конфигурация для выполнения обработки, когда никакая информация декодирования спектра высокого разрешения диапазона верхних частот не принята (включая случай, когда часть информации декодирования спектра высокого разрешения диапазона нижних частот не принята). Отличие от фиг.6 состоит в том, что информация декодирования спектра высокого разрешения не поступает в блок 702 декодирования спектра диапазона верхних частот. Спектр для диапазонов, подлежащих декодированию с использованием информации декодирования спектра высокого разрешения диапазона верхних частот, которая не принята, генерируется в псевдорежиме следующим способом.
На фиг.8 показана конфигурация для выполнения обработки, когда никакая информация декодирования спектра высокого разрешения не принята, и, кроме того, не принята часть масштабных коэффициентов декодирования диапазона нижних частот. Отличие от фиг.7 состоит в том, что информация декодирования спектра высокого разрешения не поступает, ничего не выводится из блока 801 декодирования спектра диапазона нижних частот, и сумматор A отсутствует. Спектр для диапазонов, подлежащих декодированию с использованием информации декодирования спектра высокого разрешения диапазона верхних частот, которая не принята, генерируется в псевдорежиме следующим способом.
На фиг.9 показана конфигурация для выполнения обработки, когда принимаются только масштабные коэффициенты декодирования диапазона верхних частот (включая случай, когда часть масштабных коэффициентов декодирования диапазона верхних частот не принята). Отличие от фиг.8 состоит в том, что не поступают масштабные коэффициенты декодирования диапазона нижних частот и отсутствует блок декодирования спектра диапазона нижних частот. Способ генерации спектра диапазона верхних частот в псевдорежиме только из принятых масштабных коэффициентов декодирования диапазона верхних частот будет описан позже.
Блок 305 декодирования спектра, показанный на фиг.5, снабжен блоком 501 декодирования спектра диапазона нижних частот, блоком 502 декодирования спектра диапазона верхних частот, сумматором A и сумматором B.
Блок 501 декодирования спектра диапазона нижних частот декодирует спектр диапазона нижних частот с использованием масштабных коэффициентов декодирования диапазона нижних частот, введенных из блока 302 декодирования масштабных коэффициентов, и информацию декодирования спектра высокого разрешения, введенную из блока 303 декодирования спектра высокого разрешения, и выводит результат на сумматор A. Обычно декодированный спектр вычисляется путем умножения информации декодирования спектра высокого разрешения на масштабные коэффициенты декодирования.
Сумматор A суммирует декодированный спектр диапазона нижних частот (остаток), введенный из блока декодирования спектра диапазона нижних частот 501, и декодированный сигнал первого уровня (спектр), введенный из блока 302 преобразования частотной области, для получения декодированного спектра диапазона нижних частот и выводит результат на сумматор B.
Блок 502 декодирования спектра диапазона верхних частот декодирует спектр диапазона верхних частот с использованием масштабных коэффициентов декодирования диапазона верхних частот, введенных из блока 302 декодирования масштабных коэффициентов, и информацию декодирования спектра высокого разрешения, введенную из блока 303 декодирования спектра высокого разрешения, и выводит результат на сумматор B.
Сумматор B суммирует декодированный спектр диапазона нижних частот, введенный из сумматора A, и декодированный спектр диапазона верхних частот, введенный из блока 502 декодирования спектра диапазона верхних частот для генерации спектра для всех диапазонов (всех частотных диапазонов, объединяющих диапазон нижних частот и диапазон верхних частот), и выводит результат как декодированный спектр.
Фиг.6 отличается от фиг.5 только работой блока 602 декодирования спектра диапазона верхних частот.
Блок 602 декодирования спектра диапазона верхних частот декодирует спектр диапазона верхних частот с использованием масштабных коэффициентов декодирования диапазона верхних частот, введенных из блока 302 декодирования масштабных коэффициентов, и информацию декодирования спектра высокого разрешения диапазона верхних частот, введенную из блока 303 декодирования спектра высокого разрешения. При этом информация декодирования спектра высокого разрешения диапазона верхних частот для части диапазона не принимается, и поэтому спектр диапазона верхних частот для соответствующего диапазона нельзя декодировать точно. Затем блок 602 декодирования спектра диапазона верхних частот генерирует спектр диапазона верхних частот в псевдорежиме с использованием декодированных масштабных коэффициентов, декодированного спектра диапазона нижних частот, введенного из сумматора A, и спектра диапазона верхних частот, который можно принимать и точно декодировать. Конкретный способ генерации описан ниже.
На фиг.7 показана операция фиг.5 и фиг.6 в случае, когда никакая информация декодирования спектра высокого разрешения диапазона верхних частот не принимается. В этом случае, блок 702 декодирования спектра диапазона верхних частот декодирует спектр диапазона верхних частот с использованием только масштабных коэффициентов декодирования диапазона верхних частот, введенных из блока 302 декодирования масштабных коэффициентов.
Кроме того, блок 701 декодирования спектра диапазона нижних частот декодирует спектр диапазона верхних частот с использованием масштабных коэффициентов декодирования диапазона нижних частот, введенных из блока 302 декодирования масштабных коэффициентов, и информации декодирования спектра высокого разрешения диапазона нижних частот, введенной из блока 303 декодирования спектра высокого разрешения. При этом информация декодирования спектра высокого разрешения диапазона нижних частот для части диапазона не принимается. Поэтому эта часть диапазона не подвергается обработке декодированием и считается нулевым спектром. В этом случае спектр соответствующего диапазона, выводимый через сумматоры A и B, является самим декодированным сигналом первого уровня (спектром).
На фиг.8 показана операция в случае, когда никакая информация декодирования спектра высокого разрешения диапазона нижних частот не принимается согласно фиг.7. Блок 801 декодирования спектра диапазона нижних частот принимает масштабные коэффициенты декодирования диапазона нижних частот, но вовсе не принимает информацию декодирования спектра высокого разрешения, и поэтому обработка декодированием не осуществляется.
На фиг.9 показана операция в случае, когда масштабные коэффициенты декодирования для диапазона нижних частот вовсе не поступают, согласно фиг.8. Однако в блоке 902 декодирования спектра диапазона верхних частот, когда часть масштабных коэффициентов декодирования (диапазон верхних частот) не вводится, спектр для этого диапазона выводится как нулевой.
Ниже, способ генерации спектра диапазона верхних частот в псевдорежиме описан со ссылкой на фиг.9 в порядке примера. Согласно фиг.9 блок 902 декодирования спектра в диапазоне верхних частот генерирует спектр диапазона верхних частот в псевдорежиме. На фиг.10 более подробно показана конфигурация блока 902 декодирования спектра диапазона верхних частот.
Блок 902 декодирования спектра диапазона верхних частот, показанный на фиг.10, включает в себя блок 1011 регулировки амплитуды, блок 1012 генерации псевдоспектра и блок 1013 масштабирования.
Блок регулировки амплитуды 1011 регулирует амплитуду декодированного спектра сигнала первого уровня, введенного из блока 302 преобразования частотной области, и выводит результат в блок 1012 генерации псевдоспектра.
Блок 1012 генерации псевдоспектра генерирует спектр диапазона верхних частот в псевдорежиме с использованием декодированного спектра сигнала первого уровня после регулировки амплитуды, введенной из блока 1011 регулировки амплитуды, и выводит результат в блок 1013 масштабирования.
Блок 1013 масштабирования масштабирует спектр, введенный из блока 1012 генерации псевдоспектра, и выводит результат на сумматор B.
На фиг.11 показана схема, демонстрирующая пример последовательности обработки генерации спектра диапазона верхних частот в псевдорежиме.
Сначала осуществляется регулировка амплитуды декодированного спектра сигнала первого уровня. Этот способ регулировки амплитуды представлять собой, например, постоянный множитель в логарифмической области (γ×S, где γ - коэффициент регулировки амплитуды (действительное число) в пределах 0≤γ≤1, и S - логарифмический спектр), или может представлять собой постоянный множитель (где Sγ, S - линейный спектр) в линейной области. Кроме того, можно также использовать коэффициенты, например коэффициенты, необходимые при добавлении глубины впадины гармоник, имеющей место в диапазоне нижних частот в вокализованной речи, и глубины впадины гармоник, имеющей место в диапазоне верхних частот, как регулировочные коэффициенты для регулировки амплитуды. Кроме того, регулировочные коэффициенты могут быть фиксированной постоянной, но также можно подготавливать совокупность подходящих регулировочных коэффициентов согласно индексу (например, непосредственно, значение дисперсии амплитуды спектра, имеющей место в диапазоне нижних частот, или опосредованно, значение коэффициента усиления основного тона, имеющего место в блоке 201 кодирования первого уровня), указывающую глубину ямы гармоник спектра диапазона нижних частот, и избирательно использовать соответствующие регулировочные коэффициенты согласно индексу. Кроме того, можно также избирательно использовать регулировочные коэффициенты согласно характеристикам для каждого гласного звука с использованием информации формы (огибающей) спектра диапазона нижних ч