Кодирующее устройство, декодирующее устройство и способ
Иллюстрации
Показать всеИзобретение относится к вычислительной технике. Технический результат заключается в повышении качества звука. Устройство кодирования речи содержит участок кодирования первого уровня, который выполняет обработку кодированием по отношению к входному речевому сигналу; участок декодирования первого уровня, который выполняет обработку декодированием с использованием кодированных данных первого уровня; участок вычисления ошибочных коэффициентов преобразования первого уровня, который преобразует ошибочный сигнал первого уровня в частотную область для вычисления ошибочных коэффициентов преобразования первого уровня; и участок кодирования второго уровня, который выполняет обработку кодированием по отношению к ошибочным коэффициентам преобразования первого уровня, причем участок кодирования второго уровня содержит: участок установки; участок выбора; участок конфигурирования соединенной полосы, который соединяет полосу, выбранную из низкочастотной полосы, и фиксированную полосу из высокочастотной полосы, чтобы конфигурировать соединенную полосу; и участок формирования кодированных данных, который кодирует ошибочные коэффициенты преобразования первого уровня, включенные в соединенную полосу, чтобы сформировать кодированные данные второго уровня. 4 н. и 4 з.п. ф-лы, 45 ил.
Реферат
Область техники
Настоящее изобретение относится к кодирующему устройству, декодирующему устройству и их способам, используемым в системе связи с масштабируемой схемой кодирования.
Предшествующий уровень техники
В системе мобильной связи требуется, чтобы речевые сигналы сжимались до низких скоростей передачи битов для передачи, чтобы эффективно использовать радиоволновые ресурсы, и так далее. С другой стороны, также требуется, чтобы реализовывалось повышение качества в телефонном разговоре и обслуживании вызова высокого качества, и чтобы удовлетворить эти требования, предпочтительно не только обеспечивать качественные речевые сигналы, но также кодировать другие качественные сигналы, отличные от речевых сигналов, например качественные звуковые сигналы более широких диапазонов.
Методика интеграции множества методик кодирования на уровнях является перспективной для этих двух противоречивых требований. Эта методика объединяет в уровни первый уровень для кодирования входных сигналов в виде, достаточном для речевых сигналов на низких скоростях передачи битов, и второй уровень для кодирования разностных сигналов между входными сигналами и декодированными сигналами первого уровня в виде, достаточном для отличных от речи сигналов. Методика выполнения многоуровневого кодирования, таким образом, обладает характеристиками обеспечения масштабируемости в потоках битов, полученных от кодирующего устройства, то есть получением декодированных сигналов из части информации потоков битов, и поэтому обычно называется "масштабируемым кодированием (многоуровневым кодированием)".
Схема масштабируемого кодирования может гибко поддерживать взаимодействие между сетями меняющихся скоростей передачи битов благодаря ее характеристикам, и следовательно, является подходящей для будущего сетевого окружения, где различные сети будут интегрированы с помощью IP-протокола.
Например, непатентный документ 1 раскрывает методику реализации масштабируемого кодирования с использованием методики, которая стандартизована группой MPEG-4 (Экспертная группа по движущимся изображениям, фаза 4). Эта методика использует кодирование CELP (линейное предсказание с кодовым возбуждением) в первом уровне, подходящее для речевых сигналов, и использует кодирование с преобразованием, например AAC (Перспективный звуковой кодер) и TwinVQ (Векторное квантование с трансформными доменами и взвешенным чередованием) во втором уровне по отношению к разностным сигналам, вычитая декодированные сигналы первого уровня из исходных сигналов.
В отличие от этого непатентный документ 2 раскрывает способ кодирующих коэффициентов MDCT в нужных полосах частот на уровнях, используя TwinVQ, которое применяется к модулю, в качестве основного компонента. С помощью разделения этого модуля для использования множество раз, можно реализовать простое масштабируемое кодирование с высокой степенью гибкости. Хотя этот способ основывается на конфигурации, где заранее определяются поддиапазоны, которые являются объектами для кодирования по каждому уровню, также раскрывается конфигурация, где положение поддиапазона, который является объектом для кодирования по каждому уровню, изменяется в пределах заранее установленных полос в соответствии со свойством входных сигналов.
Непатентный документ 1: "All about MPEG-4", написанный и отредактированный Сукейчи Мики (Sukeichi MIKI), первое издание, Kogyo Chosakai Publishing, Inc., 30 сентября 1998 г., страница 126-127.
Непатентный документ 2: "Scalable Audio Coding Based on Hierarchical Transform Coding Modules", Акио Джин (Akio JIN) и др., Академический журнал Института инженеров по электронике, информации и связи (IEICE), том J83-A, №3, страница 241-252, март 2000 г.
Непатентный документ 3: "AMR Wideband Speech Codec; Transcoding functions", 3GPP TS 26.190, март 2001 г.
Непатентный документ 4: "Source-Controlled-Variable-Rate Multimode Wideband Speech Codec (VMR-WB), Service options 62 and 63 for Spread Spectrum Systems", 3GPP2 C.S0052-A, апрель 2005 г.
Непатентный документ 5: "7/10/15 kHz band scalable speech coding schemes using the band enhancement technique by means of pitch filtering", Журнал Акустического сообщества Японии, 3-11-4, страница 327-328, март 2004 г.
Раскрытие изобретения
Проблемы, которые должны быть решены изобретением
Однако для повышения качества речи у выходных сигналов важно, как устанавливаются поддиапазоны (то есть целевые полосы частот) участка кодирования второго уровня. Способ, раскрытый в непатентном документе 2, заранее определяет поддиапазоны, которые являются объектом для кодирования посредством второго уровня (фиг.1А). В этом случае качество заранее установленных поддиапазонов всегда повышается, и поэтому имеется проблема в том, что когда составляющие ошибки сосредотачиваются в других полосах, чем эти поддиапазоны, невозможно достичь очень большого эффекта улучшения качества речи.
Более того, хотя непатентный документ 2 раскрывает, что положение поддиапазона, который является объектом для кодирования по каждому уровню, изменяется в пределах заранее установленных полос (фиг.1В) в соответствии со свойством входных сигналов, применяемое поддиапазоном положение ограничивается рамками заранее установленных полос, и поэтому не может быть решена описанная выше проблема. Если полоса, применяемая в качестве поддиапазона, охватывает всю полосу входного сигнала (фиг.1С), то имеется проблема в том, что увеличивается вычислительная сложность для указания положения поддиапазона. Кроме того, когда увеличивается количество уровней, положение поддиапазона нужно указывать на основе уровня, и поэтому эта проблема становится существенной.
Поэтому цель настоящего изобретения - предоставить кодирующее устройство, декодирующее устройство и их способы, в схеме масштабируемого кодирования, для точного указания полосы со значительной ошибкой из всей полосы с небольшой вычислительной сложностью.
Средство для решения проблемы
Кодирующее устройство в соответствии с настоящим изобретением применяет конфигурацию, которая включает в себя: участок кодирования первого уровня, который выполняет обработку кодированием по отношению к входным коэффициентам преобразования, чтобы сформировать кодированные данные первого уровня; участок декодирования первого уровня, который выполняет обработку декодированием с использованием кодированных данных первого уровня, чтобы сформировать декодированные коэффициенты преобразования первого уровня; и участок кодирования второго уровня, который выполняет обработку кодированием по отношению к целевой полосе частот, где обнаруживается максимальная ошибка в ошибочных коэффициентах преобразования первого уровня, представляющих ошибку между входными коэффициентами преобразования и декодированными коэффициентами преобразования первого уровня, чтобы сформировать кодированные данные второго уровня, и где участок кодирования второго уровня содержит: участок указания первого положения, который ищет первую полосу, имеющую максимальную ошибку по всей полосе, на основе более широкой полосы пропускания, чем целевая полоса частот, и заранее установленного первого размера шага, чтобы сформировать информацию о первом положении, показывающую указанную первую полосу; участок указания второго положения, который ищет целевую полосу частот по всей первой полосе, на основе меньшего второго размера шага, чем первый размер шага, чтобы сформировать информацию о втором положении, показывающую указанную целевую полосу частот; и участок кодирования, который кодирует ошибочные коэффициенты преобразования первого уровня, включенные в целевую полосу частот, указанную на основе информации о первом положении и информации о втором положении, чтобы сформировать кодированную информацию.
Декодирующее устройство в соответствии с настоящим изобретением применяет конфигурацию, которая включает в себя: участок приема, который принимает: кодированные данные первого уровня, полученные путем выполнения обработки кодированием по отношению к входным коэффициентам преобразования; кодированные данные второго уровня, полученные путем выполнения обработки кодированием по отношению к целевой полосе частот, где обнаруживается максимальная ошибка в ошибочных коэффициентах преобразования первого уровня, представляющих ошибку между входными коэффициентами преобразования и декодированными коэффициентами преобразования первого уровня, которые получаются путем декодирования кодированных данных первого уровня; информацию о первом положении, показывающую первую полосу, которая максимизирует ошибку, в более широкой полосе пропускания, чем целевая полоса частот; и информацию о втором положении, показывающую целевую полосу частот в первой полосе; участок декодирования первого уровня, который декодирует кодированные данные первого уровня, чтобы сформировать декодированные коэффициенты преобразования первого уровня; участок декодирования второго уровня, который указывает целевую полосу частот на основе информации о первом положении и информации о втором положении и декодирует кодированные данные второго уровня, чтобы сформировать декодированные ошибочные коэффициенты преобразования первого уровня; и участок сложения, который складывает декодированные коэффициенты преобразования первого уровня и декодированные ошибочные коэффициенты преобразования первого уровня, чтобы сформировать декодированные коэффициенты преобразования второго уровня.
Способ кодирования в соответствии с настоящим изобретением включает в себя: этап кодирования первого уровня, состоящий из выполнения обработки кодированием по отношению к входным коэффициентам преобразования, чтобы сформировать кодированные данные первого уровня; этап декодирования первого уровня, состоящий из выполнения обработки декодированием с использованием кодированных данных первого уровня, чтобы сформировать декодированные коэффициенты преобразования первого уровня; и этап кодирования второго уровня, состоящий из выполнения кодирования по отношению к целевой полосе частот, где обнаруживается максимальная ошибка в ошибочных коэффициентах преобразования первого уровня, представляющих ошибку между входными коэффициентами преобразования и декодированными коэффициентами преобразования первого уровня, чтобы сформировать кодированные данные второго уровня, где этап кодирования второго уровня включает: этап указания первого положения, состоящий из поиска первой полосы, имеющей максимальную ошибку по всей полосе, на основе более широкой полосы пропускания, чем целевая полоса частот, и заранее установленного первого размера шага, чтобы сформировать информацию о первом положении, показывающую указанную первую полосу; этап указания второго положения, состоящий из поиска целевой полосы частот по всей первой полосе, на основе меньшего второго размера шага, чем первый размер шага, чтобы сформировать информацию о втором положении, показывающую указанную целевую полосу частот; и этап кодирования, состоящий из кодирования ошибочных коэффициентов преобразования первого уровня, включенных в целевую полосу частот, указанную на основе информации о первом положении и информации о втором положении, чтобы сформировать кодированную информацию.
Способ декодирования в соответствии с настоящим изобретением включает в себя: этап приема, состоящий из приема: кодированных данных первого уровня, полученных путем выполнения обработки кодированием по отношению к входным коэффициентам преобразования; кодированных данных второго уровня, полученных путем выполнения обработки кодированием по отношению к целевой полосе частот, где обнаруживается максимальная ошибка в ошибочных коэффициентах преобразования первого уровня, представляющих ошибку между входными коэффициентами преобразования и декодированными коэффициентами преобразования первого уровня, которые получаются путем декодирования кодированных данных первого уровня; информации о первом положении, показывающей первую полосу, которая максимизирует ошибку, в более широкой полосе пропускания, чем целевая полоса частот; и информации о втором положении, показывающей целевую полосу частот в первой полосе; этап декодирования первого уровня, состоящий из декодирования кодированных данных первого уровня, чтобы сформировать декодированные коэффициенты преобразования первого уровня; этап декодирования второго уровня, состоящий из указания целевой полосы частот на основе информации о первом положении и информации о втором положении и декодирования кодированных данных второго уровня, чтобы сформировать декодированные ошибочные коэффициенты преобразования первого уровня; и этап сложения, состоящий из сложения декодированных коэффициентов преобразования первого уровня и декодированных ошибочных коэффициентов преобразования первого уровня, чтобы сформировать декодированные коэффициенты преобразования второго уровня.
Полезные результаты изобретения
В соответствии с настоящим изобретением, участок указания первого положения ищет полосу со значительной ошибкой по всей полосе входного сигнала, на основе относительно широких полос пропускания и относительно крупных размеров шага, чтобы указать полосу со значительной ошибкой, и участок указания второго положения ищет целевую полосу частот (то есть полосу частот, имеющую наибольшую ошибку) в полосе, указанной в участке указания первого положения, на основе относительно узких полос пропускания и относительно мелких размеров шага, чтобы указать полосу, имеющую наибольшую ошибку, так что можно указать полосу со значительной ошибкой из всей полосы с небольшой вычислительной сложностью и повысить качество звука.
Краткое описание чертежей
Фиг.1 показывает кодированную полосу в участке кодирования второго уровня в традиционном устройстве кодирования речи;
фиг.2 - блок-схема, показывающая основную конфигурацию кодирующего устройства в соответствии с Вариантом 1 осуществления настоящего изобретения;
фиг.3 - блок-схема, показывающая конфигурацию участка кодирования второго уровня, показанного на фиг.2;
фиг.4 показывает положение полосы, указанной в участке указания первого положения, показанном на фиг.3;
фиг.5 показывает другое положение полосы, указанной в участке указания первого положения, показанном на фиг.3;
фиг.6 показывает положение целевой полосы частот, указанной в участке указания второго положения, показанном на фиг.3;
фиг.7 - блок-схема, показывающая конфигурацию участка кодирования, показанного на фиг.3;
фиг.8 - блок-схема, показывающая основную конфигурацию декодирующего устройства в соответствии с Вариантом 1 осуществления настоящего изобретения;
фиг.9 показывает конфигурацию участка декодирования второго уровня, показанного на фиг.8;
фиг.10 показывает состояние декодированных ошибочных коэффициентов преобразования первого уровня, выведенных из участка размещения, показанного на фиг.9;
фиг.11 показывает положение целевой частоты, указанной в участке указания второго положения, показанном на фиг.3;
фиг.12 - блок-схема, показывающая другую особенность конфигурации участка кодирования, показанного на фиг.7;
фиг.13 - блок-схема, показывающая другую особенность конфигурации участка декодирования второго уровня, показанного на фиг.9;
фиг.14 - блок-схема, показывающая конфигурацию участка кодирования второго уровня в кодирующем устройстве в соответствии с Вариантом 3 осуществления настоящего изобретения;
фиг.15 показывает положение целевой частоты, указанной в множестве участков указания субположения в кодирующем устройстве в соответствии с Вариантом 3 осуществления;
фиг.16 - блок-схема, показывающая конфигурацию участка кодирования второго уровня в кодирующем устройстве в соответствии с Вариантом 4 осуществления настоящего изобретения;
фиг.17 - блок-схема, показывающая конфигурацию участка кодирования, показанного на фиг.16;
фиг.18 показывает участок кодирования в случае, когда кандидаты в информацию о втором положении, сохраненные в кодовой книге информации о втором положении на фиг.17, имеют три целевые частоты;
фиг.19 - блок-схема, показывающая другую конфигурацию участка кодирования, показанного на фиг.16;
фиг.20 - блок-схема, показывающая конфигурацию участка кодирования второго уровня в соответствии с Вариантом 5 осуществления настоящего изобретения;
фиг.21 показывает положение полосы, указанной в участке указания первого положения, показанном на фиг.20;
фиг.22 - блок-схема, показывающая основную конфигурацию кодирующего устройства в соответствии с Вариантом 6 осуществления;
фиг.23 - блок-схема, показывающая конфигурацию участка кодирования первого уровня в кодирующем устройстве, показанном на фиг.22;
фиг.24 - блок-схема, показывающая конфигурацию участка декодирования первого уровня в кодирующем устройстве, показанном на фиг.22;
фиг.25 - блок-схема, показывающая основную конфигурацию декодирующего устройства, поддерживающего кодирующее устройство, показанное на фиг.22;
фиг.26 - блок-схема, показывающая основную конфигурацию кодирующего устройства в соответствии с Вариантом 7 осуществления;
фиг.27 - блок-схема, показывающая основную конфигурацию декодирующего устройства, поддерживающего кодирующее устройство, показанное на фиг.26;
фиг.28 - блок-схема, показывающая другую особенность основной конфигурации кодирующего устройства в соответствии с Вариантом 7 осуществления;
фиг.29А показывает положения полос в участке кодирования второго уровня, показанном на фиг.28;
фиг.29В показывает положения полос в участке кодирования третьего уровня, показанном на фиг.28;
фиг.29С показывает положения полос в участке кодирования четвертого уровня, показанном на фиг.28;
фиг.30 - блок-схема, показывающая основную конфигурацию декодирующего устройства, поддерживающего кодирующее устройство, показанное на фиг.28;
фиг.31А показывает другие положения полос в участке кодирования второго уровня, показанном на фиг.28;
фиг.31В показывает другие положения полос в участке кодирования третьего уровня, показанном на фиг.28;
фиг.31С показывает другие положения полос в участке кодирования четвертого уровня, показанном на фиг.28;
фиг.32 иллюстрирует работу участка указания первого положения в соответствии с Вариантом 8 осуществления;
фиг.33 - блок-схема, показывающая конфигурацию участка указания первого положения в соответствии с Вариантом 8 осуществления;
фиг.34 иллюстрирует, как информация о первом положении формируется в участке формирования информации о первом положении в соответствии с Вариантом 8 осуществления;
фиг.35 иллюстрирует декодирование в соответствии с Вариантом 8 осуществления;
фиг.36 иллюстрирует разновидность Варианта 8 осуществления; и
фиг.37 иллюстрирует разновидность Варианта 8 осуществления.
Лучший вариант осуществления изобретения
Варианты осуществления настоящего изобретения будут объясняться подробно ниже со ссылкой на прилагаемые чертежи.
(Вариант 1 осуществления)
Фиг.2 - блок-схема, показывающая основную конфигурацию кодирующего устройства в соответствии с Вариантом 1 осуществления настоящего изобретения. Кодирующее устройство 100, показанное на фиг.2, имеет участок 101 преобразования в частотную область, участок 102 кодирования первого уровня, участок 103 декодирования первого уровня, участок 104 вычитания, участок 105 кодирования второго уровня и участок 106 мультиплексирования.
Участок 101 преобразования в частотную область преобразует входной сигнал временной области в сигнал частотной области (то есть входные коэффициенты преобразования) и выводит входные коэффициенты преобразования в участок 102 кодирования первого уровня.
Участок 102 кодирования первого уровня выполняет кодирование по отношению к входным коэффициентам преобразования, чтобы сформировать кодированные данные первого уровня, и выводит эти кодированные данные первого уровня в участок 103 декодирования первого уровня и участок 106 мультиплексирования.
Участок 103 декодирования первого уровня выполняет обработку декодированием с использованием кодированных данных первого уровня, чтобы сформировать декодированные коэффициенты преобразования первого уровня, и выводит декодированные коэффициенты преобразования первого уровня в участок 104 вычитания.
Участок 104 вычитания вычитает декодированные коэффициенты преобразования первого уровня, сформированные в участке 103 декодирования первого уровня, из входных коэффициентов преобразования, чтобы сформировать ошибочные коэффициенты преобразования первого уровня, и выводит эти ошибочные коэффициенты преобразования первого уровня в участок 105 кодирования второго уровня.
Участок 105 кодирования второго уровня выполняет обработку кодированием ошибочных коэффициентов преобразования первого уровня, выведенных из участка 104 вычитания, чтобы сформировать кодированные данные второго уровня, и выводит эти кодированные данные второго уровня в участок 106 мультиплексирования.
Участок 106 мультиплексирования мультиплексирует кодированные данные первого уровня, полученные на участке 102 кодирования первого уровня, и кодированные данные второго уровня, полученные на участке 105 кодирования второго уровня, чтобы создать поток битов, и выводит этот поток битов в качестве итоговых кодированных данных в канал передачи.
Фиг.3 - блок-схема, показывающая конфигурацию участка 105 кодирования второго уровня, показанного на фиг.2. Участок 105 кодирования второго уровня, показанный на фиг.3, имеет участок 201 указания первого положения, участок 202 указания второго положения, участок 203 кодирования и участок 204 мультиплексирования.
Участок 201 указания первого положения использует ошибочные коэффициенты преобразования первого уровня, принятые от участка 104 вычитания, для поиска полосы, применяемой в качестве целевой полосы частот, которая является объектом для кодирования, на основе заранее установленных полос пропускания и заранее установленных размеров шага, и выводит информацию, показывающую указанную полосу, в качестве информации о первом положении в участок 202 указания второго положения, участок 203 кодирования и участок 204 мультиплексирования. Между тем, участок 201 указания первого положения будет подробно описываться позднее. Более того, эта указанная полоса может называться "диапазоном" или "областью".
Участок 202 указания второго положения ищет целевую полосу частот в полосе, указанной в участке 201 указания первого положения, на основе более узких полос пропускания, чем полосы пропускания, используемые в участке 201 указания первого положения, и меньших размеров шага, чем размеры шага, используемые в участке 201 указания первого положения, и выводит информацию, показывающую указанную целевую полосу частот, в качестве информации о втором положении в участок 203 кодирования и участок 204 мультиплексирования. Между тем участок 202 указания второго положения будет подробно описываться позднее.
Участок 203 кодирования кодирует ошибочные коэффициенты преобразования первого уровня, включенные в целевую полосу частот, указанную на основе информации о первом положении и информации о втором положении, чтобы сформировать кодированную информацию, и выводит кодированную информацию в участок 204 мультиплексирования. Между тем участок 203 кодирования будет подробно описываться позднее.
Участок 204 мультиплексирования мультиплексирует информацию о первом положении, информацию о втором положении и кодированную информацию, чтобы сформировать вторые кодированные данные, и выводит эти вторые кодированные данные. Более того, этот участок 204 мультиплексирования не является обязательным, и эти элементы информации могут выводиться непосредственно в участок 106 мультиплексирования, показанный на фиг.2.
Фиг.4 показывает полосу, указанную в участке 201 указания первого положения, показанном на фиг.3.
На фиг.4 участок 201 указания первого положения указывает одну из трех полос, установленных на основе заранее установленных полос пропускания, и выводит информацию о положении этой полосы в качестве информации о первом положении в участок 202 указания второго положения, участок 203 кодирования и участок 204 мультиплексирования. Каждая полоса, показанная на фиг.4, конфигурируется имеющей полосу пропускания, равную или шире целевой полосы частот (полоса 1 равна или выше F1 и ниже F3, полоса 2 равна или выше F2 и ниже F4, и полоса 3 равна или выше F3 и ниже F5). Более того, хотя с данным вариантом осуществления каждая полоса конфигурируется имеющей одинаковую полосу пропускания, каждая полоса может конфигурироваться имеющей разную полосу пропускания. Например, как критическая полоса пропускания восприятия человека, полосы пропускания у полос, помещенных в диапазон низких частот, могут быть установлены узкими, и полосы пропускания у полос, помещенных в диапазон высоких частот, могут быть установлены широкими.
Далее будет объясняться способ указания полосы в участке 201 указания первого положения. Здесь участок 201 указания первого положения указывает полосу на основе величины энергии у ошибочных коэффициентов преобразования первого уровня. Ошибочные коэффициенты преобразования первого уровня представляются в виде e1(k), и энергия ER(i) ошибочных коэффициентов преобразования первого уровня, включенных в каждую полосу, вычисляется в соответствии со следующим уравнением 1.
[1]
(Уравнение 1) |
Здесь i - идентификатор, который указывает полосу, FRL(i) - наименьшая частота полосы i, и FRH(i) - наибольшая частота полосы i.
Таким образом, указывается полоса с большей энергией ошибочных коэффициентов преобразования первого уровня, и кодируются ошибочные коэффициенты преобразования первого уровня, включенные в полосу со значительной ошибкой, так что возможно уменьшить ошибки между декодированными сигналами и входными сигналами и повысить качество речи.
Между тем нормализованная энергия NER(i), нормализованная на основе полосы пропускания, как в следующем уравнении 2, может вычисляться вместо энергии ошибочных коэффициентов преобразования первого уровня.
[2]
(Уравнение 2) |
Дополнительно в качестве базиса для указания полосы, вместо энергии ошибочных коэффициентов преобразования первого уровня может быть найдена энергия WER(i) и WNER(i) ошибочных коэффициентов преобразования первого уровня (нормализованная энергия, которая нормализуется на основе полосы пропускания), к которой применяется вес, учитывая характеристики восприятия человека, в соответствии с уравнениями 3 и 4. Здесь w(k) представляет вес, относящийся к характеристикам восприятия человека.
[3]
(Уравнение 3) |
[4]
(Уравнение 4) |
В этом случае участок 201 указания первого положения увеличивает вес для частоты с высокой важностью в характеристиках восприятия, так что скорее всего будет выбрана включающая эту частоту полоса, и уменьшает вес для частоты с низкой важностью, так что включающая эту частоту полоса вряд ли будет выбрана. Таким образом, предпочтительно выбирается важная для восприятия полоса, так что возможно обеспечить аналогичное преимущество повышения качества звука, как описано выше. Вес может вычисляться и использоваться с использованием, например, характеристик громкости человеческого восприятия или порога маскирующего эффекта восприятия, вычисленных на основе входного сигнала или декодированного сигнала первого уровня.
Более того, способ выбора полосы может выбирать полосу из полос, размещенных в диапазоне низких частот, имеющую более низкую частоту, чем опорная частота (Fx), которая устанавливается заранее. С примером из фиг.5 полоса выбирается с полосы 1 по полосу 8. Причина для указания ограничения (то есть опорной частоты) при выборе полосы выглядит следующим образом. Со структурой гармоники или структурой гармоник, которая является одной характеристикой речевого сигнала (то есть структурой, в которой возникают всплески в спектре на указанных интервалах частот), более крупные всплески появляются в диапазоне низких частот, чем в диапазоне высоких частот, и всплески появляются резче в диапазоне низких частот, чем в диапазоне высоких частот, аналогично ошибке квантования (то есть ошибочному спектру или ошибочным коэффициентам преобразования), созданной в кодировании. Поэтому, даже когда энергия ошибочного спектра (то есть ошибочных коэффициентов преобразования) в диапазоне низких частот ниже, чем в диапазоне высоких частот, всплески в ошибочном спектре (то есть ошибочные коэффициенты преобразования) в диапазоне низких частот появляются резче, чем в диапазоне высоких частот, и поэтому ошибочный спектр (то есть ошибочные коэффициенты преобразования) в диапазоне низких частот, вероятно, превышает порог маскирующего эффекта восприятия (то есть порог, при котором люди могут воспринимать звук), вызывая ухудшение воспринимаемого качества звука.
Этот способ заранее устанавливает опорную частоту, чтобы определить целевую частоту из диапазона низких частот, в которой всплески коэффициентов ошибки (или векторов ошибки) появляются резче, чем в диапазоне высоких частот, имеющую более высокую частоту, чем опорная частота (Fx), так что возможно подавить всплески ошибочных коэффициентов преобразования и повысить качество звука.
Дополнительно, с помощью способа выбора полосы может выбираться полоса из полос, размещенных в нижней и средней полосе частот. С примером на фиг.4 полоса 3 исключается из кандидатов на отбор, и полоса выбирается из полосы 1 и полосы 2. Таким образом, целевая полоса частот определяется из нижней и средней полосы частот.
В дальнейшем, в качестве информации о первом положении участок 201 указания первого положения выводит "1", когда указывается полоса 1, "2", когда указывается полоса 2, и "3", когда указывается полоса 3.
Фиг.6 показывает положение целевой полосы частот, указанной в участке 202 указания второго положения, показанном на фиг.3.
Участок 202 указания второго положения указывает целевую полосу частот в полосе, указанной в участке 201 указания первого положения, на основе меньших размеров шага, и выводит информацию о положении целевой полосы частот в качестве информации о втором положении в участок 203 кодирования и участок 204 мультиплексирования.
Далее будет объясняться способ указания целевой полосы частот в участке 202 указания второго положения. Здесь, ссылаясь на пример, где информация о первом положении, выведенная из участка 201 указания первого положения, показанного на фиг.3, равна "2", ширина целевой полосы частот изображается как "BW". Более того, наименьшая частота F2 в полосе 2 устанавливается в качестве исходного положения, и эта наименьшая частота F2 представляется как G1 для простоты объяснения. Тогда наименьшие частоты в целевой полосе частот, которая может быть указана в участке 202 указания второго положения, устанавливаются от G2 до GN. Более того, размеры шага целевых полос частот, которые задаются в участке 202 указания второго положения, равны Gn-Gn-1, а размеры шага полос, которые задаются в участке 201 указания первого положения, равны Fn-Fn-1(Gn-Gn-1<Fn-Fn-1).
Участок 202 указания второго положения указывает целевую полосу частот из кандидатов на целевую частоту, имеющих наименьшие частоты от G1 до GN, на основе энергии ошибочных коэффициентов преобразования первого уровня или на основе аналогичного базиса. Например, участок 202 указания второго положения вычисляет энергию ошибочных коэффициентов преобразования первого уровня в соответствии с уравнением 5 для всех из Gn кандидатов на целевую частоту, указывает целевую полосу частот, где вычисляется наибольшая энергия ER(n), и выводит информацию о положении этой целевой частоты в качестве информации о втором положении.
[5]
(Уравнение 5) |
Более того, когда энергия WER(n) ошибочных коэффициентов преобразования первого уровня, к которой применяется вес, учитывая характеристики восприятия человека, как объяснялось выше, используется в качестве базиса, WER(n) вычисляется в соответствии со следующим уравнением 6. Здесь w(k) представляет вес, относящийся к характеристикам восприятия человека. Вес может вычисляться и использоваться с использованием, например, характеристик громкости человеческого восприятия или порога маскирующего эффекта восприятия, вычисленных на основе входного сигнала или декодированного сигнала первого уровня.
[6]
(Уравнение 6) |
В этом случае участок 202 указания второго положения увеличивает вес для частоты с высокой важностью в характеристиках восприятия, так что скорее всего будет выбрана включающая эту частоту целевая полоса частот, и уменьшает вес для частоты с низкой важностью, так что включающая эту частоту целевая полоса частот вряд ли будет выбрана. Таким образом, предпочтительно выбирается важная для восприятия целевая полоса частот, так что возможно дополнительно повысить качество звука.
Фиг.7 - блок-схема, показывающая конфигурацию участка 203 кодирования, показанного на фиг.3. Участок 203 кодирования, показанный на фиг.7, имеет участок 301 формирования целевого сигнала, участок 302 вычисления ошибки, участок 303 поиска, кодовую книгу 304 формы и кодовую книгу 305 усиления.
Участок 301 формирования целевого сигнала использует информацию о первом положении, принятую от участка 201 указания первого положения, и информацию о втором положении, принятую от участка 202 указания второго положения, чтобы указать целевую полосу частот, извлекает включенную в целевую полосу частот часть на основе ошибочных коэффициентов преобразования первого уровня, принятых от участка 104 вычитания, и выводит извлеченные ошибочные коэффициенты преобразования первого уровня в качестве целевого сигнала в участок 302 вычисления ошибки. Эти первые ошибочные коэффициенты преобразования изображены в виде e1(k).
Участок 302 вычисления ошибки вычисляет ошибку E в соответствии со следующим уравнением 7 на основе: i-го кандидата по форме, принятого из кодовой книги 304 формы, которая хранит кандидаты (кандидаты по форме), которые представляют форму ошибочных коэффициентов преобразования; m-того кандидата по усилению, принятого из кодовой книги 305 усиления, которая хранит кандидаты (кандидаты по усилению), которые представляют усиление ошибочных коэффициентов преобразования; и целевого сигнала, принятого из участка 301 формирования целевого сигнала, и выводит вычисленную ошибку E в участок 303 поиска.
[7]
(Уравнение 7) |
Здесь sh(i,k) представляет i-й кандидат по форме, а ga(m) представляет m-й кандидат по усилению.
Участок 303 поиска ищет сочетание кандидата по форме и кандидата по усилению, которое минимизирует ошибку E, на основе ошибки E, вычисленной в участке 302 вычисления ошибки, и выводит информацию о форме и информацию об усилении результата поиска в виде кодированной информации в участок 204 мультиплексирования, показанный на фиг.3. Здесь информация о форме является параметром m, который минимизирует ошибку E, и информация об усилении является параметром i, который минимизирует ошибку E.
Более того, участок 302 вычисления ошибки может вычислить ошибку E в соответствии со следующим уравнением 8 путем применения большого веса к важному для восприятия спектру и путем увеличения влияния важного для восприятия спектра. Здесь w(k) представляет вес, относящийся к характеристикам восприятия человека.
[8]