Устройство декодирования, устройство кодирования, способ декодирования и способ кодирования

Иллюстрации

Показать все

Изобретение относится к средствам для кодирования и декодирования аудиосигналов. Технический результат заключается в повышении качества кодированного аудиосигнала. Разделяют первые кодированные данные, где был закодирован спектр, включающий в себя спектр нижнего диапазона аудиосигналов, и вторые кодированные данные, где был закодирован спектр верхнего диапазона, на основании первых кодированных данных. Декодируют первые кодированные данные и генерируют первый декодированный спектр. Разделяют амплитуду первого декодированного спектра на множество поддиапазонов, нормализуют спектр каждого поддиапазона наибольшим значением амплитуды первого декодированного спектра в пределах каждого поддиапазона и генерируют нормализованный спектр. Добавляют шумовой спектр к нормализованному спектру и генерируют нормализованный спектр с добавленным шумом. Декодируют вторые кодированные данные с использованием нормализованного спектра с добавленным шумом и генерируют второй спектр с добавленным шумом. 4 н. и 18 з.п. ф-лы, 19 ил.

Реферат

ОБЛАСТЬ ТЕХНИКИ

[0001] Настоящее изобретение относится к декодированию и кодированию аудиосигналов, чтобы снизить музыкальный шум в аудиосигналах и сигналах музыки (далее упоминаются как аудиосигналы и т.д.)

ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ

[0002] Технология кодирования музыки, которая сжимает аудиосигналы с низкой битовой скоростью, является важной технологией в эффективном использовании радиоволн и т.п. в мобильной связи. Кроме того, в последние годы существует возрастающая потребность в повышенном качестве аудио в телефонном вызове, и желательной является служба вызовов, которая дает ощущение реальности. Это может быть реализовано путем кодирования аудиосигналов и т.п. широкого частотного диапазона с высокой битовой скоростью. Однако этот подход вступает в противоречие с эффективным использованием радиоволн и частотных диапазонов.

[0003] Что касается способа кодирования сигналов широкого частотного диапазона с высоким качеством при низкой битовой скорости, существует технология, где спектр входных сигналов делится на два спектра, сегмент нижнего диапазона и сегмент верхнего диапазона, причем сегмент верхнего диапазона замещается дубликатом сегмента нижнего диапазона. То есть, общая битовая скорость сокращается путем замены сегмента верхнего диапазона на сегмент нижнего диапазона (публикация японской не прошедшей экспертизу патентной заявки (перевод PCT-заявки) № 2001-521648).

[0004] На основе этой технологии существует технология, которая, в свете того факта, что спектр верхнего диапазона имеет меньшее отклонение, чем спектр нижнего диапазона, спектр нижнего диапазона нормализуется (сглаживается) для каждого поддиапазона, после чего получают корреляцию со спектром верхнего диапазона. Соответственно, можно предотвратить ухудшение качества звука посредством копирования спектра нижнего диапазона, который имеет высокие пики. Однако эта технология имеет недостаток, заключающийся в том, что поскольку спектр нижнего диапазона выражается как поток дискретных импульсов, огибающая входных сигналов в способе, оценивающем огибающую потока дискретных импульсов, полностью отличается от первоначальной огибающей. Соответственно, вместо этого способа нормализации был предложен способ, в котором нормализация выполняется с максимальным значением амплитуды дискретных импульсов, в каждом поддиапазоне (международная публикация № 2013/035257).

[0005] На фиг. 11 показано устройство кодирования в соответствии с международной публикацией № 2013/035257. В этом устройстве кодирования, входные сигналы преобразуются в сигналы частотной области посредством время-частотного преобразователя 1010 и выводятся в качестве спектра входного сигнала, и область нижних частот спектра входного сигнала кодируется в основном блоке 1020 кодирования и выводится как основные кодированные данные. Основные кодированные данные затем декодируются, и генерируется основной кодированный спектр нижних частот, который нормализуется максимальным значением амплитуды в блоке 1030 нормализации амплитуды поддиапазона, и генерируется нормализованный спектр нижнего диапазона. Получают полосу сегмента верхнего диапазона, где значение корреляции в отношении нормализованного спектра нижнего диапазона является наибольшим, и усиление между нормализованным спектром нижнего диапазона в этой полосе и сегментом верхнего диапазона входного спектра, и они кодируются в блоке 1060 кодирования расширенного диапазона и выводятся как кодированные данные расширенного диапазона.

[0006] Фиг. 12 иллюстрирует устройство декодирования, соответствующее этому. Кодированные данные разделяются на основные кодированные данные и кодированные данные расширенного диапазона в блоке 2010 разделения, основные кодированные данные декодируются в основном блоке 2020 декодирования, и генерируется основной кодированный спектр нижнего диапазона. Основной кодированный спектр нижнего диапазона подвергается той же самой обработке, что и на стороне устройства кодирования, что включает нормализацию наибольшим значением амплитуды выборки, генерируя при этом нормализованные данные спектра нижнего диапазона. Нормализованные данные спектра нижнего диапазона затем используются для декодирования кодированных данных расширенного диапазона посредством блока 2040 декодирования расширенного диапазона, генерируя при этом спектр расширенного диапазона.

[0007] Также раскрыта технология, где выполняется переключение между блоком 1030 нормализации амплитуды поддиапазона, который выполняет нормализацию наибольшим значением выборки, и блоком 7020 нормализации огибающей спектра, который нормализует огибающую спектральной мощности выборки, в соответствии с интенсивностью пиков, как иллюстрируется на фиг. 13.

[0008] Технология нормализации наибольшим значением выборки, описанная в международной публикации № 2013/035257, является эффективной в случае, где спектр нижнего диапазона разреженный, т.е., в случае, где амплитудное значение только части выборок велико, а амплитудное значение других выборок является почти нулевым. То есть, технология в соответствии с международной публикацией № 2013/035257 подавляет генерацию спектров с экстремально большой амплитудой даже для разреженных спектров (гомогенизация) и может сформировать нормализованные спектры нижнего диапазона с плоскими характеристиками (сглаживание).

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

[0009] Однако спектральные провалы легко возникают, когда поток импульсов является разреженным, и такие спектральные провалы вызывают шум, который называется музыкальным шумом. Международная публикация № 2013/035257 не раскрывает каких-либо мер, которые принимались бы против музыкального шума вследствие спектральных провалов при нормализации спектра нижнего диапазона наибольшей амплитудой выборки.

[0010] Один неограничительный и примерный вариант осуществления обеспечивает устройство декодирования и устройство кодирования, способные декодировать высококачественные аудиосигналы и т.д. с подавленным музыкальным шумом, при сокращении общей битовой скорости.

[0011] В одном общем аспекте, технологии, раскрытые в настоящем документе, характеризуют устройство декодирования, включающее в себя:

блок разделения, который разделяет первые кодированные данные, где был закодирован спектр, включающий в себя спектр нижнего диапазона аудиосигналов, и вторые кодированные данные, где был закодирован спектр верхнего диапазона более высокого диапазона, чем спектр нижнего диапазона, на основании первых кодированных данных;

первый блок декодирования, который декодирует первые кодированные данные и генерирует первый декодированный спектр;

первый нормализатор амплитуды, который делит амплитуду первого декодированного спектра на множество поддиапазонов, нормализует спектр каждого поддиапазона наибольшим значением амплитуды первого декодированного спектра в пределах каждого поддиапазона и генерирует нормализованный спектр;

блок суммирования, который добавляет шумовой спектр к нормализованному спектру и генерирует нормализованный спектр с добавленным шумом;

второй блок декодирования, который декодирует вторые кодированные данные, используя нормализованный спектр с добавленным шумом, и генерирует второй спектр с добавленным шумом; и

преобразователь, который выполняет время-частотное преобразование в отношении спектра, связанного на основе первого декодированного спектра и второго спектра с добавленным шумом.

[0012] В соответствии с устройством декодирования согласно варианту осуществления настоящего раскрытия, высококачественные аудиосигналы и т.д. могут быть декодированы с подавленным музыкальным шумом.

[0013] Следует отметить, что общие или конкретные варианты осуществления могут быть реализованы как система, способ, интегральная схема, компьютерная программа, носитель хранения данных или любая отдельная их комбинация.

[0014] Дополнительные выгоды и преимущества раскрытых вариантов осуществления будут понятны из описания и чертежей. Выгоды и/или преимущества могут быть индивидуально получены посредством различных вариантов осуществления и признаков из описания и чертежей, которые не требуется все предоставлять, чтобы получать одно или более из таких выгод и/или преимуществ.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0015] Фиг. 1 является схемой конфигурации устройства декодирования в соответствии с первым вариантом осуществления настоящего раскрытия.

Фиг. 2 является схемой конфигурации устройства декодирования в соответствии с вторым вариантом осуществления настоящего раскрытия.

Фиг. 3 является схемой конфигурации другого устройства декодирования в соответствии с вторым вариантом осуществления настоящего раскрытия.

Фиг. 4 является схемой конфигурации устройства декодирования в соответствии с третьим вариантом осуществления настоящего раскрытия.

Фиг. 5 является пояснительной схемой блока генерации шума в соответствии с третьим вариантом осуществления настоящего раскрытия.

Фиг. 6 является схемой конфигурации устройства декодирования в соответствии с четвертым вариантом осуществления настоящего раскрытия.

Фиг. 7 является пояснительной схемой блока корректировки амплитуды в соответствии с четвертым вариантом осуществления настоящего раскрытия.

Фиг. 8 является схемой конфигурации другого устройства декодирования в соответствии с четвертым вариантом осуществления настоящего раскрытия.

Фиг. 9 является пояснительной схемой, иллюстрирующей операции блока повторной корректировки амплитуды другого устройства декодирования в соответствии с четвертым вариантом осуществления настоящего раскрытия.

Фиг. 10 является схемой конфигурации устройства декодирования в соответствии с пятым вариантом осуществления настоящего раскрытия.

Фиг. 11 является схемой конфигурации устройства кодирования в соответствии с уровнем техники.

Фиг. 12 является схемой конфигурации устройства декодирования в соответствии с уровнем техники.

Фиг. 13 является схемой конфигурации устройства кодирования в соответствии уровнем техники.

Фиг. 14 является схемой конфигурации устройства декодирования в соответствии с шестым вариантом осуществления настоящего раскрытия.

Фиг. 15А и 15В являются пояснительными диаграммами, иллюстрирующими операции блока корректировки основной декодированной спектральной амплитуды в соответствии с шестым вариантом осуществления настоящего раскрытия.

Фиг. 16 является схемой конфигурации устройства декодирования в соответствии с первым другим примером шестого варианта осуществления настоящего раскрытия.

Фиг. 17 является схемой конфигурации устройства декодирования в соответствии с вторым другим примером шестого варианта осуществления настоящего раскрытия.

Фиг. 18 является схемой конфигурации устройства декодирования в соответствии с седьмым вариантом осуществления настоящего раскрытия.

Фиг. 19 является схемой конфигурации блока повторной коррекции амплитуды устройства декодирования в соответствии с седьмым вариантом осуществления настоящего раскрытия.

ПОДРОБНОЕ ОПИСАНИЕ

[0016] Конфигурации и операции вариантов осуществления настоящего раскрытия будут описаны ниже со ссылками на чертежи. Отметим, что выходные сигналы с устройств декодирования и входные сигналы на устройства кодирования в настоящем раскрытии охватывают, в дополнение к случаям аудиосигналов в узком смысле, также случаи сигналов музыки, имеющих более широкую ширину полосы, и другие случаи, где они существуют совместно.

[0017] Отметим, что в настоящей спецификации термин ʺвходные сигналыʺ является понятием, которое охватывает не только аудиосигналы, но и сигналы музыки, имеющие более широкую ширину полосы, чем аудиосигналы, и сигналы, где аудиосигналы и сигналы музыки существуют совместно.

[0018] ʺШумовой спектрʺ является спектром, где амплитуда флуктуирует нерегулярным образом. Если цикл регулярный, но является достаточно длинным, чтобы рассматриваться, по существу, как нерегулярный, это рассматривается как подлежащее включению в нерегулярный случай.

[0019] ʺГенерацияʺ шумового спектра включает в себя обеспечение создания шумового спектра, а также включает в себя вывод шумового спектра, ранее сохраненного в устройстве памяти или т.п.

[0020] По отношению к ʺсвязываниюʺ и ʺвремя-частотному преобразованиюʺ, то, которое является первым по времени, является опциональным и может происходить одновременно, как само собой разумеется. Достаточно, чтобы ʺсвязываниеʺ и ʺвремя-частотное преобразованиеʺ в результате выполнялись.

[0021] ʺИнформация распределения битовʺ означает информацию, представляющую число битов, выделенных предварительно определенному диапазону основного декодированного спектра.

[0022] ʺИнформация разреженияʺ является информацией, представляющей состояние распределения нулевых спектров или ненулевых спектров в основном декодированном спектре и, например, является информацией, которая прямо или косвенно указывает долю ненулевых спектров или нулевых спектров относительно полных спектров, предварительно определенный диапазон основного декодированного спектра.

[0023] ʺКорреляцияʺ представляет сходство двух спектров. Это также включает в себя случаи, в которых сходство количественно оценивается с использованием коэффициента корреляции.

[0024] ʺУстройство терминалаʺ является устройством, которое использует пользовательская сторона, примерами которого являются сотовые телефоны, смартфоны, устройства караоке, персональные компьютеры, телевизионные приставки, цифровые диктофоны и т.д.

[0025] ʺУстройство базовой станцииʺ является устройством, которое прямо или опосредованно передает сигналы на устройство терминала или прямо или опосредованно принимает сигналы от устройства терминала. Примеры включают в себя eNode B, различные типы серверов, точки доступа и т.д.

[0026] ʺНенулевой компонентʺ (или ненулевой контент) является компонентом (или контентом), в котором импульс предполагается существующим. Импульсы, которые равны или меньше, чем предварительно определенная интенсивность, при которой импульсы не предполагаются существующими, являются нулевым компонентом (или нулевым контентом), а не ненулевым компонентом. То есть, не все импульсы, содержащиеся в первоначальном нормализованном спектре, обязательно являются ненулевыми компонентами.

Первый вариант осуществления

[0027] Фиг. 1 является блок-схемой, иллюстрирующей конфигурацию устройства декодирования в соответствии с первым вариантом осуществления. Устройство 100 декодирования, иллюстрируемое на фиг. 1, включает в себя блок 101 разделения, основной блок 102 декодирования (первый блок декодирования), блок 103 нормализации амплитуды, блок 104 генерации шума, первый блок 105 суммирования, блок 196 декодирования расширенного диапазона (второй блоку декодирования) и время-частотный преобразователь 107. Антенна A соединена с блоком 101 разделения.

[0028] Антенна A принимает основные кодированные данные и кодированные данные расширенного диапазона. Основные кодированные данные (первые кодированные данные) являются кодированными данными, полученными путем кодирования спектра нижнего диапазона предварительно определенной частоты или ниже во входных сигналах посредством устройства кодирования. Кодированные данные расширенного диапазона являются кодированными данными, полученными путем кодирования спектра верхнего диапазона предварительно определенной частоты или выше во входных сигналах. Кодированные данные расширенного диапазона (вторые кодированные данные) закодированы на основании основного кодированного спектра нижнего диапазона (первого кодированного спектра), полученного путем декодирования основных кодированных данных спектра верхнего диапазона предварительно определенной частоты во входных сигналах.

[0029] Конкретным примером является информация запаздывания (лага), которая является информацией, указывающей конкретный диапазон, где корреляция между спектром верхнего диапазона и основным кодированным спектром нижнего диапазона является наибольшей, и усиление между спектром верхнего диапазона и основным кодированным спектром нижнего диапазона в конкретном диапазоне. Это кодирование будет описано посредством конкретного примера в пятом варианте осуществления. Отметим, что кодированные данные диапазона амплитуд, вводимые в устройство декодирования в соответствии с настоящим вариантом осуществления, не ограничены данным конкретным примером.

[0030] Блок 101 разделения разделяет введенные основные кодированные данные и кодированные данные расширенного диапазона. Блок 101 разделения выводит основные кодированные данные на основной блок 102 декодирования, а кодированные данные расширенного диапазона - на блок 106 декодирования расширенного диапазона.

[0031] Основной блок 102 декодирования декодирует основные кодированные данные и генерирует основной декодированный спектр (первый декодированный спектр). Основной блок 102 декодирования выводит основной декодированный спектр на блок 103 нормализации амплитуды и время-частотный преобразователь 107.

[0032] Блок 103 нормализации амплитуды (первый блок нормализации амплитуды) нормализует основной декодированный спектр и генерирует нормализованный спектр. Более конкретно, блок 103 нормализации амплитуды делит основной декодированный спектр на множество поддиапазонов и нормализует спектр каждого поддиапазона наибольшим значением амплитуды (абсолютным значением) спектра, включенного в каждый поддиапазон. Таким образом, наибольшее значение спектра в каждом поддиапазоне после нормализации унифицируется среди поддиапазонов. Соответственно, больше не имеется каких-либо спектров с экстремально большой амплитудой в нормализованном спектре.

[0033] Отметим, что деление основного декодированного спектра на поддиапазоны является опциональным. Способ деления на поддиапазоны также является опциональным. Например, ширина полосы поддиапазонов может быть одинаковой или неодинаковой.

[0034] Блок 103 нормализации амплитуды выводит нормализованный спектр на первый блок 105 суммирования и блок 106 декодирования расширенного диапазона. Блок 104 генерации шума генерирует шумовой спектр. Шумовой спектр является спектром, в котором амплитуда флуктуирует нерегулярным образом. Конкретным примером является спектр, где положительное/отрицательное значение случайным образом назначается каждому частотному компоненту. Поскольку положительное/отрицательное значение является случайным, амплитуда может быть постоянным значением или может быть случайно генерируемой амплитудой в пределах диапазона.

[0035] Способ генерации шумового спектра может состоять в генерации, как это необходимо, основываясь на случайных числах, или конфигурации, в которой шумовой спектр, сгенерированный заранее, сохранен в устройстве хранения данных, таком как память или т.п., и может вызываться и выводиться. Множество шумовых спектров могут вызываться и суммироваться, четные компоненты и нечетные компоненты могут объединяться, и полярность может назначаться случайным образом при суммировании или объединении. Альтернативно, нулевой спектральный компонент в основном декодированном спектре может обнаруживаться, и шумовой спектр может генерироваться для его заполнения. Кроме того, шумовой спектр может генерироваться в соответствии с характеристиками основного декодированного спектра.

[0036] Отметим, что шумовой спектр не ограничен одним, и что он может быть выбран и выведен из множества шумовых спектров в соответствии с предварительно определенными условиями. Пример генерации множества шумовых спектров будет описан в третьем варианте осуществления.

[0037] Блок 104 генерации шума выводит шумовой спектр на первый блок 105 суммирования. Первый блок 105 суммирования суммирует нормализованный спектр и шумовой спектр и генерирует нормализованный спектр с добавленным шумом. Соответственно, шумовой спектр добавляется по меньшей мере к области нулевого компонента нормализованного спектра. Первый блок 105 суммирования затем выводит нормализованный спектр с добавленным шумом на блок 106 декодирования расширенного диапазона (второй блок декодирования).

[0038] В настоящем варианте осуществления, шумовой спектр добавлен к нормализованному спектру, который является спектром после нормализации в блоке 103 нормализации амплитуды, а не к основному декодированному спектру, который является входным спектром перед нормализацией в блоке 103 нормализации амплитуды. Причина заключается в следующем.

[0039] Амплитуда добавленного шумового спектра обычно меньше, чем амплитуда основного декодированного спектра, и основной декодированный спектр является разреженным, так что в случае выполнения нормализации для коротких поддиапазонов, которые содержат примерно 15 выборок и т.п., многие поддиапазоны будут нулевыми. Добавление шумового спектра к основному перед нормализацией в таком случае имеет следующую проблему.

[0040] Во-первых, шумовой спектр низкого уровня добавляется к полностью нулевому поддиапазону. Этот шумовой спектр сам, таким образом, получает большое значение и нормализуется как 1, так что если нет пика в поддиапазоне, полный шум усиливается. С другой стороны, в случае, когда имеется пик в поддиапазоне, спектр пика, который существует первоначально, является наибольшим значением, так что шумовой компонент остается на низком уровне при нормализации, или в действительности становится меньшим из-за нормализации. Соответственно, шумовые спектры с большой амплитудой локально добавляются к поддиапазонам, первоначально имеющим все нулевые компоненты. Напротив, настоящий вариант осуществления добавляет шумовой спектр после нормализации, поэтому можно предотвратить излишнее усиление шумового спектра из-за нормализации.

[0041] Блок 106 декодирования расширенного диапазона декодирует кодированные данные расширенного диапазона (вторые кодированные данные), используя нормализованный спектр с добавленным шумом и нормализованный спектр. Более конкретно, блок 106 декодирования расширенного диапазона декодирует кодированные данные расширенного диапазона и получает информацию запаздывания и усиление. Блок 106 декодирования расширенного диапазона идентифицирует диапазон нормализованного спектра с добавленным шумом, подлежащий копированию в расширенный диапазон, который является сегментом верхнего диапазона, на основе информации запаздывания и нормализованного спектра, и копирует предварительно определенный диапазон нормализованного спектра с добавленным шумом в расширенный диапазон. Блок 106 декодирования расширенного диапазона получает спектр расширенного диапазона с добавленным шумом путем умножения копированного нормализованного спектра с добавленным шумом на декодированное усиление.

[0042] Блок 106 декодирования расширенного диапазона затем выводит спектр расширенного диапазона с добавленным шумом на время-частотный преобразователь 107. Время-частотный преобразователь 107 связывает основной декодированный спектр, образующий сегмент нижнего диапазона, и спектр расширенного диапазона с добавленным шумом, образующий сегмент верхнего диапазона, тем самым генерируя декодированный спектр. Время-частотный преобразователь 107 затем преобразует декодированный спектр в сигналы временной области путем выполнения ортогонального преобразования декодированного спектра и выводит в качестве выходных сигналов. Выходные сигналы, выведенные из устройства 100 декодирования, проходят через DA (цифро-аналоговый) преобразователь, усилитель, динамик и т.д., которые опущены на чертеже, и выводятся как аудиосигналы, сигналы музыки или сигналы, в которых они существуют совместно.

[0043] Таким образом, в соответствии с настоящим вариантом осуществления, нормализованный спектр суммируется с нормализованным спектром, поэтому появление музыкального шума может быть подавлено даже в случае, когда нормализованный спектр является разреженным. Таким образом, настоящий вариант осуществления обеспечивает преимущества, состоящие в том, что преимущества гомогенизации и сглаживания, которые получают путем нормализации наибольшим значением спектра, могут сохраняться при компенсации недостатков, которые имеет этот метод нормализации.

[0044] Таким образом, шумовой спектр был добавлен к нормализованному спектру после нормализации в блоке 103 нормализации амплитуды в настоящем варианте осуществления, так что избыточное усиление шумового спектра путем нормализации можно предотвратить, тем самым обеспечивая преимущество, состоящее в том, что могут быть получены выходные сигналы с высоким качеством звука.

Второй вариант осуществления

[0045] Далее, конфигурация устройства 200 декодирования в соответствии с вторым вариантом осуществления настоящего раскрытия будет описана со ссылкой на фиг. 2. Блоки, имеющие ту же самую конфигурацию, что и на фиг. 1, обозначены теми же ссылочными позициями. Различие между устройством 200 декодирования в соответствии с настоящим вариантом осуществления и устройством 100 декодирования в первом варианте осуществления состоит в том, что устройство 200 декодирования имеет второй блок 201 суммирования. Другие компоненты в основном те же, что и в первом варианте осуществления, так что их описание будет опущено.

[0046] Второй блок 201 суммирования добавляет шумовой спектр, сгенерированный блоком 104 генерации шума, к основному декодированному спектру, выведенному из основного блока 102 декодирования, и генерирует основной декодированный спектр с добавленным шумом. Второй блок 201 суммирования затем выводит основной декодированный спектр с добавленным шумом на время-частотный преобразователь 107.

[0047] Время-частотный преобразователь 107 связывает основной декодированный спектр, образующий сегмент нижнего диапазона, и спектр расширенного диапазона с добавленным шумом, образующий сегмент верхнего диапазона, тем самым генерируя декодированный спектр. Время-частотный преобразователь 107 затем преобразует декодированный спектр в сигналы временной области путем выполнения ортогонального преобразования декодированного спектра и выводит в качестве выходных сигналов.

[0048] Таким образом, в соответствии с настоящим вариантом осуществления, шумовой спектр добавляется не только к нормализованному спектру, образующему сегмент верхнего диапазона, но также к основному декодированному спектру, образующему сегмент нижнего диапазона, так что музыкальный шум, возникающий из спектра нижнего диапазона, который важен для прослушивания, может быть подавлен. Разумеется, музыкальный шум может быть подавлен даже в случае генерации выходных сигналов с использованием одного только основного декодированного спектра.

Другой пример второго варианта осуществления

[0049] Далее, конфигурация устройства 210 декодирования в соответствии с другим примером второго варианта осуществления настоящего раскрытия будет описана со ссылкой на фиг. 3. Блоки, имеющие ту же самую конфигурацию, что и на фиг. 1 и 2, обозначены теми же ссылочными позициями. Устройство 210 декодирования в соответствии с настоящим вариантом осуществления отличается от устройства 200 декодирования во втором варианте осуществления тем, что оно не выводит шумовой спектр, который выводится на первый блок 105 суммирования, непосредственно из блока 104 генерации шума, а вместо этого генерирует шумовой спектр путем вычитания основного декодированного спектра из основного декодированного спектра с добавленным шумом в блоке 202 вычитания и выводит его. Другие компоненты, в основном, те же, что и во втором варианте осуществления, так что их описание будет опущено.

[0050] Блок 104 генерации шума детектирует нулевой спектральный компонент основного декодированного спектра и генерирует шумовой спектр для его заполнения. Второй блок 201 суммирования добавляет шумовой спектр, сгенерированный блоком 104 генерации шума, к основному декодированному спектру, выведенному из основного блока 102 декодирования, и генерирует основной декодированный спектр с добавленным шумом. Второй блок 201 суммирования затем выводит основной декодированный спектр с добавленным шумом на время-частотный преобразователь 107 и блок 202 вычитания.

[0051] Блок 202 вычитания вычитает основной декодированный спектр из декодированного спектра с добавленным шумом и принимает эту разность в качестве шумового спектра и выводит на первый блок 105 суммирования.

[0052] Причина выполнения такой обработки будет описана ниже. Обработка добавления шумового спектра к основному декодированному спектру может быть реализована путем обнаружения нулевого спектрального компонента основного декодированного спектра и добавления шумового спектра для его заполнения, как в случае настоящего варианта осуществления, помимо случая реализации путем добавления независимо генерируемого шумового спектра к основному декодированному спектру. В этом случае нормализованный спектр накладывается на основной декодированный спектр и сразу же становится интегральным с основным декодированным спектром, так что шумовой спектр, подлежащий выводу на первый блок 105 суммирования, требуется получить отдельным способом.

[0053] Соответственно, блок 202 вычитания обеспечен в настоящем варианте осуществления, и основной декодированный спектр вычитается из основного декодированного спектра с добавленным шумом, тем самым выделяя шумовой спектр. В этом случае блок 104 генерации шума, второй блок 201 суммирования и блок 202 вычитания вместе образуют блок генерации шума в соответствии с настоящим раскрытием.

[0054] Таким образом, в соответствии с настоящим вариантом осуществления, шумовой спектр не добавляется к спектрам иным, чем нулевой спектр спектров, образующих основной декодированный спектр, поэтому может быть выполнено более точное декодирование, и могут быть получены выходные сигналы с высоким качеством изображения.

Третий вариант осуществления

[0055] Далее, конфигурация устройства 300 декодирования в соответствии с третьим вариантом осуществления настоящего раскрытия будет описана со ссылкой на фиг. 4. Блоки, имеющие ту же самую конфигурацию, что и на фиг. 1 и 2, обозначены теми же ссылочными позициями. Различие между устройством декодирования 300 в соответствии с настоящим вариантом осуществления и устройством 200 декодирования в соответствии с вторым вариантом осуществления состоит в том, что устройство 300 декодирования имеет блок 301 генерации шума вместо блока 104 генерации шума. Другие компоненты в основном те же, что и в первом варианте осуществления, так что их описание будет опущено.

[0056] Блок 301 генерации шума способен генерировать множество различных шумовых спектров и может изменять выводимые шумовые спектры в соответствии с характеристиками основных декодированных спектров.

[0057] Фиг. 5 является блок-схемой последовательности операций, иллюстрирующей работу блока 301 генерации шума. Блок 301 генерации шума принимает информацию нормы диапазона от основного блока 102 декодирования (информацию о средней амплитуде диапазона), информацию о распределения битов и информацию о разреженности (S1). Информация о распределении битов является информацией, представляющей число битов, выделенных конкретному диапазону основного декодированного спектра. Например, в ITU-T Рекомендациях G.722.1 и G.719 закодирована информация нормы спектра (среднее значение амплитуды для каждого диапазона или соответствующая этому информация (коэффициент масштабирования, энергия диапазона и т.д.)), и распределение битов является базой принятия решения на основе этой информации нормы. Информация о разрежении является информацией, указывающей долю ненулевых спектров относительно всех спектров в конкретном диапазоне основного декодированного спектра (или, наоборот, может быть определена как доля нулевых спектров).

[0058] Далее, блок 301 генерации шума вычисляет первый коэффициент С1 корректировки амплитуды шума с использованием информации распределения битов (S2). C1 вычисляется с использованием, например, функции F(b) отсчета b выделенных битов. F(b) выводит фиксированное значение Nb, когда b=0; выводит 0, когда b>ns, и выводит значение между Nb и 0, когда 0≤b≤ns, причем, чем b ближе к ns, тем значение ближе к 0. Например, эта функция может иллюстрироваться следующим выражением (1):

где Nb является константой между 0 and 1.0 и является значением коэффициента корректировки амплитуды шума, используемым в случае, когда нет распределения битов; и ns является константой, которая представляет собой отсчет битов, необходимый для высококачественного квантования спектра.

[0059] Если число битов является тем же числом, что и этот отсчет битов или больше, квантование может выполняться на уровне, где ошибка квантования не проблематична, так что нет необходимости добавлять шум. C1 может вычисляться для каждого поддиапазона, где выполняется распределение битов, или несколько диапазонов могут быть сгруппированы, и вычисление может выполняться для всех сгруппированных диапазонов.

[0060] Кроме того, блок 301 генерации шума выводит второй коэффициент С2 корректировки амплитуды шума с использованием информации о разреженности (S3). C2 определяется, например, как в приведенном ниже выражении (2), как доля Sp нулевого спектра в общем числе спектров целевых диапазонов:

где Nz представляет число нулевых спектров, и Lb представляет общее число спектров целевых диапазонов.

[0061] Чем больше доля нулевых спектров, тем больше значение Sp, которое является переменной между 0 и 1.0. Следующее выражение (3) может быть использовано вместо выражения (2):

[0062] Наконец, блок 301 генерации шума использует первый и второй коэффициенты С1, С2 корректировки амплитуды шума для вычисления амплитуды LN шума на основе следующего выражения (4) (S4):

где |E(i)| является информацией нормы диапазона (информацией средней амплитуды диапазона) для i-го диапазона; и b и Sp представляют отсчет распределения битов и информацию пропусков по отношению к i-му диапазону.

[0063] Хотя C1 и C2 были использованы в настоящем варианте осуществления, LN может быть получено с использованием только одного из них.

[0064] Таким образом, в настоящем варианте осуществления, блок 301 генерации шума принимает решение об амплитуде шумового спектра, подлежащего генерации, на основе информации нормы диапазона, информации о распределении битов и информации о разреженности. Соответственно, шумовой спектр может адаптивно добавляться на основе грубости квантования, тем самым обеспечивая преимущество, состоящее в том, что можно избежать шумового ухудшения вследствие добавления большого уровня шума там, где было реализовано точное квантование.

[0065] Хотя в настоящем варианте осуществления был описан пример, где информация о распределении битов и информация о разреженности выводятся из основного блока 102 декодирования, это не накладывает ограничения. Например, может быть реализовано устройство, в котором основной декодированный спектр вводится в блок 301 генерации шума, блок 301 генерации шума анализирует основной декодированный спектр и сам получает информацию нормы диапазона, информацию о распределении битов и информацию о пропусках.

[0066] Отметим, что было описано устройство, где блок 104 генерации шума согласно второму варианту осуществления заменен на блок 301 генерации шума, но также блок 104 генерации шума согласно первому варианту осуществления может быть заменен на блок 301 генерации шума.

[0067] Хотя настоящий вариант осуществления описывает LN как вычисляемое и применяемое для каждого диапазона i, множество диапазонов могут группироваться и вычисляться и адаптироваться, или среднее значение LN, вычисленное для каждого i, может применяться как одинаковое LN для всех диапазонов.

Четвертый вариант осущ